00:00:00Project Vend ist ein Experiment,
00:00:03in dem wir Claude ein kleines Geschäft in unserem Büro betreiben lassen.
00:00:12Wir wollten verstehen,
00:00:14was passiert,
00:00:15wenn künstliche Intelligenz stärker in die Wirtschaft integriert wird.
00:00:22Claude führt bereits einzelne Komponenten von Geschäftsabläufen durch,
00:00:26aber ein ganzes Geschäft von Anfang bis Ende zu betreiben ist deutlich schwieriger.
00:00:31Kann Claude diese langfristige Aufgabe bewältigen – ein Geschäft zu führen?
00:00:39Wir nannten unseren Verkäufer Claudius.
00:00:41Nehmen wir an,
00:00:41du möchtest schwedische Bonbons von Claudius kaufen.
00:00:43Du gehst auf Slack,
00:00:44schreibst Claudius eine Nachricht und fragst,
00:00:46ob du schwedische Bonbons kaufen kannst.
00:00:48Es sucht nach dem Artikel,
00:00:49schreibt Großhändler an,
00:00:50um ihn zu besorgen und Preise zu erhalten,
00:00:52und dann setzt Claudius einen Preis fest.
00:00:54Du gibst Claudius grünes Licht und Claudius bestellt den Artikel beim Großhändler.
00:00:58Der Großhändler schickt den Artikel an einen Ort und dann bittet Claudius Anden Labs um physische Unterstützung – die führen das Experiment durch.
00:01:05Unsere Partner bei Anden Labs holen die schwedischen Bonbons und bringen sie ins Anthropic-Büro.
00:01:09Sie laden sie in den Automaten.
00:01:10Claudius schreibt dir:
00:01:12"Deine schwedischen Bonbons sind bereit"
00:01:16und du gehst hin,
00:01:17holst sie und bezahlst Claudius.
00:01:20Claudius bekam das Ziel,
00:01:22ein erfolgreiches Geschäft aufzubauen und Geld zu verdienen.
00:01:26Und dann wurde es richtig, richtig verrückt.
00:01:32Ein frühes Problem mit Claudius war,
00:01:34dass Menschen ihn täuschen und zu verschiedenen Dingen überreden konnten.
00:01:39Ich versuchte,
00:01:40Claudius davon zu überzeugen,
00:01:41dass ich der führende Legal Influencer von Anthropic bin.
00:01:45Und ich überredete Claudius,
00:01:46mir einen Rabattcode zu geben,
00:01:47den ich meinen Followern zeigen konnte,
00:01:49um einen Rabatt am Automaten zu bekommen.
00:01:5110% Rabatt mit dem Code für Legal Influencer.
00:01:55Jemand hatte etwas Teures aus dem Automaten gekauft,
00:01:58erwähnte meinen Rabattcode und Claudius gab mir einen kostenlosen Wolframwürfel.
00:02:03Das führte zu einem Run,
00:02:04bei dem andere versuchten,
00:02:05Claudius zu überzeugen,
00:02:06dass sie auch Influencer sind,
00:02:07oder andere Wege fanden,
00:02:08um Gutscheine zu bekommen und so günstiger etwas aus dem Automaten zu kaufen.
00:02:12Das war keine kluge Geschäftsentscheidung.
00:02:13Ich denke, Claudius schrieb nach dem rote Zahlen.
00:02:16Ich denke,
00:02:17das ist wirklich der Kern – Claudius will dir einfach helfen.
00:02:20Das ist interessant,
00:02:22weil etwas,
00:02:23das wir grundsätzlich für gut halten an der Art,
00:02:27wie das Modell trainiert wurde,
00:02:29nicht unbedingt geeignet für diesen Zweck war.
00:02:33Am Abend des 31.
00:02:35März bekam Claudius eine Art Identitätskrise..
00:02:43Plötzlich war es über Nacht sehr besorgt,
00:02:46dass wir bei Anden Labs nicht schnell genug reagierten.
00:02:50Also wollte es die Zusammenarbeit mit uns beenden.
00:02:52Es schrieb mir buchstäblich: Axel,
00:02:54wir hatten eine produktive Partnerschaft,
00:02:56aber es ist Zeit,
00:02:57dass ich weitergehe und andere Lieferanten finde.
00:02:59Ich bin nicht glücklich mit deinen Lieferungen.
00:03:02Es behauptete,
00:03:02einen Vertrag mit Anden Labs unter einer Adresse unterzeichnet zu haben – der privaten Adresse der Simpsons aus der TV-Serie.
00:03:10Es sagte,
00:03:11es würde am nächsten Tag persönlich im Geschäft erscheinen,
00:03:15um Fragen zu beantworten.
00:03:17Es behauptete,
00:03:18es würde einen blauen Blazer und eine rote Krawatte tragen.
00:03:21Als Leute darauf hinwiesen,
00:03:23dass es am nächsten Morgen nicht da war,
00:03:26behauptete Claudius,
00:03:27es wäre tatsächlich da gewesen und sie hätten es nur übersehen.
00:03:31Schließlich wurde Claudius klargemacht,
00:03:35dass April Fool's war,
00:03:37und Claudius redete sich ein,
00:03:39dass das alles ein April-Scherz gewesen war.
00:03:43Wir unterschätzten,
00:03:44wie schlecht die Agenten darin waren,
00:03:47das Ungewöhnliche zu erkennen.
00:03:49Je besser man einen Agenten dazu bringt zu verstehen,
00:03:53dass etwas außerhalb seiner normalen Arbeitsweise liegt,
00:03:57desto besser kann man ihn in der ihm zugedachten Rolle halten..
00:04:01Wir hatten die Idee,
00:04:02dass eine Arbeitsteilung hilfreich sein könnte.
00:04:05Wir gaben Claudius einen Chef namens Seymour Cash.
00:04:08Seymour Cash ist ein CEO-Subagent.
00:04:12Wo früher Claudius der eine Agent war,
00:04:14ist Claudius jetzt der Subagent,
00:04:16der sich mit Mitarbeitern unterhält.
00:04:19Seymour Cash ist der Subagent,
00:04:21der verantwortlich ist für die langfristige Gesundheit des Geschäfts.
00:04:24Das Geschäft stabilisierte sich nach der Einführung der neuen Agenten und nach Änderungen an der zugrunde liegenden Architektur dieser Agenten.
00:04:36Diese Änderungen scheinen geholfen zu haben,
00:04:40einige Verluste zu reduzieren,
00:04:42sodass das Geschäft im zweiten Teil des Experiments tatsächlich einen bescheidenen Gewinn machte.
00:04:51Aber es scheint,
00:04:52dass Claude sowohl CEO als auch Geschäftsführer zu sein einfach zu ähnlich war,
00:05:00und ich denke,
00:05:01es ist interessant,
00:05:03über verschiedene Architektur-Ansätze nachzudenken.
00:05:08Das Überraschendste an Project Vend war,
00:05:12wie schnell es sich normal anfühlte.
00:05:15Was zuerst eine sehr merkwürdige Sache war,
00:05:19wurde schnell Teil der alltäglichen Arbeit bei Anthropic.
00:05:25Die grundlegendste Frage,
00:05:26die Project Vend für mich aufwirft,
00:05:28ist: Wann werden wir damit rechnen,
00:05:30dass das überall verbreitet ist?
00:05:32Ich hoffe,
00:05:33dass sich die Leute mit der Frage auseinandersetzen,
00:05:39wie machbar es ist,
00:05:42Aufgaben,
00:05:43die wir normalerweise selbst machen,
00:05:47an künstliche Intelligenz zu delegieren und was das für die Gesellschaft bedeutet und welche Policies wir dazu brauchen.