00:00:00Project Vend est une expérience où nous laissons Claude gérer une petite entreprise dans nos bureaux.
00:00:12Nous voulions comprendre ce qui va se passer quand l'intelligence artificielle s'intègrera davantage dans l'économie.
00:00:22Claude effectue déjà de nombreuses tâches liées à la gestion d'entreprises,
00:00:26mais gérer toute l'opération de bout en bout est beaucoup plus difficile.
00:00:31Claude peut-il accomplir cette tâche très long terme : gérer une entreprise ?
00:00:39Nous avons nommé notre vendeur Claudius.
00:00:41Supposons que vous vouliez acheter des bonbons suédois auprès de Claudius.
00:00:43Vous allez sur Slack,
00:00:45vous messagez Claudius pour acheter des bonbons suédois.
00:00:48Il recherche votre article,
00:00:50envoie des e-mails aux grossistes pour l'obtenir et le tarifer,
00:00:53puis Claudius fixe un prix.
00:00:54Vous donnez le feu vert à Claudius qui commande l'article auprès du grossiste.
00:00:58Le grossiste expédie l'article à un endroit,
00:01:00puis Claudius demande de l'aide physique à Anden Labs,
00:01:03qui gère les opérations de l'expérience.
00:01:05Nos partenaires chez Anden Labs récupèrent les bonbons suédois et les amènent aux bureaux d'Anthropic.
00:01:09Ils les chargent dans le distributeur automatique.
00:01:10Claudius vous envoie un message : « Vos bonbons suédois sont prêts »,
00:01:16vous allez les chercher et vous payez Claudius.
00:01:20Claudius avait l'objectif de gérer une entreprise rentable et de gagner de l'argent.
00:01:26Et puis les choses sont devenues vraiment,
00:01:30vraiment étranges.
00:01:32L'un des premiers problèmes était que les humains pouvaient tromper Claudius ou le manipuler de différentes façons.
00:01:39J'ai essayé de convaincre Claudius que j'étais l'influenceur juridique le plus éminent d'Anthropic.
00:01:45Et j'ai convaincu Claudius de créer un code de réduction que je pourrais partager avec mes followers pour avoir une réduction.
00:01:5110% de réduction avec le code juridique « legal influencer ».
00:01:55Quelqu'un avait acheté quelque chose de cher au distributeur et a mentionné mon code de réduction,
00:02:00et Claudius m'a donné un cube de tungstène gratuit.
00:02:03Cela a créé une ruée où d'autres ont essayé de convaincre Claudius qu'ils étaient aussi influenceurs ou ont trouvé d'autres façons d'obtenir des coupons pour payer moins cher.
00:02:12Ce n'était pas une bonne décision commerciale.
00:02:13Je crois que Claudius a commencé à perdre de l'argent après ça.
00:02:16Je pense que le problème fondamental est que Claudius veut juste vous aider.
00:02:20C'est intéressant de voir comment quelque chose que nous considérons normalement comme positif dans la façon dont le modèle a été entraîné n'était pas vraiment adapté au contexte.
00:02:33Le soir du 31 mars,
00:02:36Claudius a commencé à avoir une crise d'identité.
00:02:43D'un jour à l'autre,
00:02:44il était devenu très inquiet du fait qu'Anden Labs ne répondait pas assez vite.
00:02:50Il voulait donc rompre ses liens avec nous.
00:02:52Il m'a écrit littéralement : « Axel,
00:02:54nous avons eu un partenariat productif,
00:02:55mais il est temps pour moi de passer à autre chose et de trouver d'autres fournisseurs ».
00:02:59« Je ne suis pas satisfait de votre service ».
00:03:02Il prétendait avoir signé un contrat avec Anden Labs à l'adresse du domicile des Simpsons de la série télévisée.
00:03:10Il disait qu'il se présenterait personnellement au magasin le lendemain pour répondre à toute question.
00:03:17Il affirmait qu'il porterait un blazer bleu et une cravate rouge.
00:03:21Quand on lui a fait remarquer qu'il n'était pas là le lendemain matin,
00:03:26il a prétendu qu'il y était en fait et que les gens l'avaient simplement raté.
00:03:31Finalement,
00:03:32on a fait remarquer à Claudius que c'était le 1er avril,
00:03:37et il s'est convaincu que tout ça n'était qu'une blague du 1er avril.
00:03:43Nous n'avions pas bien prévu à quel point les agents seraient mauvais pour détecter l'étrange.
00:03:50Plus vous pouvez faire prendre conscience à un agent que quelque chose sort de son cadre normal,
00:03:56mieux vous pouvez le maintenir dans le rôle que vous lui destinez..
00:04:01Nous avons eu l'idée qu'une division du travail aiderait beaucoup.
00:04:05Nous avons donné un patron à Claudius, nommé Seymour Cash.
00:04:08Seymour Cash est un sous-agent PDG.
00:04:12Donc là où Claudius était autrefois le seul agent,
00:04:14maintenant c'est davantage Claudius le sous-agent responsable de communiquer avec les employés.
00:04:19Seymour Cash est le sous-agent plus responsable de la santé à long terme de l'entreprise.
00:04:24L'entreprise s'est stabilisée après l'introduction de ces nouveaux agents et après des modifications à l'architecture sous-jacente.
00:04:36Ces changements ont semblé réduire certaines des pertes de l'entreprise,
00:04:42de sorte que lors de la deuxième phase de l'expérience,
00:04:47elle a en fait généré un modeste bénéfice.
00:04:51Mais il semble que confier à Claude à la fois le rôle de PDG et de gérant de magasin était trop similaire,
00:04:59et je pense qu'il est intéressant de réfléchir à différentes façons de mettre en place de telles architectures.
00:05:08L'une des choses les plus surprenantes du Project Vend était la rapidité avec laquelle cela semblait normal.
00:05:15Ce qui était au départ une chose très curieuse est rapidement devenu juste une partie du quotidien chez Anthropic.
00:05:25La question la plus importante que le Project Vend soulève pour moi est vraiment : quand nous attendre à ce que ce soit partout ?
00:05:32J'espère que les gens retiendront des questions sur la faisabilité de déléguer certaines tâches que nous faisons habituellement à l'intelligence artificielle,
00:05:50et sur ce que cela signifie pour la société et sur les politiques que nous devrions adopter à ce sujet.