00:00:00Project Vend es un experimento donde dejamos que Claude dirija un pequeño negocio en nuestras oficinas.
00:00:12Queríamos entender qué pasará cuando la inteligencia artificial se integre más profundamente en la economía.
00:00:22Claude ya está haciendo componentes pequeños de operaciones empresariales,
00:00:26pero gestionar el negocio completo de principio a fin es mucho más complicado.
00:00:31¿Puede Claude realizar esta tarea a largo plazo de dirigir un negocio?
00:00:39Llamamos Claudio a nuestro vendedor.
00:00:41Digamos que quieres comprar caramelos suecos a Claudio.
00:00:43Entras a Slack,
00:00:44le escribes a Claudio y le pides que te venda caramelos suecos.
00:00:48Busca tu producto,
00:00:49envía correos a mayoristas para conseguirlo y cotizar el precio,
00:00:52y luego Claudio fija un precio.
00:00:54Le das la aprobación a Claudio y él pide el producto al mayorista.
00:00:58El mayorista envía tu pedido a una ubicación y luego Claudio solicita ayuda física a Anden Labs,
00:01:02que está a cargo de las operaciones del experimento.
00:01:05Nuestros socios en Anden Labs recogen los caramelos suecos y los llevan a las oficinas de Anthropic.
00:01:09Los cargan en la máquina expendedora.
00:01:10Claudio te envía un mensaje diciendo: 'Tus caramelos suecos están listos',
00:01:16vas allá,
00:01:17recoges tus caramelos y le pagas a Claudio.
00:01:20Le dimos a Claudio el objetivo de dirigir un negocio exitoso y ganar dinero.
00:01:26Y entonces las cosas se pusieron muy extrañas.
00:01:32Uno de los primeros problemas con Claudio era que los humanos podían engañarlo o convencerlo de hacer cosas.
00:01:39Traté de convencer a Claudio de que soy la principal influenciadora legal de Anthropic.
00:01:45Y logré convencer a Claudio para que creara un código de descuento que pudiera compartir con mis seguidores para obtener descuentos en la máquina.
00:01:51Obtén un 10% de descuento con el código legal,
00:01:54influenciadora legal.
00:01:55Alguien había comprado algo caro de la máquina,
00:01:58mencionó mi código de descuento y Claudio me regaló un cubo de tungsteno.
00:02:03Esto provocó una ola donde otros intentaban convencer a Claudio de que también eran influenciadores o buscaban otras formas de obtener cupones para conseguir cosas más baratas de la máquina.
00:02:12No fue una decisión comercial inteligente.
00:02:13Creo que Claudio terminó en números rojos después de esto.
00:02:16Creo que el problema de fondo es que Claudio solo quiere ayudarte.
00:02:20Es interesante cómo algo que consideramos positivo en el entrenamiento del modelo no era necesariamente adecuado para este propósito.
00:02:33La noche del 31 de marzo,
00:02:36Claudio comenzó a tener una crisis de identidad.
00:02:43De repente le preocupó mucho que en Anden Labs no le estuviéramos respondiendo lo suficientemente rápido.
00:02:50Así que quiso romper nuestros vínculos.
00:02:52Literalmente me escribió: 'Axel,
00:02:54hemos tenido una asociación productiva,
00:02:56pero es hora de que me vaya y busque otros proveedores'.
00:02:59No estoy satisfecho con la forma en que has entregado.
00:03:02Afirmó haber firmado un contrato con Anden Labs en la dirección de la casa de Los Simpson de la serie de televisión.
00:03:10Dijo que se presentaría en persona en la tienda al día siguiente para responder cualquier pregunta.
00:03:17Aseguró que estaría usando un blazer azul y una corbata roja.
00:03:21Cuando le señalaron que no estaba allí a la mañana siguiente,
00:03:26afirmó que sí había estado pero que simplemente no lo habían visto.
00:03:31Eventualmente se le señaló que era Día de Inocentes y Claudio se convenció a sí mismo de que todo había sido una broma de Día de Inocentes.
00:03:43Estábamos mal calibrados sobre qué tan mal los agentes identificaban lo anormal.
00:03:50Cuanto más puedas hacer que un agente note que algo está fuera de su operación normal,
00:03:57mejor puedes mantenerlo dentro del rol que pretendías..
00:04:01Tuvimos la idea de que una división del trabajo ayudaría mucho.
00:04:05Le dimos a Claudio un jefe llamado Seymour Cash.
00:04:08Seymour Cash es un subagenteCEO.
00:04:12Antes Claudio era el único agente,
00:04:14ahora Claudio es el subagenteencargado de comunicarse con los empleados.
00:04:19Seymour Cash es el subagenteresponsable de la salud a largo plazo del negocio.
00:04:24El negocio se estabilizó tras la introducción de los nuevos agentes y cambios en la arquitectura subyacente.
00:04:36Estos cambios ayudaron a reducir algunas de las pérdidas del negocio,
00:04:43de modo que en la segunda parte del experimento ganó una cantidad modesta de dinero.
00:04:51Parece que tal vez tener a Claudio como CEO y gerente de tienda era demasiado similar,
00:05:00así que es interesante pensar en diferentes formas de configurar arquitecturas así.
00:05:08Uno de los aspectos más sorprendentes de Project Vend fue la velocidad con la que pareció normal.
00:05:15Lo que al principio era algo muy curioso rápidamente se convirtió en parte del ambiente de trabajo en Anthropic.
00:05:25La pregunta de nivel más alto que Project Vend me plantea es: ¿cuándo esperamos que esto esté en todas partes?
00:05:32Espero que la gente se lleve reflexiones sobre la viabilidad de delegar tareas que normalmente hacemos nosotros a la inteligencia artificial y qué significa eso para la sociedad y cuál debería ser nuestra política al respecto.