Claude acaba de subir de nivel en el juego de los agentes

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00¿Fue Opus 4.6 la única actualización de Anthropic?
00:00:03Ya conocen los subagentes, donde cada agente opera como una entidad individual con
00:00:07su propia ventana de contexto.
00:00:09Pero estos subagentes fallaban cuando había una tarea que requería coordinación entre ellos.
00:00:13En esos casos, el orquestador tenía que intervenir, tomando respuestas de un agente y delegándolas
00:00:17a otro, o los agentes debían depender de notas en la carpeta del proyecto.
00:00:21Debido a esta brecha de comunicación, tareas sencillas se volvían demasiado complicadas.
00:00:25Para solucionar esto, Anthropic lanzó una nueva mejora para los subagentes llamada "Agent-Teams".
00:00:30Se lanzaron junto con Opus 4.6.
00:00:33Aunque todavía es una función experimental, la hemos implementado en múltiples flujos de trabajo,
00:00:37y la mayor mejora fue que el tiempo que tomaban estas tareas se redujo drásticamente.
00:00:41Pero es experimental por una razón y aún tiene asperezas; también encontramos pequeñas
00:00:44soluciones para esos problemas.
00:00:47Agent-Teams es la idea de tener múltiples instancias de ClaudCode trabajando juntas.
00:00:51Cada miembro del equipo trabaja en tareas aisladas y tiene una gestión centralizada controlada
00:00:55por un solo agente.
00:00:56Ahora, podrías pensar que esto suena muy similar a los subagentes de Claud ya existentes porque
00:01:00ambos se ejecutan en paralelo y dividen las tareas, pero no son lo mismo.
00:01:03Esto se debe a que Agent-Teams resolvió el principal problema del marco de subagentes.
00:01:08Los subagentes no pueden comunicarse entre sí y dependen del agente orquestador
00:01:12para que actúe como medio de comunicación.
00:01:15Los miembros del equipo, en cambio, sí pueden comunicarse entre ellos.
00:01:18La idea central de Agent-Teams es tener múltiples sesiones de ClaudCode colaborando.
00:01:22Una sesión actúa como líder del equipo, coordinando el trabajo, asignando tareas y sintetizando resultados,
00:01:27mientras los compañeros trabajan de forma independiente en sus propias ventanas de contexto.
00:01:31Los subagentes tienen su ventana de contexto y reportan el resultado a quien los llamó.
00:01:34Pero en los equipos, funciona de manera diferente.
00:01:36Cada miembro del equipo de agentes es una sesión de terminal totalmente independiente.
00:01:40No están restringidos ni coordinados por un orquestador que solo divide tareas.
00:01:43En su lugar, estas sesiones de terminal son abiertas y cerradas por el líder principal del equipo.
00:01:47Son capaces de trabajar en tareas que requieren discusión y colaboración entre agentes
00:01:52gracias a su capacidad de comunicación.
00:01:54Así, un equipo de agentes consiste esencialmente en un líder de equipo y sus compañeros.
00:01:57El líder es el agente principal que crea el equipo y coordina su trabajo.
00:02:01Los compañeros son los trabajadores que realmente ejecutan las tareas.
00:02:03Cada compañero recibe una lista de tareas, que es una lista compartida de elementos.
00:02:07Cada miembro identifica lo que debe hacer de esa lista y lo ejecuta.
00:02:10Para comunicarse, también tienen un buzón compartido que les permite enviarse mensajes entre sí.
00:02:15Ahora, la pregunta era cómo funciona esto realmente si cada miembro del equipo es independiente.
00:02:19¿Cómo saben lo que están haciendo los otros miembros?
00:02:21Esto funciona porque toda la información sobre el equipo, los miembros y las tareas de cada uno
00:02:26se almacena localmente en la carpeta ".claud" y se identifica por el nombre de la tarea.
00:02:30Esta función aún es experimental y está desactivada por defecto, por lo que habrá algunos errores
00:02:34en el manejo de los compañeros durante esta fase.
00:02:36Para poder probarla, tuvimos que habilitarla manualmente.
00:02:38Lo hicimos configurando el flag de la CLI de Claud Code para equipos de agentes experimentales a 1.
00:02:43Con este flag activado, los equipos de agentes quedaron disponibles para futuras sesiones.
00:02:47Con esta opción habilitada, pudimos acceder a la función de equipos en Claud Code.
00:02:51Al ser una función experimental, necesitamos usar una redacción específica que le indique
00:02:55a Claud que queremos usar el equipo de agentes para un trabajo determinado.
00:02:58Nuestro equipo ha comenzado a usar esta función para paralelizar la revisión de código, permitiendo
00:03:02que los problemas se identifiquen y se solucionen al mismo tiempo.
00:03:04Para ello, le pedimos a Claud que usara a un miembro para encontrar errores en el código
00:03:08y a otro para corregir los problemas identificados por el primero.
00:03:11Tuvimos que ser detallados en el prompt para que siguiera la dirección correcta.
00:03:15Si los subagentes estuvieran manejando esto, estarían escribiendo un informe en algún archivo físico
00:03:19para que los otros agentes supieran qué corregir.
00:03:21Pero aquí queríamos acelerar el proceso de revisión permitiendo que esto ocurriera sin la carga
00:03:26de tener que escribir en un archivo local.
00:03:27Cuando enviamos el prompt a Claud Code, se generaron los miembros del equipo, cada uno controlado
00:03:31por el líder.
00:03:32El agente líder entregó el prompt a los agentes individuales, indicándoles qué tarea realizar.
00:03:36Entonces, el primer agente revisor comenzó a trabajar y, tras analizar la tarea, compartió mensajes
00:03:40con el agente corrector, error por error.
00:03:42Este agente priorizaba problemas de seguridad críticos y, en cuanto el corrector recibía
00:03:47los mensajes del revisor, comenzaba a implementar las soluciones mientras el revisor
00:03:51seguía buscando más problemas.
00:03:53Del mismo modo, continuaron comunicándose y reportando los cambios implementados.
00:03:57Una vez resueltos los problemas críticos, los dos agentes pasaron a corregir
00:04:01los problemas de prioridad media.
00:04:02La revisión y la corrección ocurrían simultáneamente, lo que ahorró mucho tiempo.
00:04:06Lo bueno de esto es que también puedes asignar o modificar cualquier tarea de un miembro.
00:04:10Con esto habilitado, puedes dirigir el rumbo del trabajo de ese miembro del equipo en específico.
00:04:14Cuando terminaron, el control volvió al agente principal, que se encarga de asegurar
00:04:18que los cambios se implementen correctamente y de cerrar a estos agentes
00:04:22de forma controlada, garantizando que su salida no cause errores posteriores.
00:04:26Probablemente habrán notado que construimos mucho en estos videos.
00:04:28Todos los prompts, el código, las plantillas... todo eso que normalmente tendrías que
00:04:32pausar y copiar de la pantalla está en nuestra comunidad; en este video y en todos
00:04:36los anteriores también.
00:04:37Enlaces en la descripción.
00:04:38Encontrar y corregir errores a escala es genial, pero a veces surgen problemas
00:04:43y simplemente no puedes identificar qué los está causando.
00:04:45En esos casos, podemos usar un equipo de agentes para probar múltiples perspectivas de la app
00:04:49y avanzar progresivamente hacia el error.
00:04:51Así, los miembros pueden comunicarse sus hallazgos y avanzar juntos.
00:04:55Le pedimos a Claud que buscara un error en el código y especificamos el uso de varios miembros,
00:04:59permitiéndoles abordar el problema desde diferentes ángulos.
00:05:02Luego generó cuatro subagentes, cada uno enfocado en una perspectiva distinta de la aplicación.
00:05:06Recibieron prompts similares del líder e investigaron los errores basándose en
00:05:09su aspecto específico de la app, mientras el líder esperaba a que terminaran
00:05:14para luego analizar los hallazgos de sus investigaciones.
00:05:16Sin equipos, habríamos tenido un solo hilo, lo cual habría tomado mucho más tiempo.
00:05:19Pero con estos agentes, el proceso fue mucho más rápido.
00:05:22La investigación se completó rápido y todo el trabajo de los agentes se hizo en aproximadamente
00:05:272 o 3 minutos, lo cual es una mejora significativa frente a la revisión lineal,
00:05:31que fácilmente habría tomado de 5 a 10 minutos.
00:05:33Algo a tener en cuenta es que este enfoque consume muchos tokens, ya que cada agente
00:05:37tiene su propia ventana de contexto, así que hay que tener cuidado con eso.
00:05:40Una vez que los agentes entregaron su resultado y se cerraron, el líder también verificó
00:05:45los resultados haciendo su propia comprobación.
00:05:46Los cuatro agentes coincidieron en el mismo error y señalaron correctamente el problema
00:05:50con un "stale closure" en el useEffect.
00:05:52Esa parte exacta fue señalada por los cuatro agentes.
00:05:54Además, si disfrutan nuestro contenido, consideren pulsar el botón de "hype", porque nos ayuda
00:05:59a crear más contenido como este y llegar a más personas.
00:06:02Este marco de agentes ha cambiado nuestra forma de trabajar en tareas de largo aliento, porque
00:06:07los agentes ya no tienen que limitarse únicamente a documentar su progreso.
00:06:10Con los equipos de agentes, podemos manejar diferentes aspectos de una aplicación en paralelo
00:06:14y también tener a un miembro dedicado exclusivamente a la investigación.
00:06:16Cuando le dimos el prompt a Claud, generó 6 agentes.
00:06:19Dos trabajaban en la investigación y en sentar las bases, mientras que el resto se encargaba
00:06:23de construir las páginas.
00:06:24Los agentes constructores estaban bloqueados por el agente que sentaba las bases, ya que este era
00:06:28responsable de instalar los paquetes necesarios y preparar el entorno con las dependencias.
00:06:32Cada agente recibió un prompt específico definiendo su trabajo.
00:06:35Los agentes bloqueados esperaron la señal de desbloqueo del líder del equipo.
00:06:38Una vez terminadas la investigación y las bases, los demás agentes se desbloquearon y empezaron
00:06:43a implementar sus partes respectivas de la aplicación de forma paralela.
00:06:46Se mantuvieron comunicados entre sí para asegurar la consistencia entre cada componente.
00:06:49El líder coordinó a los agentes y, a medida que cada uno terminaba, el líder
00:06:53le enviaba un mensaje de apagado, gestionando su salida sin problemas.
00:06:57Todo el proceso consumió unos 170k tokens de la ventana de contexto, pero al final,
00:07:02obtuvimos la aplicación construida exactamente como queríamos, todo con un solo prompt.
00:07:05Como mencionamos, mientras nuestro equipo probaba esto, encontramos múltiples
00:07:09formas de hacer que los equipos de agentes funcionaran mejor, y esas mejores prácticas
00:07:13están disponibles en AI Labs Pro para que puedan probarlas ustedes mismos.
00:07:16La primera recomendación es aplicable a todos los agentes en general, no solo a la
00:07:20función de equipos de agentes.
00:07:21Es necesario especificar explícitamente el alcance en el que debe trabajar el agente.
00:07:25Pueden hacerlo definiéndolo en el prompt, indicando qué archivos buscar
00:07:29para realizar la tarea, o creando documentos en el proyecto que contengan tareas
00:07:33individuales, como hicimos en nuestro flujo, donde preparamos un documento de tarea para cada encargo
00:07:38para que el agente pudiera trabajar de forma independiente y dentro del alcance correcto.
00:07:41Otra cosa a tener en cuenta es que cada agente debe trabajar en tareas independientes
00:07:45entre sí, porque si editan el mismo archivo al mismo tiempo,
00:07:49se crearía un conflicto y se podría sobrescribir el contenido.
00:07:52Aparte de esto, a veces notamos que el agente principal se impacientaba
00:07:56si algún agente tardaba mucho en completar una tarea y empezaba a realizarla él mismo
00:08:00en lugar de dejar que sus compañeros terminaran, así que es importante recordarle
00:08:04que espere a que los compañeros completen su parte antes de proceder.
00:08:06También es necesario dimensionar las tareas adecuadamente.
00:08:08Si asignas tareas demasiado pequeñas, se crea una carga excesiva de coordinación.
00:08:11Si son demasiado grandes, aumenta el riesgo de esfuerzo desperdiciado; por eso las tareas
00:08:16deben estar equilibradas y ser autónomas.
00:08:17Finalmente, es necesario supervisar el trabajo de los agentes.
00:08:19Si un agente no se desempeña como se espera, puedes detener su ejecución y darle nuevas
00:08:23instrucciones sobre lo que debería estar haciendo.
00:08:25Seguir estas prácticas hace que el uso de esta función experimental sea mucho más efectivo.
00:08:29Con esto llegamos al final del video.
00:08:31Si quieres apoyar al canal y ayudarnos a seguir haciendo videos como este, puedes hacerlo
00:08:35usando el botón de "Súper gracias" que aparece abajo.
00:08:38Como siempre, gracias por vernos y nos vemos en el próximo.

Key Takeaway

La nueva función experimental de Agent-Teams en Claude Code permite una colaboración multidireccional entre agentes de IA, optimizando flujos de trabajo complejos mediante la paralelización y la comunicación directa.

Highlights

Anthropic introduce "Agent-Teams

Timeline

Introducción y limitación de los subagentes

El video comienza cuestionando si Opus 4.6 fue la única actualización relevante de Anthropic. Se explica que los subagentes anteriores operaban de forma aislada, lo que generaba fallos cuando las tareas requerían una coordinación estrecha. En el modelo antiguo, el orquestador debía intervenir constantemente para mover información entre agentes, complicando procesos simples. Para resolver esta brecha de comunicación, se presenta la mejora denominada "Agent-Teams". Esta función experimental busca reducir drásticamente el tiempo de ejecución en flujos de trabajo complejos.

Diferencias estructurales de Agent-Teams

Se define Agent-Teams como el uso de múltiples sesiones de Claude Code trabajando en conjunto bajo una gestión centralizada. A diferencia de los subagentes que dependen de un orquestador para comunicarse, los miembros del equipo pueden hablar entre ellos directamente. El líder del equipo asigna tareas y sintetiza resultados mientras los compañeros operan en sus propias terminales independientes. Esta estructura permite discusiones y colaboraciones que antes eran imposibles en ventanas de contexto cerradas. El cambio fundamental es pasar de una división de tareas rígida a un entorno de trabajo abierto y colaborativo.

Mecanismo técnico y activación experimental

El funcionamiento técnico se basa en una lista de tareas compartida y un buzón de mensajes para la comunicación interna. Toda la información del equipo y el progreso de las tareas se almacena localmente en la carpeta ".claud" del proyecto. Debido a su naturaleza experimental, la función viene desactivada por defecto y requiere configurar un flag de la CLI a valor 1. Los usuarios deben emplear una redacción específica en sus prompts para invocar correctamente al equipo de agentes. Esta fase de prueba implica que todavía pueden existir errores en el manejo de los compañeros de equipo.

Casos de uso: Revisión de código y depuración

Se presentan ejemplos prácticos donde un agente encuentra errores mientras otro los corrige en tiempo real sin esperar informes físicos. En tareas de depuración, el líder puede desplegar varios agentes para analizar una aplicación desde perspectivas distintas simultáneamente. Mientras que una revisión lineal podría tardar 10 minutos, este enfoque paralelo reduce el tiempo a solo 2 o 3 minutos. Los cuatro agentes del ejemplo lograron identificar con precisión un error de "stale closure" en un useEffect de React. Se advierte que este proceso consume muchos tokens, llegando a usar 170k en tareas extensas.

Desarrollo de aplicaciones y mejores prácticas

En el último tramo, se muestra cómo seis agentes pueden construir una aplicación completa dividiendo investigación, infraestructura y desarrollo de páginas. Es vital especificar el alcance de cada agente mediante documentos de tareas individuales para asegurar su autonomía. Se recomienda evitar que los agentes editen el mismo archivo al mismo tiempo para prevenir conflictos de sobrescritura. También se menciona que el líder puede impacientarse, por lo que hay que instruirle para que espere los resultados de sus compañeros. El video concluye enfatizando la importancia de la supervisión humana para detener o redirigir agentes que no cumplan las expectativas.

Community Posts

View all posts