Claude Code's HIDDEN Agent Swarm (Better Than Kimi K2.5?)

BBetter Stack
Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00La gente se está volviendo loca con Kimi 2.5. Es un modelo de código abierto con mejores benchmarks
00:00:05que Opus y un modo “Agent Swarm” increíblemente ingenioso donde un orquestador puede generar hasta 100
00:00:11agentes especializados para una tarea compleja. ¿Pero sabías que esta función también existe en el código de Claude
00:00:17tras una función oculta y fue descubierta por un usuario en Twitter? ¿Cómo lo descubrieron? ¿Y acaso
00:00:23Anthropic simplemente le robó la idea a Kimi? Suscríbete y vamos a analizarlo. Anthropic anunció
00:00:30subagentes personalizados en julio del año pasado y, desde entonces, la gente los ha usado para todo tipo de
00:00:35tareas especializadas. De hecho, hicimos un video sobre eso en aquel entonces. Pero los subagentes
00:00:41solo tienen un fragmento del contexto general, ya que están diseñados para una tarea específica. Hacen esa
00:00:48tarea, devuelven los datos y reinician su memoria. Así que la gente implementó la memoria
00:00:54haciendo que los subagentes exporten sus hallazgos a un archivo markdown y actualicen un archivo
00:01:01de contexto principal. Así, si se le pedía una actualización al mismo o a otro subagente, podían leer esos
00:01:06archivos y ver dónde lo habían dejado los demás. Pero aún tienes que crear manualmente cada subagente,
00:01:12asignándole un rol, acceso a habilidades, herramientas y permisos. Por eso el nuevo Agent Swarm de Kimi
00:01:19lleva las cosas al siguiente nivel, porque el orquestador es quien crea dinámicamente
00:01:25un subagente especializado para una tarea concreta, sin que tú tengas que hacer nada. Estos subagentes
00:01:31pueden trabajar en paralelo para completar una tarea global y, al terminar su parte, se la entregan
00:01:36al orquestador, quien decide si hace falta activar nuevos subagentes con esos datos
00:01:42para completar la tarea compleja. El Swarm de Kimi aún es un proyecto de investigación, pero ya
00:01:48muestra grandes mejoras comparado con el flujo de un solo agente. Miren este gráfico: cuanto más
00:01:53compleja es la tarea, el tiempo se mantiene casi constante gracias a los agentes trabajando en paralelo.
00:01:58Siendo sincero, esto ya se puede hacer de cierta forma en Claude Code; con la función de tareas
00:02:04puedes crear una lista y repartirlas entre varios subagentes. El problema es que estos
00:02:10subagentes son de propósito general y no están especializados para la tarea específica. Tampoco
00:02:15estoy seguro de si Claude puede asignar automáticamente las tareas al subagente personalizado correcto.
00:02:21Cuéntame en los comentarios si ya lo has probado. Pero parece que el equipo de Claude
00:02:25ha estado trabajando en una forma para que un orquestador cree subagentes sobre la marcha
00:02:31según la tarea, y esta función estaba oculta tras una bandera que encontró Mike Kelly,
00:02:37quien muestra cómo funciona en este tuit. En ese mismo tuit comparte un enlace a un repositorio,
00:02:42un fork de CC Mirror llamado Claude Sneak Peek. Vamos a probarlo. Este es un plan escrito por IA
00:02:48para crear un front-end web para XDL, una herramienta que descarga videos de X o Twitter desde la
00:02:55terminal. Ya tengo instalado y funcionando Claude Sneak Peek, que, como pueden ver,
00:03:00parece una versión minimalista de Claude Code. Le pediré que lea el archivo plan.md y cree tareas
00:03:05que puedan ser ejecutadas por un enjambre de subagentes. Dejaré que cree las tareas y, ahora que terminó,
00:03:11le pediré que las ejecute usando subagentes. Antes de eso, para confirmar que no tengo
00:03:16ningún subagente personalizado configurado, ejecutaré el comando slash “agent”
00:03:21y verán que no hay agentes especializados ni personalizados. Ahora está ejecutando las tareas
00:03:26y aquí añadió automáticamente un subagente “front-end builder” para las tareas de la interfaz.
00:03:32Y aquí vemos que tenemos un equipo; si pulsamos abajo para verlo, vemos que hay cinco agentes:
00:03:37un líder de equipo, QA tester, back-end builder, component builder y front-end builder,
00:03:42todos trabajando en tareas al mismo tiempo. También podemos ver en qué está trabajando cada uno.
00:03:48El QA tester busca patrones, el back-end builder también busca patrones y lee archivos,
00:03:53al igual que el creador de componentes y el de front-end. Si queremos ver exactamente qué hace
00:03:57un agente, pulsamos Enter para entrar en su vista y ver su prompt de sistema. Si volvemos,
00:04:02ahora tenemos ocho agentes: un creador de componentes, un servidor API, alguien configurando Vite,
00:04:07alguien integrando la API y ahora alguien con el CSS; nuestro equipo de agentes no para de crecer.
00:04:13Si pulsamos Enter en el líder del equipo, volvemos a la vista principal de Claude Code,
00:04:18por lo que el líder es el orquestador principal. También vemos en la vista general que cada
00:04:24subagente nos da su estado actual y, si alejo un poco la imagen y subo,
00:04:29puedo ver los mensajes enviados previamente por todos los diferentes agentes.
00:04:34Ahora que todas las tareas han terminado, recibimos un archivo de proyecto completado,
00:04:41que detalla todo lo hecho, y un informe de ejecución del enjambre con el número de agentes
00:04:47especializados usados, su rol y si completaron la tarea. Podemos bajar para ver en detalle
00:04:52qué hizo cada uno. Por todo el trabajo que el equipo de Claude ya ha puesto en esta función,
00:04:59no creo que hayan copiado a Kimi. Creo que vieron implementaciones externas y quisieron añadirlo
00:05:04nativamente a Claude Code, pero entiendo perfectamente por qué aún no lo han lanzado.
00:05:10Primero, no creo que esta función tenga tantas horas de entrenamiento como el orquestador de Kimi 2.5.
00:05:16Además, las cosas se complican para un usuario que ya tiene varios subagentes creados.
00:05:22Por ejemplo, si un usuario quiere completar una tarea compleja, ¿cómo sabe el orquestador
00:05:28si debe crear un nuevo subagente de front-end o usar el que ya tiene el usuario?
00:05:35¿Qué métricas o datos usa para juzgar eso? Las habilidades también añaden complejidad.
00:05:42Si un usuario tiene muchas habilidades descargadas, ¿cómo sabría el orquestador si usarlas
00:05:49para un nuevo agente o descargar unas propias que podrían ser más adecuadas para la tarea?
00:05:56Si Anthropic lanza este orquestador, tendrá que analizar un montón de datos del usuario,
00:06:02agentes y herramientas antes de decidir si crea un subagente y qué elementos añadirle.
00:06:10No sé si el equipo está trabajando en esto ahora mismo o si han decidido que es demasiado
00:06:16complicado y no lo lanzarán. No lo sé. Hablando de funciones, si estás usando una IA
00:06:22o a un humano para añadir funciones rápidamente a un proyecto y quieres que nada se rompa,
00:06:28tienes que probar Betastack. Puede monitorear los logs de tus servidores y usar detección de
00:06:33anomalías para avisarte si algo va mal antes de que ocurra. También tiene rastreo de errores
00:06:38nativo con IA para avisarte de cualquier fallo en tu front-end. Echa un vistazo a Betastack hoy mismo.

Key Takeaway

Claude Code oculta una potente capacidad de orquestación de agentes dinámicos que compite directamente con el modelo de enjambre de Kimi 2.5 para resolver tareas complejas de programación de forma paralela.

Highlights

Kimi 2.5 ha ganado popularidad gracias a su modo "Agent Swarm" que genera hasta 100 agentes dinámicos.

Se ha descubierto una función oculta en Claude Code que permite la creación de un enjambre de agentes similar.

A diferencia de los subagentes manuales

Timeline

Introducción y el auge de Kimi 2.5

El video comienza analizando el impacto de Kimi 2.5, un modelo de código abierto que destaca por sus benchmarks superiores a Opus. El presentador explica el concepto de "Agent Swarm", donde un orquestador central puede desplegar hasta 100 agentes especializados para abordar problemas complejos. Se menciona que un usuario de Twitter descubrió una funcionalidad similar y oculta dentro del código de Claude. El objetivo de la sección es plantear la duda sobre si Anthropic se inspiró o replicó esta tecnología de Kimi. Este contexto es vital para entender la competencia actual en el ámbito de la IA para desarrollo de software.

Evolución de los subagentes en Claude

Se detalla la historia de los subagentes en el ecosistema de Anthropic, mencionando que fueron anunciados originalmente en julio del año pasado. Históricamente, estos subagentes tenían limitaciones de contexto, funcionando en silos y requiriendo exportaciones manuales a archivos Markdown para mantener la memoria. El usuario debía asignar manualmente roles, habilidades y permisos a cada entidad individualmente, lo cual resultaba tedioso. Esta sección explica por qué el método tradicional de agentes es menos eficiente que un sistema de enjambre automatizado. Se subraya la necesidad de una orquestación que gestione el flujo de información de manera más fluida.

Comparativa entre Kimi y Claude Code

El orquestador de Kimi eleva el nivel al crear dinámicamente subagentes para tareas específicas sin intervención del usuario. Un gráfico clave muestra cómo el trabajo en paralelo permite que el tiempo de ejecución sea casi constante independientemente de la complejidad de la tarea. Aunque Claude Code permite repartir tareas, sus agentes suelen ser de propósito general y no tan especializados. El presentador introduce a Mike Kelly, quien descubrió la bandera oculta en Claude que activa esta capacidad de orquestación dinámica. Este descubrimiento sugiere que Anthropic ya estaba desarrollando su propia solución de enjambre nativa.

Demostración práctica de Claude Sneak Peek

Se realiza una demostración en vivo utilizando un fork llamado "Claude Sneak Peek" para crear el front-end de una herramienta de descarga de videos. Al ejecutar el comando de tareas, el sistema crea automáticamente roles como "QA tester", "back-end builder" y "component builder". El usuario puede observar en tiempo real cómo el equipo de agentes crece hasta alcanzar ocho integrantes trabajando simultáneamente en diferentes capas del proyecto. Cada agente tiene su propio prompt de sistema y estado de ejecución, permitiendo al líder u orquestador gestionar el resultado final. Al finalizar, se genera un informe detallado con el número de agentes especializados utilizados y el éxito de sus respectivas misiones.

Desafíos técnicos y conclusiones finales

El narrador argumenta que Anthropic probablemente no copió a Kimi, sino que trabajó en una implementación nativa basada en tendencias de la comunidad. Sin embargo, existen obstáculos significativos como la gestión de habilidades descargadas y la decisión de reutilizar agentes creados por el usuario frente a crear nuevos. La complejidad de analizar los datos y herramientas del usuario antes de desplegar un enjambre es lo que podría estar retrasando el lanzamiento oficial. Se menciona que esta función requiere muchas más horas de entrenamiento para igualar la precisión del orquestador de Kimi. Finalmente, se promociona Betastack como una solución para prevenir fallos cuando se delega el código a sistemas de inteligencia artificial.

Community Posts

View all posts