00:00:00La gente se está volviendo loca con Kimi 2.5. Es un modelo de código abierto con mejores benchmarks
00:00:05que Opus y un modo “Agent Swarm” increíblemente ingenioso donde un orquestador puede generar hasta 100
00:00:11agentes especializados para una tarea compleja. ¿Pero sabías que esta función también existe en el código de Claude
00:00:17tras una función oculta y fue descubierta por un usuario en Twitter? ¿Cómo lo descubrieron? ¿Y acaso
00:00:23Anthropic simplemente le robó la idea a Kimi? Suscríbete y vamos a analizarlo. Anthropic anunció
00:00:30subagentes personalizados en julio del año pasado y, desde entonces, la gente los ha usado para todo tipo de
00:00:35tareas especializadas. De hecho, hicimos un video sobre eso en aquel entonces. Pero los subagentes
00:00:41solo tienen un fragmento del contexto general, ya que están diseñados para una tarea específica. Hacen esa
00:00:48tarea, devuelven los datos y reinician su memoria. Así que la gente implementó la memoria
00:00:54haciendo que los subagentes exporten sus hallazgos a un archivo markdown y actualicen un archivo
00:01:01de contexto principal. Así, si se le pedía una actualización al mismo o a otro subagente, podían leer esos
00:01:06archivos y ver dónde lo habían dejado los demás. Pero aún tienes que crear manualmente cada subagente,
00:01:12asignándole un rol, acceso a habilidades, herramientas y permisos. Por eso el nuevo Agent Swarm de Kimi
00:01:19lleva las cosas al siguiente nivel, porque el orquestador es quien crea dinámicamente
00:01:25un subagente especializado para una tarea concreta, sin que tú tengas que hacer nada. Estos subagentes
00:01:31pueden trabajar en paralelo para completar una tarea global y, al terminar su parte, se la entregan
00:01:36al orquestador, quien decide si hace falta activar nuevos subagentes con esos datos
00:01:42para completar la tarea compleja. El Swarm de Kimi aún es un proyecto de investigación, pero ya
00:01:48muestra grandes mejoras comparado con el flujo de un solo agente. Miren este gráfico: cuanto más
00:01:53compleja es la tarea, el tiempo se mantiene casi constante gracias a los agentes trabajando en paralelo.
00:01:58Siendo sincero, esto ya se puede hacer de cierta forma en Claude Code; con la función de tareas
00:02:04puedes crear una lista y repartirlas entre varios subagentes. El problema es que estos
00:02:10subagentes son de propósito general y no están especializados para la tarea específica. Tampoco
00:02:15estoy seguro de si Claude puede asignar automáticamente las tareas al subagente personalizado correcto.
00:02:21Cuéntame en los comentarios si ya lo has probado. Pero parece que el equipo de Claude
00:02:25ha estado trabajando en una forma para que un orquestador cree subagentes sobre la marcha
00:02:31según la tarea, y esta función estaba oculta tras una bandera que encontró Mike Kelly,
00:02:37quien muestra cómo funciona en este tuit. En ese mismo tuit comparte un enlace a un repositorio,
00:02:42un fork de CC Mirror llamado Claude Sneak Peek. Vamos a probarlo. Este es un plan escrito por IA
00:02:48para crear un front-end web para XDL, una herramienta que descarga videos de X o Twitter desde la
00:02:55terminal. Ya tengo instalado y funcionando Claude Sneak Peek, que, como pueden ver,
00:03:00parece una versión minimalista de Claude Code. Le pediré que lea el archivo plan.md y cree tareas
00:03:05que puedan ser ejecutadas por un enjambre de subagentes. Dejaré que cree las tareas y, ahora que terminó,
00:03:11le pediré que las ejecute usando subagentes. Antes de eso, para confirmar que no tengo
00:03:16ningún subagente personalizado configurado, ejecutaré el comando slash “agent”
00:03:21y verán que no hay agentes especializados ni personalizados. Ahora está ejecutando las tareas
00:03:26y aquí añadió automáticamente un subagente “front-end builder” para las tareas de la interfaz.
00:03:32Y aquí vemos que tenemos un equipo; si pulsamos abajo para verlo, vemos que hay cinco agentes:
00:03:37un líder de equipo, QA tester, back-end builder, component builder y front-end builder,
00:03:42todos trabajando en tareas al mismo tiempo. También podemos ver en qué está trabajando cada uno.
00:03:48El QA tester busca patrones, el back-end builder también busca patrones y lee archivos,
00:03:53al igual que el creador de componentes y el de front-end. Si queremos ver exactamente qué hace
00:03:57un agente, pulsamos Enter para entrar en su vista y ver su prompt de sistema. Si volvemos,
00:04:02ahora tenemos ocho agentes: un creador de componentes, un servidor API, alguien configurando Vite,
00:04:07alguien integrando la API y ahora alguien con el CSS; nuestro equipo de agentes no para de crecer.
00:04:13Si pulsamos Enter en el líder del equipo, volvemos a la vista principal de Claude Code,
00:04:18por lo que el líder es el orquestador principal. También vemos en la vista general que cada
00:04:24subagente nos da su estado actual y, si alejo un poco la imagen y subo,
00:04:29puedo ver los mensajes enviados previamente por todos los diferentes agentes.
00:04:34Ahora que todas las tareas han terminado, recibimos un archivo de proyecto completado,
00:04:41que detalla todo lo hecho, y un informe de ejecución del enjambre con el número de agentes
00:04:47especializados usados, su rol y si completaron la tarea. Podemos bajar para ver en detalle
00:04:52qué hizo cada uno. Por todo el trabajo que el equipo de Claude ya ha puesto en esta función,
00:04:59no creo que hayan copiado a Kimi. Creo que vieron implementaciones externas y quisieron añadirlo
00:05:04nativamente a Claude Code, pero entiendo perfectamente por qué aún no lo han lanzado.
00:05:10Primero, no creo que esta función tenga tantas horas de entrenamiento como el orquestador de Kimi 2.5.
00:05:16Además, las cosas se complican para un usuario que ya tiene varios subagentes creados.
00:05:22Por ejemplo, si un usuario quiere completar una tarea compleja, ¿cómo sabe el orquestador
00:05:28si debe crear un nuevo subagente de front-end o usar el que ya tiene el usuario?
00:05:35¿Qué métricas o datos usa para juzgar eso? Las habilidades también añaden complejidad.
00:05:42Si un usuario tiene muchas habilidades descargadas, ¿cómo sabría el orquestador si usarlas
00:05:49para un nuevo agente o descargar unas propias que podrían ser más adecuadas para la tarea?
00:05:56Si Anthropic lanza este orquestador, tendrá que analizar un montón de datos del usuario,
00:06:02agentes y herramientas antes de decidir si crea un subagente y qué elementos añadirle.
00:06:10No sé si el equipo está trabajando en esto ahora mismo o si han decidido que es demasiado
00:06:16complicado y no lo lanzarán. No lo sé. Hablando de funciones, si estás usando una IA
00:06:22o a un humano para añadir funciones rápidamente a un proyecto y quieres que nada se rompa,
00:06:28tienes que probar Betastack. Puede monitorear los logs de tus servidores y usar detección de
00:06:33anomalías para avisarte si algo va mal antes de que ocurra. También tiene rastreo de errores
00:06:38nativo con IA para avisarte de cualquier fallo en tu front-end. Echa un vistazo a Betastack hoy mismo.