El plan maestro para el sistema operativo completo de Claude

AAI LABS
Computing/SoftwareInternet Technology

Transcript

00:00:00Imagina que eres un rey medieval. Tienes todo un reino que dirigir, pero preferirías hacer absolutamente
00:00:04nada mientras otros se encargan de ello por ti. El problema es que no puedes porque tu personal está acostumbrado
00:00:10a que se lo den todo hecho. Lo que realmente necesitas es un sistema que gestione todo el reino por
00:00:15su cuenta, y eso es exactamente en lo que se ha convertido Claude Code. Desde que Anthropic ha estado lanzando
00:00:19actualizaciones, dejó de ser solo un agente de codificación y se convirtió en un sistema operativo completo, uno que
00:00:25coordina todo en tu máquina. Pero los flujos de trabajo dinámicos son los que realmente lo unen todo.
00:00:30Así que, antes de que nuestro rey entregue todo su reino a un agente, veamos cómo funciona esto realmente.
00:00:35Desde que Anthropic empezó a lanzar nuevas formas de desperdiciar tokens, que en realidad es solo su
00:00:40excusa para ganar más dinero con Claude Code, se ha convertido en mucho más que un agente de codificación. Es
00:00:44básicamente un sistema operativo completo ahora. Al igual que un sistema operativo forma la base de cada
00:00:50tarea y coordina lo que haces en tu máquina, Claude Code ahora desempeña ese mismo papel. Coordina
00:00:55y controla todo lo que haces en ella. Pero antes de profundizar en cómo los flujos de trabajo dinámicos completan este
00:01:00sistema, necesitas conocer los otros componentes. La única diferencia entre un
00:01:04sistema operativo de computadora y el sistema operativo de Claude Code es que no tienes que trabajar
00:01:08tan duro en la configuración, a menos que estés usando Arch. Y no, no estarás instalando un
00:01:12montón de controladores solo para que el micrófono funcione y puedas dar instrucciones por voz como un dios del rollo.
00:01:17Y al igual que un SO real, está formado por múltiples partes. Cada una es lo suficientemente importante como para que el
00:01:22sistema no esté completo sin ella. En un SO, el núcleo es la capa más importante, forma el corazón y
00:01:28controla todas las operaciones. El equivalente en Claude Code es el archivo Claude.md y tus archivos de contexto.
00:01:33Ya hicimos un video completo hablando sobre cómo estructurar tu archivo Claude.md para que tu agente
00:01:39rinda al máximo. Eso importa aquí porque el núcleo es el programa conductor de todo tu agente.
00:01:44Si no está configurado correctamente, el agente no puede averiguar qué quiere realmente tu proyecto. Y las otras
00:01:48partes se desmoronan con él. Un poco como cuando toda tu vida se desmorona al casarte. Luego están
00:01:53los controladores, las piezas que permiten que el sistema interactúe con dispositivos externos. El equivalente en
00:01:58Claude Code es MCP. Así que siempre que Claude necesita una herramienta externa, la busca a través de MCP y llama
00:02:04a esa herramienta para hacer el trabajo. Después vienen los programas cotidianos, que en Claude Code son las habilidades y
00:02:09otros comandos. Estos contienen instrucciones estructuradas para tareas repetibles y puedes invocarlos siempre que
00:02:14los necesites. Todo SO también necesita un programador o tarea cron que ejecute algo en un momento programado.
00:02:20De la misma manera, Claude Code añadió recientemente bucles y rutinas. Estas son básicamente sus trabajos cron y
00:02:25eliminan la necesidad de que los supervises mediante una tarea. Automatizan el trabajo repetitivo que de otro modo
00:02:29harías a mano. Así que incluso si tu sistema se apaga, las tareas siguen ejecutándose por sí solas. Así que puedes
00:02:34dormir tranquilamente sabiendo que tu aplicación B2B SaaS que literalmente nadie está usando está siendo vigilada.
00:02:40Y por último, lo más importante, hay una pieza que une todas ellas en un
00:02:45sistema operativo completo. Esa pieza es el flujo de trabajo dinámico, la nueva característica que se lanzó con Opus
00:02:504.8. Quizás ya sepas que Claude Code tiene flujos de trabajo dinámicos. Básicamente, son otro intento
00:02:55de Anthropic para simplificar las tareas de larga duración. Funcionan como instrucciones repetibles que generan múltiples
00:03:01agentes para realizar la tarea para la que fueron diseñados. Entonces, ¿en qué se diferencia de las otras arquitecturas que
00:03:06ya tienes? Para compararlas, la primera y más simple son las habilidades. Las habilidades son instrucciones repetibles para
00:03:11tareas que necesitan pasos guiados. Pero una habilidad es generada por un agente y ese mismo agente lee las instrucciones
00:03:17de ella. Simplemente guía al agente para hacer una tarea que ya conoce de una mejor manera y no ayuda con
00:03:22tareas de larga duración. Es solo un agente haciendo todo. Luego está el comando de objetivo. Este
00:03:27itera hacia un objetivo final predefinido y el agente hace bucles hasta que se alcanza la condición final. Este fue un
00:03:32intento excepcional por mejorar las tareas de larga duración. Lo hemos estado usando mucho en nuestros propios flujos de trabajo
00:03:38desde que se lanzó. Tanto el objetivo como el flujo de trabajo pueden coordinar múltiples agentes, pero son diferentes.
00:03:43Lo que realmente los separa es el determinismo. El objetivo no es determinista, lo que significa que el sistema decide
00:03:48qué hacer después. Un flujo de trabajo es determinista y el código decide exactamente qué sucede. Creas tu
00:03:54primer flujo de trabajo simplemente usando la palabra clave workflow. A partir de esa palabra en tu mensaje, Claude identifica el
00:03:59flujo de trabajo dinámico necesario para la tarea, pero esta es una palabra que usamos todo el tiempo en los mensajes, así que podrías
00:04:04pensar que se activaría siempre. Sin embargo, no lo hará a menos que el mensaje exprese realmente la intención
00:04:09de crear uno. Aquí es donde los flujos de trabajo son realmente diferentes. En lugar de la estructura markdown habitual que
00:04:14otros usan, crea un código JavaScript. Vive dentro del directorio workflow, dentro de la carpeta .claude,
00:04:19y utiliza ese script completo para controlar todo. Así que en lugar de que tu plan viva en la
00:04:23ventana de contexto, ese plan está escrito en código, definiendo cómo trabajarán los subagentes paso a
00:04:28paso. Define esquemas estrictos, que son básicamente formularios para los subagentes, de modo que entreguen la
00:04:33salida en un formato estricto. Cada agente es llamado con la instrucción y el formulario que debe satisfacer. Sigue
00:04:39trabajando hasta que la salida coincida con ese esquema, luego devuelve sus hallazgos. Los invocas con el comando slash
00:04:44con el nombre del flujo de trabajo, y luego puedes entregarle el plan que quieres someter a prueba. Se ejecuta en el
00:04:49fondo para que puedas seguir con tu propio trabajo, darle otro mensaje para que tu gerente de proyecto
00:04:53se sienta orgulloso de tu productividad con IA por una vez. Para verificar el progreso, solo ejecutas el comando
00:04:58workflow. Ahí puedes ver cada etapa de cada flujo de trabajo y todos los modelos que cada agente ha invocado,
00:05:03y ver cuántos tokens ha consumido cada tarea. Y si tu sesión termina mientras un flujo de trabajo se está ejecutando,
00:05:08no tienes que preocuparte por perder el progreso. Persiste después de ejecutar el comando resume. Cada flujo de trabajo
00:05:14mantiene su propia identificación. Y cuando reanudas, recupera todo el trabajo del agente en caché de la memoria y continúa
00:05:19donde lo dejó. A diferencia de mi abuela, no olvida pagar la factura de Claude AI y realmente
00:05:24recuerda lo que tiene que hacer. Una cosa a tener en cuenta antes de usar un flujo de trabajo. Como esto está en vista
00:05:29previa de investigación, los flujos de trabajo dinámicos consumen muchos más tokens que una sesión típica de Claude Code. Eso es porque
00:05:35utilizan múltiples subagentes bajo el capó y cada uno se ejecuta en su propia ventana de contexto separada. Necesitas
00:05:40considerar cuidadosamente cuándo los necesitas realmente, o de lo contrario agotarás tu plan de $200 en unas pocas
00:05:45horas. Hay algunas métricas clave que te dicen si un flujo de trabajo es la mejor opción. La primera
00:05:50es que la tarea se puede dividir en unidades independientes. Si los agentes dependen del trabajo de los demás,
00:05:55terminan esperando, y no tiene sentido generar un flujo de trabajo porque pierdes todo el
00:06:00paralelismo. Es por eso que, si las tareas dependen menos unas de otras, obtienes un mejor paralelismo y
00:06:05resultados más rápidos. Lo cual tu startup debería aprender, ya que todavía depende del dinero de tus padres
00:06:10para sobrevivir. La siguiente razón para usar flujos de trabajo dinámicos es si la tarea necesita más de una sola ventana de contexto
00:06:15para ejecutarse y necesita dividirse en fragmentos. Los flujos de trabajo usan múltiples subagentes, cada uno con su
00:06:21propia ventana de contexto, por lo que la tarea debe ser lo suficientemente grande como para necesitar realmente esas ventanas separadas. De lo contrario,
00:06:26solo estarás perdiendo tiempo y tokens. Cada subagente se ejecuta en su propio contexto fresco y devuelve
00:06:31solo el resultado. El resto de su razonamiento permanece en el archivo de código y nunca entra en la ventana de contexto principal
00:06:36a menos que lo necesites. La siguiente razón es que vale la pena verificar la tarea. Usa un flujo de trabajo cuando una respuesta incorrecta
00:06:41sea lo suficientemente costosa como para requerir verificación cruzada antes de seguir adelante. Eso incluye cosas como
00:06:46hallazgos de seguridad, reclamos de errores y migraciones. Pero esa verificación cuesta agentes adicionales que queman
00:06:52tokens y tiempo. Así que asegúrate de que la tarea realmente valga la pena y no estés simplemente generando cinco agentes
00:06:57porque recientemente escuchaste a un CEO de tecnología de IA decir que más tokens equivalen a más dinero. La última razón es que
00:07:03tu tarea es determinista. Un flujo de trabajo usa código para llamar a agentes en una estructura fija. Así que si la tarea es
00:07:09determinista, adelante. Si la tarea no es determinista y necesita que un agente evalúe cuál
00:07:14sería la siguiente tarea en tiempo de ejecución, los flujos de trabajo no son para eso. Entonces, cuando elijas entre flujo de trabajo y
00:07:20objetivo, piensa en la forma de la tarea. Una tarea puede ser amplia o profunda. Amplia significa que se puede dividir en muchas
00:07:25subtareas que pueden ejecutarse al mismo tiempo. Profunda significa una tarea a la vez, avanzando paso a paso hacia ella.
00:07:32Un flujo de trabajo es amplio, así que en lugar de profundizar, simplemente llama a los agentes y les permite iterar. Para tareas
00:07:37profundas, el comando de objetivo toma una tarea a la vez y no ejecuta cosas en paralelo de la manera en que los flujos de trabajo
00:07:43lo hacen. Solo recurre a un flujo de trabajo una vez que la tarea encaje realmente, para no desperdiciar tokens.
00:07:48Claude Code ya viene con un flujo de trabajo dinámico incorporado llamado Deep Research. Es básicamente el
00:07:53pipeline de investigación de múltiples pasos que solíamos construir a mano con múltiples archivos de contexto y Claude.md. Ahora
00:07:58es solo un flujo de trabajo que puedes invocar desde cualquier proyecto. Esta investigación forma una parte clave de todo el SO que
00:08:04construyes. Se asegura de que las fuentes de información detrás de ese SO sean confiables, para que tu mamá no pueda alimentarte
00:08:09con información falsa de su grupo de boomers de Facebook y luego regañarte cuando verifiques los hechos. Se ejecuta en cinco
00:08:14partes y cada una conduce a la siguiente. Primero, busca información, luego obtiene los detalles
00:08:19de las fuentes que encuentra. Después viene la verificación adversarial para validar las afirmaciones,
00:08:24y sintetiza lo que sobrevive en un documento final. Puedes verlo trabajar desde el comando
00:08:29workflows, donde cada subagente hereda sus herramientas del padre, y es realmente intenso en
00:08:34tokens, por lo que puede agotar todo tu límite en poco tiempo. Esta ejecución tomó un millón de tokens en un
00:08:39tema pequeño. Además de la investigación de varios pasos, puedes construir otros flujos de trabajo de investigación que se conviertan en parte de
00:08:45tu sistema de investigación. Uno que hicimos para nosotros investiga a la competencia, verifica cómo se están desempeñando,
00:08:49y encuentra la ventaja competitiva que tienen. Esta es una pieza importante si eres un desarrollador de productos. Necesitas
00:08:54saber cómo se están desempeñando tus competidores en el mercado para poder construir algo mejor.
00:08:59Este se divide en cuatro fases, como el flujo de trabajo de investigación, y una vez que termina, informa
00:09:04los hallazgos. Nuestra ejecución utilizó 679,000 tokens y 34 agentes y escribió un informe completo en markdown con sus conclusiones.
00:09:11También se mejora a sí mismo sobre la marcha. Cuando encuentra un problema, aplica una solución, así que la próxima vez que lo ejecutes,
00:09:17no se topa con los mismos problemas que la primera vez. El informe viene con métricas de comparación
00:09:21claramente definidas y todos sus hallazgos, así que cuando construyas tu producto, puedes usarlo como fuente
00:09:26para analizar el mercado antes de lanzarlo. Además, si estás disfrutando nuestro contenido, considera presionar
00:09:30el botón de hype porque nos ayuda a crear más contenido como este y llegar a más personas.
00:09:35Todo sistema operativo necesita su núcleo, sus controladores y las piezas que lo hacen completo. Juntos,
00:09:41permiten que se ejecute sin tu intervención. Un ejemplo de dicho sistema es una configuración de segundo cerebro. Esto es
00:09:45definitivamente útil si tu primer cerebro, como el nuestro, se jodió por completo tras quedar inutilizado desde que
00:09:50nuestros dispositivos fueron bendecidos con LLM. El núcleo de este segundo cerebro se convierte en tu Claude.MD,
00:09:55que contiene la información sobre cómo navegar por todo el sistema. Los programas cotidianos, las cosas repetibles
00:10:01son tus habilidades. Llevan las instrucciones para las tareas que haces una y otra vez. Aquí está la mejor
00:10:06manera de configurar uno. Cuando estés inmerso en una sesión larga y te des cuenta de que es algo que harás a menudo,
00:10:11solo pídele a Claude que combine lo aprendido en esa sesión en una habilidad. La memoria de este SO son todos
00:10:16los archivos que creas y mantienes en tu bóveda. Registran lo que haces y cómo lo haces. Eso
00:10:21significa que sabe más sobre ti que tú mismo y le dan a Claude contexto sobre todo en lo que estás
00:10:25trabajando. A menudo necesitamos que el segundo cerebro llegue a fuentes externas, así que hemos configurado el
00:10:29Google Calendar y Notion MCPs. De esa forma, puede acceder a los archivos del proyecto en Notion y sincronizar los datos,
00:10:35leer el horario en el calendario y crear y actualizar entradas para que pueda encajar algo de tiempo al aire libre
00:10:41entre tu agenda ya ocupada. Hemos documentado los formatos exactos que debe seguir en el archivo Claude.MD
00:10:46y la parte más importante es crear los flujos de trabajo para tu configuración. Estos te permiten paralelizar
00:10:51tus tareas repetibles y entregárselas a subagentes. El flujo de trabajo de resumen matutino que construimos genera subagentes
00:10:57para recopilar información de múltiples fuentes y devuelve un resumen para comenzar nuestro día. Una vez que todo esto esté
00:11:02configurado, solo le das un mensaje. Carga la habilidad y el contexto correctos, crea los archivos en los lugares correctos,
00:11:07y conecta la información con las partes relevantes por sí solo. Si has estado usando el segundo cerebro
00:11:12durante un tiempo, deberías crear un flujo de trabajo de auditoría. Verifica si hay enlaces rotos y expone cada problema
00:11:17en la configuración y los informa. A partir de ahí, puedes ejecutar las correcciones y mantener tu segundo cerebro en excelente
00:11:22forma, pero conociendo el tipo de hombre que eres, también estarás pagando por sus sesiones de terapia la próxima semana.
00:11:27Similar a cómo puedes configurar todo un sistema operativo para proyectos que no son de codificación, puedes hacer lo mismo para
00:11:32tus proyectos de codificación también. Configuras tu claude.md como el núcleo y pones toda la información
00:11:37del proyecto dentro. Configuras los agentes para tu proyecto, que actúan como tus programas cotidianos.
00:11:42También configuras hooks para diferentes casos, como formatear un archivo después de que un agente termine de editarlo
00:11:46de modo que, entre el maldito desastre que llamas relación y tu código, al menos una cosa
00:11:51esté organizada. Creas habilidades para diferentes tareas, como añadir un nuevo endpoint. De esa manera, cada endpoint
00:11:56sigue el esquema exacto que deseas, y puedes crear flujos de trabajo para cosas como revisar cambios antes
00:12:01de publicar, migrar la base de código o la base de datos, y ejecutar pruebas de extremo a extremo para confirmar que toda la
00:12:07aplicación funciona. En lugar de que te despiertes con tu gerente llamando a las 2 a. m. diciendo que tu producción está caída de nuevo, el
00:12:12contexto para este SO se convierte en los archivos de tu carpeta de documentos y el código mismo. Los flujos de trabajo son excepcionalmente
00:12:17útiles para migraciones de proyectos. Puedes construir uno que convierta todo tu proyecto de una biblioteca a
00:12:22otra y dejar que los agentes individuales manejen la conversión. Probamos esto antes, y sin un
00:12:27flujo de trabajo tomó más de una hora, pero con un flujo de trabajo tomó solo 21 minutos. Así que el tiempo ahorrado
00:12:32con flujos de trabajo puede dedicarse a cosas más importantes, como desplazarse por los deepfakes inapropiados de Dario.
00:12:37Así es como nuestro sistema operativo se extiende a casos de uso de codificación, de modo que cuando estés construyendo proyectos,
00:12:43no tengas que manejar todo a mano. Dejas que el sistema operativo lo haga por ti. Si quieres
00:12:47fundar la próxima gran empresa de SaaS B2B de IA pero no sabes por dónde empezar, deberías estar en AI Labs Pro.
00:12:53Ahí es donde encontrarás los flujos de trabajo utilizados en este video, junto con todos los demás recursos,
00:12:57guías y beneficios que hemos reunido. También podrás conocer a un grupo de nerds con ideas afines,
00:13:01incluido nuestro equipo. El enlace está en la descripción, y puedes echarle un vistazo.
00:13:05Eso nos lleva al final de este video. Si te gustaría apoyar el canal y ayudarnos a seguir haciendo
00:13:09videos como este, puedes hacerlo usando el botón de super thanks a continuación. Como siempre, gracias por
00:13:14ver y te veré en el próximo.

Key Takeaway

Claude Code funciona como un sistema operativo completo donde los flujos de trabajo dinámicos, definidos mediante scripts de JavaScript, permiten automatizar tareas complejas de larga duración mediante la coordinación determinista de múltiples subagentes en ventanas de contexto independientes.

Highlights

  • Claude Code opera ahora como un sistema operativo completo que coordina agentes, herramientas externas mediante MCP, y flujos de trabajo dinámicos.

  • Los flujos de trabajo dinámicos son deterministas, utilizan scripts en JavaScript dentro del directorio .claude/workflow y definen esquemas estrictos para la salida de los subagentes.

  • La migración de proyectos mediante flujos de trabajo dinámicos redujo el tiempo de ejecución de más de una hora a 21 minutos.

  • Cada subagente en un flujo de trabajo dinámico opera en su propia ventana de contexto, lo que permite paralelizar tareas independientes y optimizar el procesamiento.

  • El comando 'workflow' permite supervisar cada etapa, los modelos invocados y el consumo de tokens de cada subagente en ejecución.

  • Los flujos de trabajo dinámicos requieren una planificación cuidadosa debido a su alto consumo de tokens, ya que cada subagente se ejecuta en una ventana de contexto separada.

Timeline

Arquitectura de Claude Code como Sistema Operativo

  • Claude Code centraliza la gestión de tareas, archivos de contexto, herramientas externas y automatizaciones.
  • El archivo Claude.md funciona como el núcleo del sistema, definiendo la conducta y los objetivos del agente.
  • La integración mediante MCP permite al sistema interactuar con dispositivos y herramientas externas.
  • Los bucles y rutinas permiten la automatización de tareas repetitivas sin supervisión humana constante.

El sistema ha evolucionado de un simple agente de código a un SO que coordina operaciones. Sus componentes incluyen un núcleo para la configuración, controladores MCP para herramientas, programas cotidianos como habilidades, y tareas programadas que se ejecutan incluso si la sesión principal está inactiva.

Funcionamiento de los Flujos de Trabajo Dinámicos

  • Los flujos de trabajo dinámicos permiten la creación de múltiples subagentes para realizar tareas de larga duración de forma coordinada.
  • A diferencia del comando de objetivo, los flujos de trabajo son deterministas y se definen mediante código JavaScript en el directorio .claude/workflow.
  • Los esquemas estrictos garantizan que los subagentes produzcan resultados con el formato requerido antes de avanzar.
  • El estado de los flujos de trabajo persiste incluso si la sesión finaliza, permitiendo su reanudación mediante el comando 'resume'.

Introducidos con Opus 4.8, estos flujos sustituyen la estructura Markdown por scripts de control. Definen cómo operan los agentes paso a paso y utilizan formularios (esquemas) para asegurar que la salida sea precisa. La ejecución ocurre en segundo plano, permitiendo el monitoreo del progreso y consumo de recursos mediante el comando 'workflow'.

Estrategias de Implementación y Casos de Uso

  • Los flujos de trabajo son óptimos para tareas paralelizables, procesos que exceden una sola ventana de contexto y tareas que requieren verificación cruzada.
  • El flujo de trabajo 'Deep Research' es un proceso integrado de múltiples pasos para investigación confiable.
  • El sistema es aplicable tanto a la codificación (migraciones, pruebas) como a la gestión personal (segundo cerebro, sincronización de Notion y calendario).
  • La ejecución de migraciones de código mediante flujos de trabajo redujo el tiempo operativo en aproximadamente un 65%.

Se debe evaluar la naturaleza de la tarea antes de usar flujos de trabajo para evitar el consumo excesivo de tokens. Son ideales para procesos amplios y deterministas. Ejemplos prácticos incluyen la creación de un segundo cerebro, la auditoría de enlaces, la automatización de migraciones de librerías y la investigación competitiva de mercado.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video