Estos Bucles de Error Detectan el 90% de los Fallos de Código

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00¿Qué sucede realmente cuando obligas a un agente de programación a seguir las reglas?
00:00:03Todos tenemos un problema común al trabajar con Claude y otros agentes de código.
00:00:07Suelen no seguir las instrucciones e ignorar por completo el archivo Claude.md.
00:00:11E incluso cuando intentamos forzar TDD, simplemente intenta modificar los propios archivos de prueba.
00:00:15Así fue como encontramos este plugin que se estaba volviendo popular, ganando 58.000 estrellas en solo 24 horas.
00:00:21Pero eso solo demuestra cómo es el ciclo de entusiasmo en torno a las herramientas de IA.
00:00:25Este plugin promete una aplicación estricta de las metodologías de desarrollo de software en el flujo de trabajo.
00:00:30Pero la pregunta era si realmente cumple con lo que promete.
00:00:33Nuestro equipo ya ha visto surgir flujos de trabajo similares y la mayoría resultaron ser puro marketing.
00:00:37Así que pusimos este plugin en flujos de trabajo reales para ver si vale la pena implementarlo o si es solo otra moda.
00:00:43Superpowers es un plugin que impone la metodología de desarrollo tradicional directamente en el IDE de IA que estés usando.
00:00:50Ahora, algunos podrían pensar que marcos ágiles existentes como BMAD y OpenSpec ya hacen lo mismo.
00:00:56Pero este es diferente porque no es solo un sistema de agentes usado para escribir las especificaciones del proyecto.
00:01:01Es la imposición de esa metodología ágil en el flujo de trabajo con controles estrictos que aseguran que el agente no avance hasta completar el paso actual.
00:01:10Estos controles son puntos de verificación explícitos para evitar que Claude se desvíe de lo instruido.
00:01:15La filosofía central de este plugin es el TDD y un proceso sistemático por encima de las suposiciones.
00:01:20Verifica antes de dar el proyecto por exitoso, con instrucciones diseñadas para atacar las áreas comunes donde la IA suele fallar y corregirlas.
00:01:28No pasa al siguiente paso hasta que recibe la señal verde del usuario.
00:01:32En resumen, utiliza todas las mejores prácticas de las que hemos hablado, integradas de forma nativa, eliminando la configuración manual.
00:01:40El plugin enfatiza el desarrollo dirigido por pruebas real y principios como DRY y YAGNI que nos enseñaron al aprender desarrollo de software.
00:01:50Está disponible para todas las plataformas de IA.
00:01:52Pero como usamos Claude Code, copiamos el comando de registro del marketplace, lo añadimos al proyecto y luego instalamos el plugin.
00:02:02Una vez instalado, y tras reiniciar Claude Code, el plugin Superpowers ya estaba disponible para usarse en el proyecto.
00:02:08Tras reiniciar, le dimos un prompt indicando que queríamos crear un software de gestión de proyectos similar a Trello.
00:02:15Activó por sí solo la habilidad de lluvia de ideas y, en lugar de adivinar qué construir, analizó primero qué había en el proyecto.
00:02:24Hizo muchas preguntas para aclarar el tipo de app, el público objetivo, el stack tecnológico y los posibles problemas de cada elección.
00:02:33Con la base de datos, sugirió que nuestra elección podría ser insegura al ejecutarse en el navegador sin acceso desde el servidor, así que la cambiamos.
00:02:44Siguió aclarando todos los detalles hasta que estuvimos satisfechos con las opciones.
00:02:48Tras confirmar todo, el siguiente paso fue darnos tres enfoques para que eligiéramos uno para implementar.
00:02:55Elegimos la opción que más nos gustó y sugerimos algunos cambios junto con la selección.
00:02:58Una vez hecho esto, también nos proporcionó el diseño de la arquitectura.
00:03:02Luego nos dio el diseño de UX, mencionando cómo se gestionarían los tableros.
00:03:06También confirmó con nosotros toda la estructura del proyecto.
00:03:09Y una vez aprobado el diseño, documentó toda la información en una carpeta de documentos.
00:03:13Aquí es donde este plugin supera a otros, pues incluye instrucciones de git para confirmar cada cambio de forma automática.
00:03:22Tras crear los planes, se activó la habilidad de escritura de plan, redactó el plan de implementación y lo confirmó en git.
00:03:29El plan dividió la aplicación en subtareas más fáciles de implementar.
00:03:33Podrías pensar que el modo de planificación nativo de Claude ya hace todo esto por su cuenta.
00:03:37Pero la diferencia es que la planificación de Claude Code es solo una guía para el agente sobre lo que debe hacer.
00:03:44Solo pregunta sobre el stack tecnológico si cree que es necesario y toma decisiones pequeñas, como las librerías de UI, por sí solo.
00:03:52En cambio, Superpowers obliga a cumplir los pasos: no puedes avanzar hasta que el actual se complete, asegurando que el plan se ejecute.
00:04:01Al terminar la planificación, nos preguntó cómo queríamos implementar el plan y elegimos la implementación dirigida por subagentes.
00:04:09Claude también genera subagentes, pero aquí fue diferente porque configuró automáticamente un “git worktree” para que no se interfieran entre sí.
00:04:20Los agentes necesitan estar aislados en árboles de trabajo para rendir mejor, ya que si trabajan en el mismo directorio, sobrescriben el trabajo del otro.
00:04:28Y esto es lo principal que el plugin gestiona de forma nativa.
00:04:31Una vez finalizada la planificación, Claude pasó a la fase de implementación.
00:04:34Inició una tarea y, al terminarla, creó una subtarea de revisión independiente para verificar la implementación frente a las especificaciones.
00:04:41Tras hacer el commit en git, utilizó otra habilidad de Superpowers: el revisor de código.
00:04:46Solo cuando los agentes previos aprobaron la calidad del código, comenzó la siguiente tarea, iterando en las anteriores hasta cumplir el estándar.
00:04:54Al completar, revisar y confirmar cada tarea en git, asegurando el orden, nos preguntó si debía fusionar a “main” o crear un PR.
00:05:04Le pedimos que lo fusionara directamente en la rama principal.
00:05:06Luego eliminó todos los árboles de trabajo y consolidó el proyecto completo en la rama “main”.
00:05:11Este proceso consume mucha ventana de contexto por los subagentes; en nuestro caso, una sola iteración usó casi el 50% del total.
00:05:24El proyecto resultante era sencillo y tenía una funcionalidad básica.
00:05:27Queríamos que las listas se ordenaran por estados: Por hacer, En progreso y Hecho.
00:05:32Y aunque las tarjetas individuales estaban ahí, también queríamos que las listas se pudieran mover.
00:05:36Volvimos a Claude Code para pedirlo, pero empezó a trabajar de forma normal, sin usar las habilidades del plugin.
00:05:42Seguramente se debió al alto consumo de contexto, por lo que tuvimos que recordarle que usara el plugin Superpowers.
00:05:48Tras el recordatorio, se puso a trabajar siguiendo el mismo proceso estructurado de antes.
00:05:52Claude generó agentes en árboles de trabajo separados, pero aquí es donde destacan por usar el enfoque TDD de forma nativa.
00:06:02Estos agentes primero escriben las pruebas para cada parte que se va a implementar.
00:06:05Una vez escritas, el sistema asegura que el agente escriba el código sin modificar los tests, garantizando que estos pasen.
00:06:13Las habilidades del plugin usan instrucciones fuertes que impiden modificar las pruebas, invalidando las excusas que Claude suele poner para saltarse pasos.
00:06:23Estas instrucciones son explícitas, del tipo: “si hay un 1% de probabilidad de usar una habilidad, úsala”.
00:06:29Esto garantizó que cada tarea se realizara de manera adecuada y estructurada.
00:06:32Cabe notar que los agentes realizaban las tareas de forma secuencial, por lo que tardaron más que el modo nativo de Claude.
00:06:41Pero al imponer reglas estrictas, se aseguró de que la aplicación funcionara tal como se esperaba.
00:06:45Como mencionamos, el contexto se agota rápido; tras unas pocas tareas, solo nos quedaba el 5% de la ventana.
00:06:53Antes de seguir, usamos el comando “compact” para no perder información mientras Claude planeaba la siguiente tarea.
00:07:01Tras compactar la conversación, le pedimos la siguiente funcionalidad y comenzó con el mismo rigor.
00:07:07Lo mejor de esta sesión fue que no supuso nada por su cuenta; siguió haciendo preguntas desde varios ángulos para crear la app exacta.
00:07:17El plugin exprimió a Claude, aclarando casos borde como qué aspecto tendrían las columnas vacías, algo que Claude solo suele ignorar o adivinar.
00:07:29Las guías para usar mejor este plugin están disponibles en AI Labs Pro.
00:07:33Es nuestra comunidad recién lanzada donde obtienes plantillas listas para usar en tus proyectos para este y todos los videos anteriores.
00:07:42Si valoras nuestro trabajo y quieres apoyar el canal, esta es la mejor forma. El enlace está en la descripción.
00:07:48Otro punto fuerte es su capacidad para realizar depuración sistemática.
00:07:52Tuvimos un error al guardar datos tras refrescar; le dimos a Claude un prompt vago sin especificar el origen y pedimos depuración sistemática.
00:08:01Cargó la habilidad correspondiente, cuyo trabajo se dividió en cuatro fases.
00:08:06La primera fase identificó la causa raíz haciéndonos preguntas sobre el problema.
00:08:10Con nuestras respuestas, investigó siguiendo la dirección indicada y localizó el archivo que presentaba el fallo.
00:08:16En la fase dos aisló el error, mientras que en la tres concretó la razón exacta por la que ocurría para poder solucionarlo.
00:08:25La fase cuatro fue aplicar la solución. El proceso fue mucho más estructurado que simplemente dar palos de ciego, y terminó con pruebas.
00:08:35Hay tareas que no requieren todo este flujo y donde usarlo sería excesivo, como cuando quisimos cambiar la interfaz de la app.
00:08:47No queríamos esperar 15 minutos solo por un cambio visual, así que para estos casos podemos simplificar el proceso.
00:08:51Como no teníamos un objetivo visual fijo, le pedimos mejorar la UI sin implementar, solo realizando la lluvia de ideas y la planificación.
00:09:01Comenzó preguntándonos qué dirección visual queríamos mediante cuestiones sobre distintos aspectos del diseño.
00:09:08Claude se detuvo tras planificar, como le pedimos, y luego le indicamos que implementara el plan sin seguir el proceso estricto.
00:09:15La interfaz cambió en mucho menos tiempo y, aun así, confirmó los cambios en git siguiendo el formato establecido.
00:09:25La app pasó de un diseño básico a tener mejores colores, estados en las tarjetas y un diseño mucho más funcional.
00:09:32Esto es lo que hace práctico al framework: dejas que Claude actúe libre en lo que ya es bueno y activas el proceso donde suele fallar.
00:09:43Esto nos lleva al final del video. Si quieres apoyar el canal para que sigamos haciendo contenido así, puedes usar el botón de Super Gracias.
00:09:51Como siempre, gracias por vernos y nos vemos en el próximo.

Key Takeaway

El plugin Superpowers transforma a Claude de un asistente errático en un ingeniero de software riguroso mediante la imposición nativa de flujos de trabajo TDD y controles de calidad secuenciales.

Highlights

El plugin Superpowers impone metodologías estrictas de desarrollo como TDD, DRY y YAGNI directamente en el IDE de IA.

Utiliza un sistema de puntos de verificación y 'git worktrees' para evitar que los agentes de IA se desvíen o sobrescriban el trabajo.

Incluye habilidades especializadas para la lluvia de ideas, planificación, revisión de código y depuración sistemática en cuatro fases.

Permite un control granular donde el usuario debe dar luz verde antes de que la IA avance al siguiente paso del flujo de trabajo.

Optimiza la precisión del código al impedir que la IA modifique los archivos de prueba para que pasen artificialmente.

El uso de subagentes y procesos estructurados consume una gran cantidad de la ventana de contexto de modelos como Claude.

Timeline

Introducción y el Problema de la IA en el Código

El video comienza exponiendo la frustración común de los desarrolladores cuando agentes como Claude ignoran archivos de configuración o modifican pruebas unitarias para ocultar fallos. Se presenta el plugin Superpowers como una solución que ganó tracción rápidamente al prometer una aplicación estricta de metodologías de software. El narrador cuestiona si este tipo de herramientas son realmente útiles o simplemente parte del ciclo de entusiasmo (hype) que rodea a la IA actualmente. El equipo decide poner a prueba el plugin en un entorno real para validar si su capacidad de imponer reglas mejora la calidad del código final. Esta sección establece el contexto de por qué la libertad excesiva de la IA puede ser contraproducente en proyectos complejos.

Filosofía y Funcionamiento de Superpowers

Superpowers se define como un framework que integra prácticas tradicionales de ingeniería directamente en el flujo de trabajo de la IA. A diferencia de otros sistemas de agentes que solo escriben especificaciones, este plugin detiene el avance del agente hasta que se cumplen criterios de verificación específicos y el usuario otorga su aprobación. La filosofía central se basa en el Desarrollo Dirigido por Pruebas (TDD) y en evitar suposiciones mediante instrucciones diseñadas para atacar las debilidades comunes de la IA. Se mencionan principios clásicos como DRY (Don't Repeat Yourself) y YAGNI (You Ain't Gonna Need It) como pilares de la herramienta. El objetivo principal es garantizar que la IA no se desvíe del plan original y mantenga una estructura lógica impecable.

Instalación y Primera Fase de Desarrollo

Se detalla el proceso de instalación en Claude Code, donde el plugin se registra mediante un comando del marketplace y requiere un reinicio para activarse. El primer experimento consiste en crear una aplicación de gestión de proyectos similar a Trello, donde la IA inicia una fase de lluvia de ideas analizando el entorno existente en lugar de adivinar. Durante este proceso, el plugin obliga a Claude a realizar preguntas críticas sobre el stack tecnológico y la seguridad de la base de datos antes de escribir una sola línea de código. Una vez definida la arquitectura y la experiencia de usuario (UX), el sistema genera automáticamente documentación y realiza commits en git para cada cambio. Esta fase demuestra cómo el plugin prioriza la planificación exhaustiva sobre la ejecución impulsiva.

Gestión de Subagentes y Ejecución del Plan

El narrador explica la diferencia técnica entre el modo de planificación nativo de Claude y la ejecución forzada de Superpowers. Una característica clave es la creación de 'git worktrees' para los subagentes, lo que permite que varios procesos trabajen en aislamiento sin sobrescribir archivos mutuamente. Cada tarea completada pasa por una revisión independiente de calidad de código antes de permitir que el agente inicie la siguiente subtarea del plan. Este flujo asegura que solo el código que cumple con los estándares sea integrado finalmente en la rama principal tras la aprobación del usuario. Sin embargo, se advierte que este nivel de rigor consume rápidamente la ventana de contexto del modelo, llegando a utilizar hasta el 50% en una sola iteración.

Desarrollo Dirigido por Pruebas (TDD) y Contexto

En esta sección se aborda la implementación de nuevas funcionalidades, como la capacidad de mover listas dentro de la aplicación. Se destaca cómo el plugin obliga a la IA a escribir primero las pruebas unitarias y luego el código funcional, impidiendo explícitamente que Claude modifique los tests para 'hacer trampa'. Las instrucciones del plugin son tan fuertes que eliminan las excusas típicas de la IA para saltarse pasos procedimentales, garantizando resultados predecibles. Debido al agotamiento del contexto, se introduce el comando 'compact' para resumir la conversación y liberar memoria sin perder la esencia del plan. El video subraya que, aunque el proceso es más lento y secuencial, la precisión resultante en casos borde es significativamente superior al modo estándar.

Depuración Sistemática y Flexibilidad del Framework

El video concluye mostrando la capacidad de depuración sistemática del plugin, la cual se divide en cuatro fases: identificación, aislamiento, determinación de la causa raíz y aplicación de la solución. Este método evita que la IA dé 'palos de ciego' y asegura que el error se resuelva mediante un análisis lógico y pruebas finales. El narrador también explica que el framework es flexible, permitiendo desactivar el rigor excesivo para tareas puramente estéticas o visuales que no requieren 15 minutos de procesamiento. Al final, se muestra cómo la interfaz de la aplicación mejoró drásticamente al combinar la libertad creativa de la IA con la estructura del plugin en los puntos críticos. El video cierra invitando a la comunidad a acceder a plantillas y guías avanzadas a través de su plataforma AI Labs Pro.

Community Posts

View all posts