ADLC: El nuevo ciclo de vida de Claude Code para la programación con IA
AAI LABS
컴퓨터/소프트웨어경영/리더십AI/미래기술
Transcript
00:00:00Probablemente hayas escuchado una y otra vez que el desarrollo de software ha cambiado,
00:00:03pero el simple hecho de adoptar las nuevas herramientas solo se quedó en la superficie,
00:00:06porque los sistemas que se construyen hoy en día no se comportan como el software antiguo.
00:00:10Por lo tanto, los marcos sobre los que construían las empresas también tuvieron que cambiar,
00:00:14porque si sigues construyendo sobre el proceso antiguo, te enfrentarás a problemas que este no puede resolver.
00:00:18Así que, para adaptarse a este panorama cambiante,
00:00:21ha surgido un nuevo marco en la comunidad de desarrolladores que fue creado pensando en los agentes.
00:00:25Y al final de este video, te guiaremos a través de este nuevo marco de ciclo de vida
00:00:29y por qué necesitas adoptarlo.
00:00:31Durante muchos años, el desarrollo de software se ha realizado utilizando el SDLC.
00:00:35El ciclo de vida del desarrollo de software es un proceso estructurado utilizado durante décadas,
00:00:39que abarca múltiples etapas como diseño, desarrollo, pruebas, implementación, mantenimiento y soporte continuo.
00:00:45La idea central es que el software debe desarrollarse teniendo en cuenta los objetivos comerciales y los requisitos del usuario,
00:00:51donde el resultado de cada fase se convierte en la entrada de la siguiente.
00:00:54Pero esto solo funcionó hasta que la IA entró en el espacio tecnológico.
00:00:57Desde que la IA empezó a ganar terreno, lo primero que empezó a reemplazar fue la programación.
00:01:02Antes de la IA, el desarrollo consistía en escribir código una y otra vez,
00:01:06a menudo un proceso repetitivo de fusionar fragmentos y lógica de otros lugares para construir un sistema que resolviera el problema.
00:01:12Así, a medida que los modelos mejoraron y herramientas como Claude Code y Cursor comenzaron a dominar la industria,
00:01:18el SDLC por sí solo ha fallado.
00:01:20No puede sostenerse por sí mismo y necesita cambiar para aportar un valor real.
00:01:24Por eso se desarrolló el Ciclo de Vida del Desarrollo Agéntico, o ADLC.
00:01:28Este puente une la brecha entre el SDLC y el panorama tecnológico actual.
00:01:32El ADLC era necesario porque en los sistemas donde se utilizaba el SDLC,
00:01:36ya conocías el comportamiento del sistema al momento de la planificación y había formas de verificarlo.
00:01:41En pocas palabras, el SDLC trata al software como una pieza estática, mientras que el ADLC lo trata como un sistema vivo.
00:01:47Ahora, dado que los agentes de IA son impredecibles y son ellos quienes realmente evolucionan al razonar y adaptar tareas
00:01:53al entorno en el que se encuentran, resulta difícil evaluarlos con las mismas métricas que usa el software tradicional.
00:01:59La razón principal por la que se desarrolló el ADLC es la naturaleza no determinista de un agente de IA en producción.
00:02:05Con los agentes de IA, hay un aprendizaje constante y un desarrollo continuo,
00:02:09y no se puede determinar de antemano cómo será el resultado del agente.
00:02:12Cuando trabajas con IA, las decisiones que tomas dependen del prompt, del contexto, de los modelos
00:02:16y de todas las herramientas externas que tengas conectadas.
00:02:18Los modelos por sí solos siguen siendo impredecibles, por lo que no podemos determinar qué devolverá un prompt con un 100 % de precisión.
00:02:25Debido a esto, básicamente tienes métricas de éxito diferentes a las que utiliza el SDLC.
00:02:29El ADLC consta de 7 fases, y cada una se mapea directamente con la fase correspondiente del SDLC de una forma u otra.
00:02:36Ya sea que estés trabajando en un sistema agéntico o no, el primer paso siempre sigue siendo la planificación.
00:02:41Lo que cambia es cómo lo haces.
00:02:43Para los agentes, no puedes planificar de la misma manera que lo harías para sistemas no agénticos,
00:02:46porque a diferencia de los sistemas tradicionales, el flujo de la lógica no se aplica de la misma forma.
00:02:51Así, la primera fase del ADLC, la preparación e hipótesis,
00:02:54tiene como objetivo construir una comprensión sólida del problema antes de comprometerse con cualquier diseño de sistema o modelo.
00:02:59Cuando se trata de agentes, necesitas entender cómo interactuarán los usuarios con el sistema
00:03:04y coordinar con todas las partes interesadas para identificar dónde se interrumpe el flujo de trabajo
00:03:07y en qué consiste el esfuerzo manual repetitivo, ya que esto es lo que el agente realmente resolverá.
00:03:12Luego, revisas los flujos de trabajo y las políticas existentes para ver cómo se manejan las cosas actualmente,
00:03:16y una vez que eso está claro, formulas hipótesis comprobables sobre dónde los agentes asistirán o automatizarán el flujo de trabajo.
00:03:22Si nos saltamos esta fase por completo, terminaríamos automatizando el trabajo equivocado,
00:03:26y en lugar de solucionar el problema, podríamos empeorar las cosas.
00:03:28La diferencia en comparación con el SDLC aquí es el comportamiento.
00:03:31En el SDLC, el comportamiento se podía predecir porque la misma entrada siempre daba la misma salida.
00:03:37Pero el ADLC es probabilístico debido a la participación del modelo,
00:03:40y las mismas entradas pueden no llevar nunca exactamente a la misma salida.
00:03:43Sabiendo esto, el primer paso que debes dar es activar el modo de planificación
00:03:47y hacer que cualquier agente que estés usando planifique el comportamiento del agente que estás desarrollando, no la implementación.
00:03:52Indícale que no piense en el código y que, en su lugar, trace todo el flujo de trabajo,
00:03:56cómo interactúan los agentes con los usuarios, qué podría salir mal, qué sobrecarga podría haber
00:04:00y todas las demás suposiciones sobre el sistema.
00:04:03De esa manera, el proceso de construcción de tu agente comienza con las suposiciones fundamentales,
00:04:06las cuales se convierten en una mejor guía que saltar directamente a la planificación de la arquitectura.
00:04:10Una vez terminada la planificación inicial, hay otra capa justo después,
00:04:13donde se identifica correctamente el alcance y el problema.
00:04:16Esto en realidad se mapea con la fase de análisis o estudio de viabilidad del SDLC,
00:04:20donde solías analizar los requisitos comerciales y si la implementación era viable.
00:04:25Así, esta fase del ADLC se traduce en identificar los procesos importantes y el papel de la IA para resolverlos,
00:04:31marcando las restricciones y los límites técnicos,
00:04:33y definiendo claramente los KPIs comerciales y técnicos desde el principio, como tiempo, costo, latencia y viabilidad.
00:04:39También defines los compromisos en este punto, sabiendo qué factores son aceptables y cuáles no.
00:04:44Pero la parte más importante de esta fase es mapear correctamente el modelo de responsabilidad humano-agente,
00:04:49porque esto crea una estructura de rendición de cuentas.
00:04:52Un humano todavía necesita revisarlos, porque no podemos confiar todas las decisiones a un agente.
00:04:56Al final de esta fase, tienes la documentación adecuada donde los pasos del flujo de trabajo se definen explícitamente con KPIs clave,
00:05:02y el modelo de responsabilidad humano-agente queda claramente establecido.
00:05:05Esto importa porque, en caso de cualquier falla, no puedes culpar por completo al modelo.
00:05:09La responsabilidad final debe seguir siendo de los humanos.
00:05:12Esta planificación de la responsabilidad humana no era necesaria anteriormente, porque no había IA involucrada.
00:05:17Define los límites de autonomía del agente, y si te saltas este paso,
00:05:21estás arriesgando tu propio cumplimiento y responsabilidad en producción.
00:05:24Para hacer esto con agentes, vuelves a usar el modo de planificación, indicándole que planifique flujos de trabajo, latencia, problemas del sistema,
00:05:30todas las características que deben estar en la arquitectura y cómo podría ser una falla.
00:05:34Una vez que esto se establece claramente, el agente comprende el alcance correcto hacia el cual iterar mientras construye.
00:05:39Con el alcance y las características de alto nivel definidas, es hora de pasar a la fase de diseño.
00:05:43In esta etapa, estamos definiendo la arquitectura del sistema para el agente en sí.
00:05:47Aquí decides qué patrón seguirá el agente, como "ReAct", "plan-and-act", una configuración multiagente o el enfoque que desees.
00:05:54Luego planificas el flujo de datos de un punto a otro, y esto se vuelve mucho más crucial con la participación de múltiples agentes.
00:06:00El agente debe recibir los datos correctos; de lo contrario, creará problemas en lugar de ayudar.
00:06:05También planificas las estructuras de costos, como la economía de tokens, las funciones de edición de contexto, la compactación,
00:06:10y entiendes cómo será el costo de implementar este agente en producción,
00:06:14y qué sucederá cuando comience a manejar a múltiples usuarios.
00:06:17Aquí también es donde realmente eliges qué modelos deseas usar, con qué marco de orquestación vas a trabajar,
00:06:23la base de datos y todas las demás tecnologías involucradas, y es aquí donde defines cómo será el éxito
00:06:28antes de escribir cualquier línea de código, para que puedas construir el agente con TDD.
00:06:32Antes de que tu sistema se ponga en marcha, ya habrás considerado los compromisos en latencia, precisión, alucinaciones y problemas similares.
00:06:38Esta fase también necesita el modo de planificación de tu agente.
00:06:41Le das prompts para diseñar un esquema integral que cubra la arquitectura del agente, el flujo de datos, el modelo de costos
00:06:46y la estructura técnica general, de modo que pases al siguiente paso con un plan concreto.
00:06:51Una vez hechos los planes iniciales, el siguiente paso es la simulación y la prueba de valor.
00:06:55Aquí utilizas datos del mundo real para probar las suposiciones que hiciste en las etapas anteriores.
00:06:59Creas prototipos para poder determinar si vale la pena seguir adelante con la construcción de este agente.
00:07:04Básicamente, aquí es donde decides si debes desarrollar el agente o no, porque en esta etapa el costo del fracaso es mucho menor.
00:07:10Por lo tanto, las actividades principales aquí incluyen preparar el conjunto de datos o la verdad fundamental para las pruebas de comportamiento,
00:07:15construir prototipos para poder probar las suposiciones de alto riesgo que documentaste previamente,
00:07:19y validar la calidad de los datos, la tasa de alucinación, la precisión, la calidad de la respuesta y los puntos de referencia.
00:07:25También vuelves a revisar la hipótesis inicial para determinar si proporcionará un retorno de la inversión.
00:07:30Los entregables son líneas base de rendimiento y costos debidamente medidas,
00:07:33junto con el documento de verdad fundamental mencionado antes, que actúa como un activo de prueba para pruebas de regresión y ajuste fino del modelo.
00:07:40Esta fase actúa como una puerta de validación.
00:07:42Si tus resultados pasan de aquí a la siguiente etapa, puedes continuar trabajando en el agente.
00:07:46Si no, la construcción es un fracaso, y descubrirlo temprano es mucho mejor,
00:07:50porque si esto llegara a producción, el daño sería mucho peor.
00:07:54Para hacer esto, le pides a tu agente de IA que cree el primer prototipo para que puedas probarlo con toda la planificación que acabas de hacer.
00:08:00Pero antes de seguir adelante, escuchemos unas palabras de nuestro patrocinador, Softr.
00:08:04Las herramientas de "vibe coding" son excelentes para generar una interfaz de usuario, pero en el momento en que necesitas autenticación real,
00:08:08roles de usuario, permisos o una base de datos que realmente escale, todo se desmorona y vuelves a escribir código.
00:08:14Softr es un creador de aplicaciones con IA que maneja todo eso con un solo prompt.
00:08:18Describes lo que necesitas en inglés sencillo y el co-creador de IA genera todo el stack, la base de datos, las páginas, la navegación, el inicio de sesión y los permisos basados en roles, todo a la vez.
00:08:28Estas no son páginas de prototipo, realmente funcionan.
00:08:30Puedes previsualizar la aplicación, verificar lo que ve cada rol de usuario y, cuando presionas publicar, tu aplicación está en vivo con hosting, grupos de usuarios, seguridad de nivel empresarial y control de acceso asegurados.
00:08:40Y no necesitas un desarrollador para mantenerla.
00:08:42Todo es visual, por lo que puedes actualizar los flujos de trabajo, administrar usuarios y agregar funciones tú mismo.
00:08:47El costo real del software no es construirlo, es mantenerlo, y eso es lo que resuelve Softr.
00:08:52Obtén tus créditos de IA gratuitos haciendo clic en el enlace de la descripción y comienza ya.
00:08:57Esto marca el final de la fase de planificación y nos lleva a la parte a la que mucha gente salta directamente, que es la implementación.
00:09:03Los pasos anteriores son realmente importantes porque si los has hecho correctamente, no te toparás con los problemas que la mayoría de la gente encuentra aquí por saltarse esas fases.
00:09:11Así que este es el momento en el que realmente desarrollas tu agente, construyes la lógica central y orquestas tu flujo de trabajo de desarrollo.
00:09:16Y aquí ves una de las divisiones más claras entre el SDLC y el ADLC.
00:09:20En el SDLC, la lógica vive en el código, la configuración y las dependencias de terceros.
00:09:25En el ADLC, esa lógica se distribuye a través del código, los prompts, los modelos, las herramientas y los servicios externos.
00:09:30Por lo tanto, ya no solo estás gestionando software, estás gestionando todas estas capas juntas, y cualquiera de ellas puede cambiar el comportamiento del sistema.
00:09:38Si tienes sistemas multiagente que desarrollar, una forma de orquestar tus flujos de trabajo es la nueva vista de agentes en Claude Code.
00:09:44Usando la vista de agentes, puedes delegar tareas mucho mejor que con el uso regular de Claude.
00:09:49Porque en lugar de gestionar diferentes sesiones de Claude Code, gestionas una única capa de orquestación y le das prompts al administrador de agentes para coordinar a todos los agentes a través de ella.
00:09:57En este punto, integras herramientas como MCPs y APIs.
00:10:01Por ejemplo, si estás construyendo un asistente personal, sabes que necesitará algo como un MCP de Google Calendar, un MCP de Gmail y tal vez un MCP de Notion.
00:10:09Y lo más importante aquí es la gestión del contexto.
00:10:11Porque una vez que construyes un agente para producción, se convierte en uno de los aspectos más críticos.
00:10:16Incluso las ventanas de contexto más grandes disponibles en este momento, como las de 1 millón de tokens en Gemini y Opus, aún requieren un manejo cuidadoso.
00:10:24Debes asegurarte de que el agente retenga la memoria correcta y evite la degradación del contexto.
00:10:28Porque si termina con demasiada información irrelevante, su atención se dispersa por todas partes y los resultados empeoran.
00:10:34También necesitas realizar pruebas desde el lado del desarrollador durante esta etapa para garantizar la consistencia del comportamiento después de cada cambio, validando manualmente la configuración del agente frente a los requisitos.
00:10:44El desarrollo y la validación no están separados en los sistemas agénticos.
00:10:48No puedes avanzar sin pruebas constantes, ya que incluso un pequeño cambio puede tener un gran efecto en todo el flujo de trabajo.
00:10:54Así que necesitas una validación a nivel de desarrollador mientras construyes tu agente en paralelo, en lugar de confiar solo en una etapa de prueba posterior.
00:11:01Después de terminar de construir tu sistema, las pruebas se convierten en la siguiente fase.
00:11:05Como se mencionó antes, las pruebas deben ser continuas durante el proceso de construcción, pero una vez construido el sistema, lo pruebas en condiciones similares a las de producción en lugar de como componentes individuales.
00:11:14Esta es la etapa donde realizas las pruebas integradas.
00:11:16También realizas pruebas de aceptación del usuario, donde recopilas comentarios de los usuarios reales del sistema y los incorporas de nuevo al mismo.
00:11:24Haces pruebas a través de múltiples factores como sesgo, cumplimiento, rendimiento y otras dimensiones relacionadas con el riesgo para garantizar que el lanzamiento sea seguro antes de que entre en funcionamiento.
00:11:32Y aquí también es donde las métricas de éxito cambian por completo.
00:11:35En el SDLC, medías la corrección funcional con pruebas que simplemente pasaban o fallaban.
00:11:40En el ADLC, mides la distribución de la precisión, la tasa de alucinación y el costo por resultado, porque nada de eso se reduce limpiamente a un simple aprobado o reprobado.
00:11:48El paradigma de prueba en sí se mueve con ello.
00:11:50En el SDLC, pruebas predefinidas validaban rutas de código conocidas.
00:11:54En el ADLC, eso se convierte en una evaluación continua del razonamiento, la seguridad y el uso de herramientas, porque el agente no recorre la misma ruta dos veces de la misma manera.
00:12:02Existen múltiples marcos de evaluación como RAGAS y DEEPVAL, pero lo principal que verifica la corrección es cómo se desempeñan tus datos frente a las métricas que definiste anteriormente.
00:12:12Y hay varias formas de probar un sistema agéntico, incluyendo pruebas funcionales, no funcionales, estructurales y de carga.
00:12:18Cada una de estas debe llevarse a cabo minuciosamente, a menudo utilizando sistemas agénticos mismos para que los casos extremos se identifiquen correctamente y se solucionen antes de llegar a producción.
00:12:27Además, si estás disfrutando de nuestro contenido, considera presionar el botón de "hype" porque nos ayuda a crear más contenido como este y llegar a más personas.
00:12:34Una vez que tu sistema está listo, es hora de implementarlo y ponerlo a disposición del mundo real.
00:12:39No lo implementas directamente y lo das por terminado, porque con los sistemas agénticos hay mucho más involucrado.
00:12:44Para un sistema normal, la implementación generalmente significa subirlo a producción y monitorear la salud del sistema.
00:12:49Para los sistemas agénticos, es completamente diferente, y aquí es donde cambia el significado mismo de la implementación.
00:12:54En el SDLC, la implementación era el final del desarrollo y el comienzo de una fase operativa estable, el punto donde el software entraba en sus años de madurez constante.
00:13:02En el ADLC, la implementación es el comienzo del monitoreo y control activos, condicionados por actualizaciones de modelos, desviación de contexto y cambios en el entorno que se siguen moviendo incluso después de hacer el cambio.
00:13:11Así que, aunque el desarrollo esté completo, esta etapa es aún más crítica porque ahora tienes que monitorear activamente las métricas de comportamiento y del sistema.
00:13:19También necesitas reglas de alerta que vigilen constantemente los problemas de calidad, seguridad y rendimiento para que puedan detectarse a tiempo, antes de que se conviertan en errores de producción a gran escala.
00:13:28La implementación es esencialmente una activación controlada con observación continua mientras los usuarios reales interactúan con el sistema.
00:13:34En lugar de enfocarte solo en la salud del sistema, te enfocas en el rendimiento del comportamiento para que los problemas se detecten temprano, antes de llegar a todos los usuarios.
00:13:41En la práctica, primero lanzas el sistema a un grupo limitado de usuarios y dejas que lo usen en condiciones reales.
00:13:46Luego observas cómo responde el sistema agéntico a lo largo del tiempo antes de implementarlo gradualmente para todos.
00:13:52Después de que la implementación ha pasado por todos los procesos, se convierte en un ciclo continuo de mantenimiento, aprendizaje continuo y crecimiento.
00:13:58Esta es una etapa importante porque mantiene al agente preciso y alineado con las necesidades del mundo real.
00:14:03Con los sistemas tradicionales, los bucles de retroalimentación son relativamente simples.
00:14:06Un usuario reporta un error y un desarrollador itera sobre él y lo soluciona.
00:14:10Con los sistemas agénticos, es bastante diferente porque se basan en un proceso de mejora continua que no se detiene en ningún momento.
00:14:16El ciclo sigue refinando el modelo y todas las señales negativas se retroalimentan para que pueda mejorar su comportamiento con el tiempo.
00:14:22Esto se hace típicamente a través de señales en la interfaz de usuario como pulgar hacia arriba y pulgar hacia abajo para capturar cómo se siente el usuario después de una respuesta.
00:14:29Muchos sistemas de producción ya utilizan mecanismos similares, como seleccionar entre múltiples salidas o clasificar respuestas, como se ve en herramientas como ChatGPT o los sistemas de retroalimentación en Claude.
00:14:39Estas señales se introducen de nuevo en el sistema agéntico para que pueda aprender e iterar hacia un mejor rendimiento.
00:14:44También hay una actualización periódica de las fuentes de datos y de los embeddings para garantizar que el sistema se mantenga actualizado y no sufra por información obsoleta.
00:14:52La alineación debe ser monitoreada constantemente para que la seguridad y las barandillas sigan siendo efectivas contra todo tipo de prompts, incluyendo riesgos como la inyección de prompts.
00:15:00Las variables clave aquí son la gestión continua de costos, el seguimiento de la calidad, los backlogs de mejora del producto y las actualizaciones de modelos, todo lo cual debe mantenerse continuamente para que el sistema siga siendo estable, seguro y operativo a lo largo del tiempo.
00:15:11Eso nos lleva al final de este video.
00:15:13Si deseas apoyar al canal y ayudarnos a seguir haciendo videos como este, puedes hacerlo usando el botón de "Súper gracias" abajo.
00:15:20Como siempre, gracias por mirar y los veré en el próximo.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video