Log in to leave a comment
No posts yet
Al comenzar con el desarrollo basado en agentes, lo más temible no es el rendimiento, sino el extracto de la tarjeta de crédito del próximo mes. Los agentes duales que se ven en los videos son fantásticos, pero usarlos sin pensar es la receta perfecta para una bomba de costos de API. En 2026, el precio de entrada de Claude 4.6 Opus es de 3.00). El costo de salida se dispara hasta los $25.00. En un proyecto legado que supera los 100,000 tokens, cada vez que el bucle gira, básicamente se está gastando el precio de una taza de café.
Para controlar los costos, no te limites a usar solo Opus; utiliza un sistema de asignación de slots. Reserva a Opus solo para el diseño y las decisiones de arquitectura, que representan el 20% del trabajo total, y deja la implementación simple del 80% restante en manos de Sonnet.
--model opus solo en sesiones donde la lógica compleja esté enredada. Es necesario crear el hábito de abrir el reporte de la API cada lunes por la mañana para verificar si el gasto real sigue la curva prevista.El 70% de los tokens que consumen los agentes se desperdician en realidad buscando archivos innecesarios y explorando directorios. Los LLM muestran un fenómeno de "acantilado de rendimiento" donde su capacidad de concentración cae drásticamente cuando el contexto supera los 100,000 tokens. Meter todo el código fuente es el camino más rápido para tirar el dinero y arruinar el rendimiento. Según los resultados de las pruebas internas de Anthropic, al entregar el contexto comprimido, la calidad del razonamiento se mantiene mientras que el costo de entrada se reduce en más del 50%.
Crea un ARCH.md, que sirva como especificación exclusiva para la IA, para darle un mapa al agente.
tree -L 3 -I 'node_modules|dist|.git' > tree.md. Luego, utiliza herramientas como Repomix para crear un mapa de firmas que omita la lógica real y conserve solo las firmas de funciones y definiciones de interfaces. Finalmente, asegúrate de anotar claramente activos como .svg y .json en el archivo .claudeignore para quitarlos de la vista del agente.La clave del agente dual es crear un mecanismo de seguridad separando el diseño (Advisor) de la implementación (Executor). Si simplemente pides "revisa este código", solo obtendrás respuestas vacías como "se ve bien". Como ingeniero senior, debes obligar al Advisor a asumir el rol de un crítico malicioso. Solo con pasar correctamente por esta etapa, puedes reducir drásticamente el tiempo de corrección de errores post-despliegue, que suele tomar más de 5 horas semanales.
Crea un dispositivo para que Opus realice una revisión crítica antes de que el modelo de ejecución toque el código.
Alinear al Advisor y al Executor crea tiempos de espera cada vez que se requiere validación. En refactorizaciones a gran escala que requieren modificar cientos de archivos, este método es demasiado lento. Al migrar librerías de más de 50,000 líneas, se necesita una orquestación que divida el trabajo y lo ejecute en paralelo.
El proceso paralelo para acelerar el trabajo se diseña de la siguiente manera:
git worktree add. Inicia sesiones de Claude Code separadas en cada worktree para refactorizar diferentes módulos simultáneamente. Al final, utiliza herramientas como Clash para resolver conflictos entre worktrees y fusionarlos en la rama principal.A medida que se acumula el código escrito por IA, surge un momento en que la estructura general se desordena, generando deuda técnica. Los agentes corrigen un archivo de manera magistral, pero no se responsabilizan de la dirección en la que debe ir el sistema completo. En 2026, el verdadero trabajo de un ingeniero senior no es escribir código directamente, sino gestionar el estado de alineación de los resultados creados por los agentes.
Cada viernes antes de terminar la jornada, realiza una rutina de "auditoría de arquitectura".