Log in to leave a comment
No posts yet
La chose la plus effrayante lorsqu'on commence le codage basé sur des agents n'est pas la performance, mais le relevé de carte de crédit du mois prochain. Les doubles agents vus en vidéo sont fantastiques, mais une utilisation irréfléchie est le meilleur moyen de recevoir une bombe de frais d'API. En 2026, le coût d'entrée de Claude 4.6 Opus est de 3.00). Les coûts de sortie grimpent jusqu'à $25.00. Dans un projet hérité dépassant les 100 000 tokens, chaque boucle effectuée revient au prix d'une tasse de café.
Pour contrôler les coûts, ne vous obstinez pas à utiliser uniquement Opus ; utilisez une méthode d'allocation de créneaux. Placez Opus uniquement pour la conception et les décisions d'architecture (20 % du travail total) et confiez les 80 % restants de l'implémentation simple à Sonnet.
--model opus que lors des sessions où la logique complexe s'emmêle. Prenez l'habitude d'ouvrir le rapport API chaque lundi matin pour vérifier si les dépenses réelles suivent la courbe prévue.En réalité, 70 % des tokens utilisés par un agent sont gaspillés à fouiller des fichiers inutiles et à explorer des répertoires. Les LLM montrent un phénomène de "falaise de performance" où la concentration chute drastiquement lorsque le contexte dépasse 100 000 tokens. Injecter tout le code source est le chemin le plus court pour jeter de l'argent par les fenêtres et ruiner les performances. Selon les tests internes d'Anthropic, la transmission d'un contexte compressé maintient la qualité du raisonnement tout en réduisant les coûts d'entrée de plus de 50 %.
Créez un ARCH.md, une spécification dédiée à l'IA, pour donner une carte à l'agent.
tree -L 3 -I 'node_modules|dist|.git' > tree.md. Ensuite, utilisez un outil comme Repomix pour créer une carte des signatures, en ne laissant que les signatures de fonctions et les définitions d'interfaces sans la logique réelle. Enfin, inscrivez clairement les assets comme .svg ou .json dans le fichier .claudeignore pour les retirer de la vue de l'agent.L'essentiel du double agent est de créer des dispositifs de sécurité en séparant la conception (Advisor) et l'implémentation (Executor). Si vous demandez simplement "fais une revue de code", vous n'obtiendrez que des réponses sans âme du type "C'est propre". En tant qu'ingénieur senior, vous devez forcer l'Advisor à jouer le rôle d'un critique malveillant. Passer correctement par cette étape permet de réduire considérablement le temps passé à corriger des bugs après coup, qui prenait auparavant plus de 5 heures par semaine.
Avant que le modèle d'exécution ne touche au code, créez un dispositif obligeant Opus à effectuer une revue critique.
Si l'Advisor et l'Executor sont alignés en file indienne, un temps d'attente se crée à chaque vérification. Ce mode est trop lent pour les refactorisations à grande échelle nécessitant la modification de centaines de fichiers. Pour la migration de bibliothèques de plus de 50 000 lignes, une orchestration est nécessaire pour diviser les tâches et les exécuter en parallèle.
Organisez le processus parallèle pour accélérer le travail comme suit :
git worktree add. Lancez des sessions Claude Code distinctes dans chaque worktree pour refactoriser différents modules simultanément. Enfin, fusionnez-les dans la branche principale en gérant les conflits entre worktrees avec des outils comme Clash.Au fur et à mesure que le code écrit par l'IA s'accumule, une dette technique apparaît où la structure globale finit par devenir chaotique. Un agent répare merveilleusement un fichier, mais ne prend pas la responsabilité de la direction globale du système. En 2026, la véritable tâche d'un ingénieur senior n'est pas de taper le code lui-même, mais de gérer l'alignement des résultats produits par les agents.
Chaque vendredi avant de partir, effectuez une routine d'"audit d'architecture".