Log in to leave a comment
No posts yet
Le paradigme de l'ingénierie logicielle est en train de changer. Ce projet, mené par Nicholas Carlini, chercheur chez Anthropic, ne s'est pas contenté de demander à une IA de coder. En mobilisant 16 instances de Claude Opus 4.6, il a réussi à construire à partir de zéro un compilateur C basé sur Rust, avec une intervention humaine minimale.
Le résultat final se compose de 100 000 lignes de code et a permis de compiler le noyau Linux 6.9 ainsi que d'exécuter le jeu classique Doom. Cependant, plus important que l'aspect spectaculaire, ce sont les limites et les possibilités des flux de travail agentiques découvertes en investissant 20 000 $ (environ 27 millions de wons) en frais d'API. Au-delà de la simple rédaction de prompts efficaces, nous analysons ici la réalité de l'ingénierie permettant de contrôler et de faire collaborer les IA de manière systémique.
Dans la programmation de systèmes complexes, un agent unique atteint rapidement les limites de sa fenêtre de contexte. En effet, au fil du temps, l'historique des conversations passées génère des hallucinations qui parasitent les décisions présentes. Pour résoudre ce problème, Carlini a mis en place 16 conteneurs Docker indépendants ainsi qu'une boucle RALF (Refresh, Act, Learn, Feedback).
README.md et poussés sur Git pour synchroniser les connaissances.Le plus grand risque lors du déploiement simultané de 16 agents est le gaspillage de ressources. Si deux agents tentent de corriger le même bug, cela entraîne non seulement des conflits de code, mais aussi un doublement des frais d'API. Au lieu d'une base de données complexe, Carlini a implémenté un mécanisme de verrouillage (Locking) léger utilisant des drapeaux textuels au sein du dépôt Git.
Avant de commencer une tâche spécifique, l'agent crée un fichier portant le nom de la tâche dans le répertoire current_tasks/. Grâce à la nature atomique des commits Git, la tentative de push d'un autre agent voulant créer le même fichier est rejetée. Ce système simple a permis de bloquer à la racine les situations de compétition (Race Condition) entre agents.
Le point d'orgue de ce projet est l'utilisation de GCC, un outil existant, comme Oracle. Au lieu de laisser l'IA deviner la réponse correcte, cette stratégie impose systémiquement la bonne réponse. Lorsqu'une erreur survenait lors de la compilation du colossal noyau Linux, Carlini a automatisé un algorithme de recherche binaire (Binary Search).
Bien que les résultats soient impressionnants, les performances du compilateur généré n'ont même pas atteint le niveau d'optimisation minimal de GCC (-O0). L'armée d'agents Claude a montré ses limites dans les domaines d'ingénierie de haut niveau suivants :
Du point de vue d'un gestionnaire d'ingénierie, 20 000 $ n'est pas un montant élevé. En effet, une tâche qui aurait nécessité une équipe de 5 experts pendant plus de 3 mois a été achevée en seulement 2 semaines. Cela prouve un rapport qualité-prix environ 10 fois supérieur par rapport aux coûts de main-d'œuvre traditionnels. Pour adopter ce modèle, les entreprises doivent suivre cet arbre de décision.
| Question | Oui | Non |
|---|---|---|
| Le résultat est-il vérifiable objectivement par des tests ? | Passer à l'étape suivante | Adoption inadaptée (risque d'hallucination) |
| Existe-t-il un outil existant comparable (Oracle) ? | Adopter la stratégie de l'Oracle | Surveillance humaine constante nécessaire |
| Le travail est-il divisible en plus de 100 unités ? | Opération d'agents en parallèle | Agent unique recommandé |
progress.json avant la fermeture de l'agent.L'expérience d'Anthropic signifie que le rôle de l'ingénieur est passé de rédacteur de code à concepteur et auditeur de systèmes. Désormais, la compétence clé n'est plus la capacité à coder soi-même un algorithme, mais celle de concevoir des contraintes logiques et des harnais de vérification pour que l'armée d'agents IA ne dévie pas de sa trajectoire.
Le coût de 20 000 $ n'est pas une simple dépense, c'est un jalon qui montre le plafond de l'automatisation que l'IA peut atteindre lorsqu'elle est soutenue par une conception humaine sophistiquée. Les entreprises ne doivent plus se laisser absorber uniquement par l'autonomie de l'IA, mais se concentrer sur la systématisation du pilotage stratégique humain.