Les agents IA sont imprévisibles… Cette solution les rend déterministes (Archon)

BBetter Stack
Computing/SoftwareSmall Business/StartupsConsumer ElectronicsInternet Technology

Transcript

00:00:00Les agents d'IA deviennent incroyablement puissants, mais ils restent chaotiques.
00:00:04On leur confie la même tâche, et on obtient du code, une qualité et
00:00:09même des décisions radicalement différentes à chaque fois.
00:00:12C'est un peu la réalité du travail avec les agents.
00:00:15Il s'avère que ce n'est pas une fatalité.
00:00:17Voici Archon, capable de faire tourner plusieurs agents en parallèle sans conflits de fusion
00:00:22et avec des résultats cohérents.
00:00:24Je vais vous montrer exactement comment l'installer et comment ça marche d'ici quelques minutes.
00:00:30En utilisant Claude code, Cursor ou Codex, on sait que le premier essai est souvent top.
00:00:39Mais le deuxième peut donner un plan totalement différent.
00:00:42Le contexte peut dériver.
00:00:44L'agent change de direction à mi-parcours.
00:00:47Puis vous essayez de passer à l'échelle.
00:00:49Deux agents, peut-être trois, puis quatre.
00:00:51Et voilà, votre repo devient un vrai désordre.
00:00:54Et c'est là que réside le vrai problème.
00:00:55Vous ne gagnez plus vraiment de temps.
00:00:57Vous relancez sans cesse vos prompts.
00:00:58Vous réparez du code cassé, en espérant que cet essai ne va pas tout planter.
00:01:02Si vous développez quoi que ce soit, cela casse littéralement votre vitesse.
00:01:06Archon règle ça avec ce qu'on appelle l'ingénierie de harnais.
00:01:10Au lieu d'espérer que l'agent se comporte bien, vous définissez le processus.
00:01:14Planification, codage, tests, revue, tout est en YAML.
00:01:18Les compétences d'agent sont des packs d'instructions réutilisables chargés automatiquement.
00:01:23Ainsi, au lieu de deviner quoi faire, votre agent suit un système.
00:01:28Si vous aimez les outils de code qui boostent votre workflow, abonnez-vous.
00:01:32Nous publions des vidéos très régulièrement.
00:01:34Très bien, laissez-moi vous montrer maintenant.
00:01:36Ça tourne en local sur mon M4 Pro, pas de cloud.
00:01:40Je peux taper « archonserv ».
00:01:43Cela ouvre cette interface utilisateur.
00:01:45Je vais installer la compétence Archon dans ce repo avec Claude.
00:01:49Maintenant, je lance un workflow simple pour corriger ce problème.
00:01:54Regardez bien cette partie.
00:01:55L'agent trouve la compétence tout seul, charge le workflow et l'exécute étape par étape.
00:02:02Vous pouvez suivre ici dans le terminal ou là-bas sur l'interface.
00:02:04C'est bien plus clair.
00:02:05Il n'y a pas besoin d'ajuster les prompts ici.
00:02:07Même en cas d'échec, vous avez une transparence totale dans l'UI.
00:02:11On voit exactement quelle étape a échoué pour corriger le workflow.
00:02:15C'est bien mieux que le code Claude brut où l'historique de chat devient confus.
00:02:20Ce point est essentiel.
00:02:21Il tourne sur son propre « git work tree », donc il ne touche jamais au main.
00:02:26Le prompt suit son cours et on voit ici la génération s'effectuer.
00:02:29C'est fini, une PR propre, même structure, même résultat.
00:02:33On voit les logs, le parcours des prompts et l'intégralité du résultat.
00:02:38Voilà à quoi ressemble la cohérence.
00:02:40Alors, qu'est-ce qui a vraiment changé ?
00:02:42Eh bien, trois choses ont changé avec Archon.
00:02:45D'abord, les workflows.
00:02:47Archon utilise des DAGs en YAML.
00:02:50Voyez ça comme une check-list que l'agent doit impérativement suivre.
00:02:53Certaines étapes utilisent l'IA, bien sûr.
00:02:56D'autres sont fixes.
00:02:58C'est ce mélange qui apporte la fiabilité.
00:03:00Ensuite, il y a l'isolation.
00:03:01Chaque exécution se fait dans un « git work tree » séparé pour éviter les écrasements.
00:03:06C'est pour cela qu'il n'y a aucun conflit de fusion.
00:03:08Et les compétences : au lieu de saturer les prompts, l'agent charge le contexte automatiquement.
00:03:14Par rapport aux agents bruts, vous éliminez tout cet aspect aléatoire.
00:03:19Comparé à des outils comme, disons, LangChain...
00:03:22LangChain est super, mais Archon est taillé pour le code, pas pour des bots généralistes.
00:03:27Et comparé à des scripts, c'est réutilisable.
00:03:30C'est versionné.
00:03:31C'est découvrable.
00:03:32L'agent ne devine plus ce qu'il doit faire.
00:03:34Il y a tout ce workflow à parcourir.
00:03:36Il suit un système concret.
00:03:38On peut lancer plusieurs agents en même temps sans craindre de casser le repo.
00:03:42On génère des PR qui se ressemblent à chaque fois.
00:03:45Et surtout, on arrête de perdre des connaissances dans l'historique des chats.
00:03:49Votre processus vit désormais dans les workflows, rendant chaque exécution
00:03:55plus cohérente.
00:03:56Grâce à cela, on a des PR propres et des résultats prévisibles.
00:03:58Même entrée, même sortie.
00:04:00C'est ce qui manquait aux agents.
00:04:02Bon, ce n'est pas parfait, d'accord ?
00:04:04Mais quels sont les bons points ?
00:04:05C'est open source, ça tourne super bien en local, surtout sur les puces M, n'est-ce pas ?
00:04:10Certains outils demandent une config VPS.
00:04:13Je n'en ai pas besoin ici.
00:04:14Le YAML rend tout visible.
00:04:16C'est une belle victoire, et les « git work trees » résolvent un vrai problème.
00:04:19Mais là encore, cela implique certaines choses.
00:04:21Il faut réfléchir en amont.
00:04:23Concevoir des workflows demande un peu d'effort et ça évolue encore.
00:04:28Les choses vont changer.
00:04:29Ellas vont évoluer, mais le projet grandit.
00:04:31Et si vous faites juste des prompts rapides, vous n'en avez probablement pas besoin.
00:04:34Ce serait honnêtement une perte de temps.
00:04:36De plus, le modèle utilisé compte toujours.
00:04:38Un meilleur modèle générera évidemment un meilleur résultat.
00:04:42Si vous en avez marre de corriger les erreurs des agents, ça vaut le coup d'essayer.
00:04:46Si vous voulez un outil fiable sur lequel vous n'avez pas à douter, c'est aussi
00:04:50très intéressant.
00:04:52Si vous voulez juste expérimenter... eh bien, c'est ce que je faisais.
00:04:55Je suis resté simple.
00:04:56Ça marche super bien.
00:04:57J'ai pu voir de quoi il s'agissait.
00:04:58Mais si vous voulez vraiment construire avec des agents, c'est l'un des outils les plus
00:05:02puissants que j'ai croisés en ce moment.
00:05:04C'est ce qui transforme ces démos d'agents en quelque chose que l'on peut
00:05:08réellement livrer avec fiabilité, en l'intégrant dans notre workflow.
00:05:13C'est assez simple.
00:05:14Avant, on espérait que l'agent ferait ce qu'il faut, non ?
00:05:16Ça reste un agent.
00:05:17Maintenant, on définit comment il travaille.
00:05:20C'est ce qu'ils promettent, ou du moins ce qu'est l'ingénierie de harnais.
00:05:23Si vous aimez les outils et astuces de code, abonnez-vous à la chaîne Better Stack.
00:05:27On se voit dans une prochaine vidéo.

Key Takeaway

Archon remplace l'aléatoire des agents IA par une exécution fiable et répétable en utilisant des workflows YAML et l'isolation Git pour garantir une sortie identique à chaque itération.

Highlights

  • Archon transforme le chaos des agents IA en processus déterministes grâce à l'ingénierie de harnais.

  • Le système utilise des fichiers YAML pour définir des workflows structurés sous forme de graphes orientés acycliques (DAG).

  • Chaque tâche s'exécute dans un 'git work tree' isolé afin d'éliminer les conflits de fusion et de protéger la branche principale.

  • L'outil fonctionne localement, notamment sur les puces Apple M4 Pro, sans nécessiter de configuration VPS ou de cloud.

  • Les compétences d'agent sont des packs d'instructions réutilisables qui se chargent automatiquement selon le contexte du dépôt.

  • L'interface utilisateur permet de suivre chaque étape du workflow et d'identifier précisément le point de défaillance en cas d'erreur.

Timeline

Limites de l'imprévisibilité des agents IA actuels

  • Les agents comme Claude Code ou Cursor produisent des résultats incohérents pour une même tâche.
  • La dérive du contexte et les changements de direction en cours de route nuisent à la productivité.
  • Le passage à l'échelle avec plusieurs agents désorganise les dépôts de code et multiplie les corrections manuelles.

L'utilisation brute des agents IA entraîne une perte de temps significative car l'utilisateur doit relancer les prompts et réparer du code cassé. Cette instabilité casse la vitesse de développement au lieu de l'accélérer. Le problème réside dans l'incapacité des agents à maintenir un plan cohérent sur plusieurs essais ou lors de tâches complexes impliquant plusieurs fichiers.

Mécanique de l'ingénierie de harnais avec Archon

  • L'ingénierie de harnais définit strictement le processus de planification, de codage et de test via YAML.
  • Le chargement automatique des compétences supprime la nécessité de deviner les instructions dans les prompts.
  • L'exécution locale garantit la confidentialité et la performance sur le matériel utilisateur.

Une démonstration sur une puce M4 Pro montre que la commande 'archonserv' lance une interface de suivi transparente. L'agent identifie seul les compétences nécessaires dans le dépôt et exécute le workflow étape par étape sans intervention humaine sur les prompts. En cas d'échec, l'utilisateur voit exactement quelle phase a échoué, contrairement aux historiques de chat classiques qui deviennent rapidement confus.

Piliers techniques de la cohérence : Workflows et Isolation

  • Les DAGs en YAML agissent comme des listes de contrôle impératives mélangeant étapes IA et étapes fixes.
  • L'isolation par 'git work tree' sépare chaque exécution pour éviter tout écrasement de données.
  • Les résultats prennent systématiquement la forme de Pull Requests (PR) propres et structurées.

La fiabilité repose sur l'association de tâches déterministes et de flexibilité liée à l'IA. Contrairement à LangChain qui cible des bots généralistes, Archon est optimisé spécifiquement pour le développement logiciel. L'utilisation de workflows versionnés et découvrables permet de conserver la connaissance du processus directement dans le code plutôt que dans des conversations éphémères.

Évaluation de la solution et cas d'usage

  • Archon est une solution open source performante pour les environnements de développement locaux.
  • La conception des workflows demande un effort de réflexion initial supérieur à un prompt simple.
  • Le modèle de langage sous-jacent reste le facteur déterminant de la qualité finale du code généré.

L'outil n'est pas nécessaire pour des requêtes rapides et ponctuelles, car sa mise en œuvre serait chronophage dans ce contexte. En revanche, il devient l'outil le plus puissant pour ceux qui construisent des systèmes basés sur les agents et souhaitent livrer du code en production avec certitude. Il transforme les démonstrations technologiques en outils de travail réels en imposant une méthode de travail stricte à l'intelligence artificielle.

Community Posts

View all posts