Les agents IA sont imprévisibles… Cette solution les rend déterministes (Archon)
BBetter Stack
Computing/SoftwareSmall Business/StartupsConsumer ElectronicsInternet Technology
Transcript
00:00:00Les agents d'IA deviennent incroyablement puissants, mais ils restent chaotiques.
00:00:04On leur confie la même tâche, et on obtient du code, une qualité et
00:00:09même des décisions radicalement différentes à chaque fois.
00:00:12C'est un peu la réalité du travail avec les agents.
00:00:15Il s'avère que ce n'est pas une fatalité.
00:00:17Voici Archon, capable de faire tourner plusieurs agents en parallèle sans conflits de fusion
00:00:22et avec des résultats cohérents.
00:00:24Je vais vous montrer exactement comment l'installer et comment ça marche d'ici quelques minutes.
00:00:30En utilisant Claude code, Cursor ou Codex, on sait que le premier essai est souvent top.
00:00:39Mais le deuxième peut donner un plan totalement différent.
00:00:42Le contexte peut dériver.
00:00:44L'agent change de direction à mi-parcours.
00:00:47Puis vous essayez de passer à l'échelle.
00:00:49Deux agents, peut-être trois, puis quatre.
00:00:51Et voilà, votre repo devient un vrai désordre.
00:00:54Et c'est là que réside le vrai problème.
00:00:55Vous ne gagnez plus vraiment de temps.
00:00:57Vous relancez sans cesse vos prompts.
00:00:58Vous réparez du code cassé, en espérant que cet essai ne va pas tout planter.
00:01:02Si vous développez quoi que ce soit, cela casse littéralement votre vitesse.
00:01:06Archon règle ça avec ce qu'on appelle l'ingénierie de harnais.
00:01:10Au lieu d'espérer que l'agent se comporte bien, vous définissez le processus.
00:01:14Planification, codage, tests, revue, tout est en YAML.
00:01:18Les compétences d'agent sont des packs d'instructions réutilisables chargés automatiquement.
00:01:23Ainsi, au lieu de deviner quoi faire, votre agent suit un système.
00:01:28Si vous aimez les outils de code qui boostent votre workflow, abonnez-vous.
00:01:32Nous publions des vidéos très régulièrement.
00:01:34Très bien, laissez-moi vous montrer maintenant.
00:01:36Ça tourne en local sur mon M4 Pro, pas de cloud.
00:01:40Je peux taper « archonserv ».
00:01:43Cela ouvre cette interface utilisateur.
00:01:45Je vais installer la compétence Archon dans ce repo avec Claude.
00:01:49Maintenant, je lance un workflow simple pour corriger ce problème.
00:01:54Regardez bien cette partie.
00:01:55L'agent trouve la compétence tout seul, charge le workflow et l'exécute étape par étape.
00:02:02Vous pouvez suivre ici dans le terminal ou là-bas sur l'interface.
00:02:04C'est bien plus clair.
00:02:05Il n'y a pas besoin d'ajuster les prompts ici.
00:02:07Même en cas d'échec, vous avez une transparence totale dans l'UI.
00:02:11On voit exactement quelle étape a échoué pour corriger le workflow.
00:02:15C'est bien mieux que le code Claude brut où l'historique de chat devient confus.
00:02:20Ce point est essentiel.
00:02:21Il tourne sur son propre « git work tree », donc il ne touche jamais au main.
00:02:26Le prompt suit son cours et on voit ici la génération s'effectuer.
00:02:29C'est fini, une PR propre, même structure, même résultat.
00:02:33On voit les logs, le parcours des prompts et l'intégralité du résultat.
00:02:38Voilà à quoi ressemble la cohérence.
00:02:40Alors, qu'est-ce qui a vraiment changé ?
00:02:42Eh bien, trois choses ont changé avec Archon.
00:02:45D'abord, les workflows.
00:02:47Archon utilise des DAGs en YAML.
00:02:50Voyez ça comme une check-list que l'agent doit impérativement suivre.
00:02:53Certaines étapes utilisent l'IA, bien sûr.
00:02:56D'autres sont fixes.
00:02:58C'est ce mélange qui apporte la fiabilité.
00:03:00Ensuite, il y a l'isolation.
00:03:01Chaque exécution se fait dans un « git work tree » séparé pour éviter les écrasements.
00:03:06C'est pour cela qu'il n'y a aucun conflit de fusion.
00:03:08Et les compétences : au lieu de saturer les prompts, l'agent charge le contexte automatiquement.
00:03:14Par rapport aux agents bruts, vous éliminez tout cet aspect aléatoire.
00:03:19Comparé à des outils comme, disons, LangChain...
00:03:22LangChain est super, mais Archon est taillé pour le code, pas pour des bots généralistes.
00:03:27Et comparé à des scripts, c'est réutilisable.
00:03:30C'est versionné.
00:03:31C'est découvrable.
00:03:32L'agent ne devine plus ce qu'il doit faire.
00:03:34Il y a tout ce workflow à parcourir.
00:03:36Il suit un système concret.
00:03:38On peut lancer plusieurs agents en même temps sans craindre de casser le repo.
00:03:42On génère des PR qui se ressemblent à chaque fois.
00:03:45Et surtout, on arrête de perdre des connaissances dans l'historique des chats.
00:03:49Votre processus vit désormais dans les workflows, rendant chaque exécution
00:03:55plus cohérente.
00:03:56Grâce à cela, on a des PR propres et des résultats prévisibles.
00:03:58Même entrée, même sortie.
00:04:00C'est ce qui manquait aux agents.
00:04:02Bon, ce n'est pas parfait, d'accord ?
00:04:04Mais quels sont les bons points ?
00:04:05C'est open source, ça tourne super bien en local, surtout sur les puces M, n'est-ce pas ?
00:04:10Certains outils demandent une config VPS.
00:04:13Je n'en ai pas besoin ici.
00:04:14Le YAML rend tout visible.
00:04:16C'est une belle victoire, et les « git work trees » résolvent un vrai problème.
00:04:19Mais là encore, cela implique certaines choses.
00:04:21Il faut réfléchir en amont.
00:04:23Concevoir des workflows demande un peu d'effort et ça évolue encore.
00:04:28Les choses vont changer.
00:04:29Ellas vont évoluer, mais le projet grandit.
00:04:31Et si vous faites juste des prompts rapides, vous n'en avez probablement pas besoin.
00:04:34Ce serait honnêtement une perte de temps.
00:04:36De plus, le modèle utilisé compte toujours.
00:04:38Un meilleur modèle générera évidemment un meilleur résultat.
00:04:42Si vous en avez marre de corriger les erreurs des agents, ça vaut le coup d'essayer.
00:04:46Si vous voulez un outil fiable sur lequel vous n'avez pas à douter, c'est aussi
00:04:50très intéressant.
00:04:52Si vous voulez juste expérimenter... eh bien, c'est ce que je faisais.
00:04:55Je suis resté simple.
00:04:56Ça marche super bien.
00:04:57J'ai pu voir de quoi il s'agissait.
00:04:58Mais si vous voulez vraiment construire avec des agents, c'est l'un des outils les plus
00:05:02puissants que j'ai croisés en ce moment.
00:05:04C'est ce qui transforme ces démos d'agents en quelque chose que l'on peut
00:05:08réellement livrer avec fiabilité, en l'intégrant dans notre workflow.
00:05:13C'est assez simple.
00:05:14Avant, on espérait que l'agent ferait ce qu'il faut, non ?
00:05:16Ça reste un agent.
00:05:17Maintenant, on définit comment il travaille.
00:05:20C'est ce qu'ils promettent, ou du moins ce qu'est l'ingénierie de harnais.
00:05:23Si vous aimez les outils et astuces de code, abonnez-vous à la chaîne Better Stack.
00:05:27On se voit dans une prochaine vidéo.