Le codage IA entre dans une nouvelle ère

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Opus 4.6 était-il la seule mise à jour d'Anthropic ?
00:00:03Vous connaissez déjà les sous-agents, où chaque agent opère comme une entité individuelle avec
00:00:07sa propre fenêtre contextuelle.
00:00:09Mais ces sous-agents échouaient lorsqu'une tâche nécessitait une coordination entre eux.
00:00:13Dans ces cas-là, l'orchestrateur devait intervenir, récupérant les réponses d'un agent pour les
00:00:17déléguer à un autre, ou les agents devaient s'appuyer sur des notes dans le dossier du projet.
00:00:21À cause de ce déficit de communication, des tâches simples devenaient trop compliquées.
00:00:25Pour y remédier, Anthropic a lancé une mise à jour des sous-agents appelée “Agent-Teams”.
00:00:30Elles ont été lancées parallèlement à Opus 4.6.
00:00:33Bien qu'il s'agisse d'une fonctionnalité expérimentale, nous l'avons implémentée dans plusieurs flux de travail,
00:00:37et l'amélioration majeure a été une réduction considérable du temps d'exécution des tâches.
00:00:41Mais c'est expérimental pour une raison et il reste des points à améliorer, et nous avons trouvé
00:00:44quelques solutions pour ces problèmes également.
00:00:47Agent-Teams repose sur l'idée de faire travailler ensemble plusieurs instances de Claude Code.
00:00:51Chaque membre de l'équipe travaille sur des tâches isolées sous une gestion centralisée contrôlée
00:00:55par un seul agent.
00:00:56Vous pourriez penser que cela ressemble aux sous-agents Claude déjà existants car
00:01:00les deux fonctionnent en parallèle et divisent les tâches, mais ils sont différents.
00:01:03C'est parce qu'Agent-Teams a résolu le problème majeur du framework des sous-agents.
00:01:08Les sous-agents ne peuvent pas communiquer entre eux et dépendent de l'agent orchestrateur
00:01:12pour servir de support de communication.
00:01:15Les membres de l'équipe, en revanche, sont capables de communiquer entre eux.
00:01:18L'idée centrale derrière Agent-Teams est d'avoir plusieurs sessions Claude Code collaborant.
00:01:22Une session agit comme chef d'équipe, coordonnant le travail, assignant les tâches et synthétisant les résultats,
00:01:27tandis que les coéquipiers travaillent indépendamment dans leurs propres fenêtres contextuelles.
00:01:31Les sous-agents ont leur propre fenêtre contextuelle et rapportent le résultat à l'appelant.
00:01:34Mais pour les équipes, cela fonctionne différemment.
00:01:36Chaque membre de l'équipe d'agents est une session de terminal totalement indépendante.
00:01:40Ils ne sont pas limités ou coordonnés par un orchestrateur qui se contente de diviser les tâches.
00:01:43Au lieu de cela, ces sessions de terminal sont ouvertes et fermées par le chef d'équipe principal.
00:01:47Ils peuvent travailler sur des tâches nécessitant discussion et collaboration entre agents
00:01:52grâce à leur capacité de communication.
00:01:54Une équipe d'agents se compose donc essentiellement d'un chef d'équipe et de coéquipiers.
00:01:57Le chef d'équipe est l'agent principal qui crée l'équipe et coordonne son travail.
00:02:01Les coéquipiers sont les travailleurs qui exécutent réellement les tâches.
00:02:03Chaque coéquipier reçoit une liste de tâches, qui est une liste d'éléments partagée.
00:02:07Chaque membre identifie ce qu'il doit faire dans cette liste et l'exécute.
00:02:10Pour communiquer, ils disposent également d'une boîte mail partagée pour s'envoyer des messages.
00:02:15La question était de savoir comment cela fonctionne si chaque membre est indépendant.
00:02:19Comment savent-ils ce que font les autres membres ?
00:02:21Cela fonctionne car toutes les informations concernant l'équipe, les membres et les tâches
00:02:26en cours sont stockées localement dans le dossier .claude et identifiées par le nom de la tâche.
00:02:30Cette fonctionnalité est encore expérimentale et désactivée par défaut, il y aura donc des bugs
00:02:34dans la gestion des coéquipiers durant cette phase.
00:02:36Pour l'essayer, nous avons dû l'activer manuellement.
00:02:38Nous avons fait cela en réglant le flag CLI de Claude Code pour les équipes d'agents expérimentales sur 1.
00:02:43Avec ce flag CLI activé, les équipes d'agents étaient prêtes pour les sessions suivantes.
00:02:47Ce flag nous a permis d'accéder à la fonctionnalité d'équipes dans Claude Code.
00:02:51Comme c'est expérimental, nous devions utiliser une formulation spécifique pour dire à
00:02:55Claude que nous voulions utiliser une équipe d'agents pour un travail précis.
00:02:58Notre équipe a commencé à utiliser cela pour paralléliser la revue de code, permettant
00:03:02d'identifier et de corriger les problèmes simultanément.
00:03:04Pour cela, nous avons demandé à Claude d'utiliser un membre pour trouver les problèmes et
00:03:08un autre pour corriger les erreurs identifiées par le premier membre.
00:03:11Nous devions être précis dans le prompt pour qu'il suive la bonne direction.
00:03:15Si des sous-agents géraient cela, ils écriraient un rapport dans un fichier physique
00:03:19pour informer les autres agents de ce qu'il faut corriger.
00:03:21Mais ici, nous voulions accélérer la revue en permettant que cela se produise sans
00:03:26la lourdeur d'écriture dans un fichier local.
00:03:27Quand nous avons soumis le prompt à Claude Code, les membres de l'équipe sont apparus,
00:03:31chacun contrôlé par le chef d'équipe.
00:03:32Le chef a donné le prompt aux agents individuels, leur indiquant la tâche à accomplir.
00:03:36Le premier agent de revue a commencé à travailler et, après analyse, il a partagé
00:03:40des messages avec le correcteur, bug après bug.
00:03:42Cet agent priorisait les problèmes de sécurité critiques, et dès que le correcteur recevait
00:03:47les messages de la revue, il commençait les corrections pendant que l'autre agent
00:03:51continuait à chercher de nouveaux problèmes.
00:03:53De même, ils ont continué à communiquer et à rapporter les changements implémentés.
00:03:57Une fois les problèmes critiques résolus, les deux agents sont passés à la correction
00:04:01des problèmes de priorité moyenne.
00:04:02La revue et la correction se faisaient simultanément, ce qui a fait gagner beaucoup de temps.
00:04:06L'avantage est que vous pouvez aussi assigner ou modifier n'importe quelle tâche d'un membre.
00:04:10Grâce à cela, vous pouvez orienter le travail d'un membre d'équipe spécifique.
00:04:14Une fois le travail terminé, le contrôle a été rendu à l'agent principal, qui est
00:04:18chargé de vérifier que les changements sont corrects et de fermer
00:04:22ces agents proprement, pour s'assurer que leur sortie ne cause pas d'erreurs plus tard.
00:04:26Vous avez probablement remarqué que nous construisons beaucoup dans ces vidéos.
00:04:28Tous les prompts, le code, les modèles... tout ce que vous devriez normalement
00:04:32copier en mettant pause, se trouve dans notre communauté pour cette vidéo et les précédentes.
00:04:37Les liens sont dans la description.
00:04:38Trouver et corriger à grande échelle est une excellente chose, mais il arrive souvent
00:04:43que l'on n'arrive pas à comprendre la cause d'un problème.
00:04:45Dans ces cas, nous pouvons utiliser une équipe d'agents pour tester plusieurs perspectives
00:04:49de la même application et progresser vers la résolution du bug.
00:04:51De cette façon, les membres peuvent communiquer leurs découvertes et avancer ensemble.
00:04:55Nous avons demandé à Claude de trouver un bug en spécifiant l'usage de plusieurs membres,
00:04:59leur permettant d'aborder le problème sous différents angles.
00:05:02Il a alors généré quatre sous-agents, chacun concentré sur un aspect différent de l'application.
00:05:06Ils ont reçu des prompts similaires du chef d'équipe et ont enquêté sur les erreurs
00:05:09selon leur angle spécifique, pendant que le chef attendait la fin pour
00:05:14analyser les résultats de leurs recherches.
00:05:16Sans les équipes, nous n'aurions eu qu'un seul fil d'exécution, ce qui aurait été bien plus long.
00:05:19Mais avec ces agents, le processus a été beaucoup plus rapide.
00:05:22L'enquête s'est terminée rapidement, et toute la recherche des agents a été faite en
00:05:272 ou 3 minutes environ, une amélioration significative par rapport à une vérification linéaire
00:05:31qui aurait facilement pris 5 à 10 minutes.
00:05:33Attention toutefois : cette approche consomme beaucoup de tokens car chaque agent
00:05:37possède sa propre fenêtre contextuelle, il faut donc être vigilant.
00:05:40Une fois que les agents ont rendu leurs résultats et ont été fermés, le chef d'équipe
00:05:45a également vérifié les résultats par lui-même.
00:05:46Les quatre agents ont convergé vers le même bug, identifiant correctement
00:05:50un problème de “stale closure” dans le useEffect.
00:05:52Cette partie exacte a été signalée par les quatre agents.
00:05:54cela nous aide à créer plus de vidéos et à toucher plus de monde.
00:05:59de créer plus de contenu de ce genre et de toucher plus de personnes.
00:06:02Ce framework d'agents a changé notre façon de travailler sur des tâches de longue durée car,
00:06:07grâce à leurs capacités, les agents n'ont plus à se fier uniquement au suivi écrit.
00:06:10Avec Agent-Teams, nous pouvons gérer différents aspects d'une application en parallèle,
00:06:14et même avoir un membre dédié exclusivement à la recherche.
00:06:16Quand nous avons soumis le prompt à Claude, il a généré 6 agents.
00:06:19Deux travaillaient sur la recherche et les bases, tandis que les autres s'occupaient
00:06:23de construire les pages.
00:06:24Les agents constructeurs étaient bloqués par l'agent posant les bases, car celui-ci
00:06:28devait installer les paquets requis et préparer l'environnement avec toutes les dépendances.
00:06:32Chaque agent a reçu un prompt spécifique définissant sa mission.
00:06:35Les agents bloqués attendaient le signal de déblocage du chef d'équipe.
00:06:38Une fois la recherche et les bases terminées, les autres agents ont été débloqués et ont
00:06:43commencé à implémenter leurs parties respectives de l'application côte à côte.
00:06:46Ils ont communiqué entre eux pour assurer la cohérence entre chaque composant.
00:06:49Le chef d'équipe a coordonné les agents et, dès que l'un d'eux terminait, le chef
00:06:53lui envoyait un message de fermeture pour gérer sa sortie proprement.
00:06:57Tout ce processus a consommé environ 170k tokens de fenêtre contextuelle, mais au final,
00:07:02nous avons obtenu l'application exactement comme voulu, à partir d'un seul prompt.
00:07:05Comme mentionné, lors de nos tests, nous avons découvert plusieurs
00:07:09façons d'optimiser le fonctionnement d'Agent-Teams, et ces bonnes pratiques
00:07:13sont disponibles dans AI Labs Pro pour que vous puissiez les essayer.
00:07:16La première recommandation s'applique généralement à tous les agents, et pas seulement
00:07:20à la fonctionnalité d'équipe d'agents.
00:07:21Vous devez spécifier explicitement le périmètre d'action de l'agent.
00:07:25Vous pouvez le faire dans le prompt, en précisant quels fichiers consulter
00:07:29pour effectuer la tâche, ou en créant des documents dans le projet contenant
00:07:33les tâches individuelles, comme nous l'avons fait. Nous avons préparé un document
00:07:38de tâche pour chaque mission afin que l'agent travaille en toute autonomie.
00:07:41Une autre chose à garder à l'esprit est que chacun de ces agents doit travailler sur des
00:07:45tâches indépendantes, car s'ils modifient le même fichier en même temps,
00:07:49cela créerait un conflit et risquerait d'écraser le contenu.
00:07:52Par ailleurs, nous avons remarqué que l'agent principal s'impatientait parfois
00:07:56si un agent mettait trop de temps et commençait à exécuter la tâche lui-même
00:08:00au lieu de laisser ses coéquipiers finir. Il est donc crucial de lui rappeler
00:08:04d'attendre la fin du travail des coéquipiers avant de poursuivre.
00:08:06Il faut également bien dimensionner les tâches.
00:08:08Si les tâches sont trop petites, cela crée un surcoût de coordination.
00:08:11Si elles sont trop grandes, le risque de travail inutile augmente. Les tâches
00:08:16doivent donc être équilibrées et autonomes.
00:08:17Enfin, vous devez surveiller le travail des agents.
00:08:19Si un agent ne réagit pas comme prévu, vous pouvez interrompre son exécution
00:08:23et lui donner de nouvelles instructions sur ce qu'il doit faire.
00:08:25Suivre ces pratiques rend cette fonctionnalité expérimentale bien plus efficace.
00:08:29Cela nous amène à la fin de cette vidéo.
00:08:31Si vous souhaitez soutenir la chaîne et nous aider à continuer ces vidéos,
00:08:35vous pouvez le faire via le bouton “Super Thanks” ci-dessous.
00:08:38Comme toujours, merci d'avoir regardé et à la prochaine !

Key Takeaway

La nouvelle ère du codage IA repose sur le passage de sous-agents isolés à des équipes d'agents collaboratives capables de communiquer et de travailler en parallèle sous une gestion centralisée.

Highlights

Lancement de la fonctionnalité expérimentale "Agent-Teams" parallèlement à Opus 4.6 pour transformer le codage IA.

Résolution du problème de communication des anciens sous-agents grâce à une structure de collaboration directe.

Architecture basée sur un chef d'équipe centralisé coordonnant plusieurs sessions indépendantes de Claude Code.

Capacité de communication interne via une boîte mail partagée et un stockage local dans le dossier .claude.

Réduction significative du temps d'exécution

Timeline

Introduction et limites des anciens sous-agents

L'auteur commence par interroger l'impact de la mise à jour Opus 4.6 d'Anthropic sur l'écosystème du développement. Il explique que les anciens sous-agents fonctionnaient comme des entités individuelles limitées par leur propre fenêtre contextuelle, ce qui créait des goulots d'étranglement. Sans communication directe, l'orchestrateur devait intervenir manuellement pour transférer les données entre les agents, rendant les tâches simples inutilement complexes. Pour pallier ce déficit, Anthropic a introduit les "Agent-Teams" afin de fluidifier les flux de travail. Cette fonctionnalité expérimentale a déjà démontré une réduction considérable du temps d'exécution lors des premiers tests internes.

Architecture et fonctionnement d'Agent-Teams

Le concept repose sur la collaboration de plusieurs instances de Claude Code fonctionnant comme une véritable équipe. Contrairement aux anciens modèles, cette structure distingue un chef d'équipe, qui synthétise les résultats, de coéquipiers travaillant dans des sessions de terminal indépendantes. La grande innovation réside dans leur capacité à communiquer directement via une boîte mail partagée et une liste de tâches commune. Ils ne sont plus limités par un orchestrateur rigide mais agissent comme des agents autonomes et synchronisés. Cette approche permet de traiter des problèmes nécessitant une discussion active entre les différentes instances de l'IA.

Mise en œuvre technique et revue de code

L'activation de cette fonction nécessite de régler un flag spécifique dans l'interface en ligne de commande (CLI) de Claude Code. L'exemple présenté illustre une revue de code parallélisée où un agent identifie les failles de sécurité pendant qu'un second les corrige instantanément. Ce processus élimine la lourdeur de l'écriture dans des fichiers physiques pour la communication, accélérant ainsi la livraison du projet. Le chef d'équipe supervise l'ensemble, s'assurant que les agents sont fermés proprement une fois leur mission accomplie. Cette démonstration prouve que la collaboration simultanée offre un gain de productivité majeur par rapport aux méthodes linéaires classiques.

Analyse de bugs et optimisation du temps

Dans les situations où la cause d'un bug est complexe, l'équipe d'agents permet d'explorer plusieurs perspectives simultanément. Le narrateur explique comment quatre sous-agents ont été déployés pour analyser une application sous différents angles, identifiant tous un problème de "stale closure" dans un useEffect. Ce travail d'investigation, qui aurait pris 10 minutes avec un seul agent, a été bouclé en seulement 3 minutes grâce au traitement parallèle. Cependant, l'auteur avertit que cette méthode consomme une quantité importante de tokens, car chaque agent possède sa propre fenêtre contextuelle. Cette convergence des résultats renforce la fiabilité du diagnostic tout en optimisant le temps de recherche.

Construction d'applications et gestion des dépendances

Le framework permet également de gérer des tâches de longue durée comme la création d'une application complète à partir d'un seul prompt. Dans cet exemple, six agents collaborent : certains posent les bases techniques et installent les paquets, tandis que d'autres construisent les pages. Le chef d'équipe gère les blocages, s'assurant que les constructeurs attendent que l'environnement soit prêt avant de commencer. Bien que l'opération ait consommé environ 170 000 tokens, le résultat final est une application fonctionnelle et cohérente. La communication entre agents garantit que chaque composant s'intègre parfaitement avec les autres membres de l'équipe.

Bonnes pratiques et conclusion

La vidéo se termine par une série de recommandations pour optimiser l'usage de cette fonctionnalité expérimentale. Il est crucial de spécifier explicitement le périmètre d'action de chaque agent pour éviter qu'ils ne modifient le même fichier simultanément, ce qui créerait des conflits de code. L'utilisateur doit aussi veiller à ce que l'agent principal ne s'impatiente pas et n'interrompe pas le travail de ses coéquipiers prématurément. Un bon dimensionnement des tâches est essentiel : ni trop petites pour éviter le surcoût de coordination, ni trop grandes pour éviter le gaspillage de ressources. Enfin, une surveillance humaine active reste nécessaire pour ajuster les instructions si un agent dévie de sa mission initiale.

Community Posts

View all posts