00:00:00Tout le monde s'emballe pour Kimi 2.5. C'est un modèle open-source qui affiche de meilleurs benchmarks
00:00:05qu'Opus et un mode "Agent Swarm" incroyablement ingénieux où un orchestrateur peut générer jusqu'à 100
00:00:11agents spécialisés pour une tâche complexe. Mais saviez-vous que cette fonction existe aussi dans le code de Claude,
00:00:17cachée derrière un flag et découverte par un utilisateur sur Twitter ? Comment a-t-on pu trouver ça ? Et est-ce qu'Anthropic
00:00:23a simplement volé l'idée de Kimi ? Abonnez-vous et voyons ça de plus près. Anthropic a annoncé
00:00:30des sous-agents personnalisés en juillet dernier et, depuis, les gens les utilisent pour toutes sortes de
00:00:35tâches spécialisées. Nous avions d'ailleurs fait une vidéo à ce sujet à l'époque. Mais ces sous-agents
00:00:41n'ont accès qu'à une fraction du contexte global puisqu'ils sont conçus pour une tâche précise. Ils accomplissent
00:00:48leur mission, renvoient les données et repartent de zéro. Les utilisateurs ont donc dû ruser pour la mémoire
00:00:54en demandant aux sous-agents d'écrire leurs conclusions dans un fichier Markdown et de mettre à jour un fichier de contexte principal.
00:01:01Ainsi, si un agent devait intervenir à nouveau, il lui suffisait de lire ces fichiers pour voir où en étaient ses collègues.
00:01:06Mais il fallait encore créer manuellement chaque sous-agent en lui attribuant un rôle, des compétences et des permissions.
00:01:12C'est là que le mode Swarm de Kimi change la donne, car c'est l'orchestrateur qui crée dynamiquement
00:01:19un sous-agent spécialisé pour chaque tâche spécifique, sans que vous n'ayez rien à faire.
00:01:25Ces sous-agents peuvent travailler en parallèle et, une fois leur part du travail terminée, ils transmettent
00:01:31le résultat à l'orchestrateur. Celui-ci décide alors si de nouveaux agents doivent être lancés avec ces données
00:01:36pour finaliser le projet. Le Swarm de Kimi est encore un projet de recherche, mais il montre déjà
00:01:42de nettes améliorations par rapport à un flux de travail avec un seul agent. Regardez ce graphique :
00:01:48peu importe la complexité de la tâche, le temps d'exécution reste stable grâce au travail en parallèle.
00:01:53Pour être honnête, on peut déjà faire un peu la même chose avec Claude Code.
00:01:58Grâce à la fonction "task", vous pouvez lister des tâches et les répartir entre différents sous-agents.
00:02:04Le problème, c'est que ces agents restent généralistes et ne sont pas optimisés pour la tâche précise.
00:02:10Je ne suis pas non plus certain que Claude sache attribuer automatiquement les tâches au bon agent personnalisé.
00:02:15Dites-moi en commentaire si vous avez déjà testé. Quoi qu'il en soit, il semble que l'équipe de Claude
00:02:21travaille sur un système d'orchestration capable de créer des sous-agents à la volée selon les besoins.
00:02:25Cette fonctionnalité était cachée derrière un flag découvert par Mike Kelly, qui montre comment ça marche dans ce tweet.
00:02:31Il y partage aussi un lien vers un dépôt, un fork de CC Mirror appelé "Claude Sneak Peek". Testons-le.
00:02:37Voici un plan rédigé par l'IA pour créer une interface web pour XDL, un outil de téléchargement de vidéos X/Twitter
00:02:42via le terminal. J'ai déjà installé et lancé Claude Sneak Peek, qui ressemble à une version minimaliste de Claude Code.
00:02:48Je vais lui demander de lire le fichier plan.md et de créer des tâches exécutables par un essaim d'agents.
00:02:55Je le laisse générer les tâches, et maintenant qu'il a fini, je vais lui demander de les exécuter via les sous-agents.
00:03:00Avant ça, pour vous confirmer que je n'ai aucun agent personnalisé configuré, je lance la commande /agent
00:03:05et vous voyez qu'il n'y a absolument rien. C'est maintenant qu'il lance l'exécution :
00:03:11il a automatiquement ajouté un agent "Front-end Builder" pour les tâches d'interface. On voit ici
00:03:16qu'une équipe se forme. Si on regarde le détail, on a cinq agents : un chef d'équipe, un testeur QA,
00:03:21un développeur back-end, un créateur de composants et un développeur front-end, tous au travail simultanément.
00:03:26On peut même suivre l'activité de chacun en temps réel. Le testeur QA cherche des patterns,
00:03:32le dev back-end fait de même tout en lisant les fichiers, idem pour les autres.
00:03:37Si on veut voir précisément ce qu'un agent fabrique, on appuie sur Entrée pour accéder à sa vue
00:03:42et consulter son prompt système. En revenant en arrière, on voit qu'on a maintenant huit agents :
00:03:48un créateur d'API, quelqu'un sur la config Vite, un autre pour l'intégration API et même un pour le CSS.
00:03:53L'équipe ne cesse de s'agrandir. En cliquant sur le chef d'équipe, on revient à la vue principale de Claude Code ;
00:03:57le chef d'équipe est l'orchestrateur central. Sur l'écran principal, chaque sous-agent nous donne son statut.
00:04:02En dézoomant un peu, on peut voir les messages envoyés précédemment par tous les agents.
00:04:07Une fois terminé, on reçoit un fichier de fin de projet, mais aussi un rapport d'exécution du Swarm
00:04:13indiquant le nombre d'agents utilisés, leurs rôles et s'ils ont rempli leur mission. On peut
00:04:18descendre pour voir le détail de chaque action. Vu le travail déjà accompli sur cette fonction,
00:04:24je ne pense pas qu'Anthropic ait copié Kimi. Ils ont dû voir des projets comme OpenDevin et ont voulu
00:04:29l'intégrer nativement à Claude Code, mais je comprends pourquoi ce n'est pas encore public.
00:04:34D'abord, l'orchestrateur n'a sans doute pas encore les heures d'entraînement de celui de Kimi 2.5.
00:04:41Ensuite, ça devient complexe pour l'utilisateur qui a déjà ses propres agents. Par exemple,
00:04:47comment l'orchestrateur décide-t-il de créer un nouvel agent front-end plutôt que d'utiliser celui du client ?
00:04:52Sur quelles données se base-t-il pour juger ? Et les compétences (skills) ajoutent une couche de complexité.
00:04:59Si l'utilisateur a déjà des bibliothèques de skills, l'orchestrateur doit-il piocher dedans ou en télécharger de nouvelles
00:05:04plus adaptées ? S'ils sortent cet orchestrateur, il devra analyser une tonne de données utilisateur
00:05:10(agents, outils, skills) avant même de décider s'il doit créer son propre agent. J'ignore s'ils y travaillent
00:05:16en ce moment ou s'ils ont jugé cela trop complexe pour une sortie officielle. À suivre.
00:05:22D'ailleurs, si vous ajoutez des fonctionnalités à un rythme effréné et que vous voulez éviter les bugs,
00:05:28allez voir Betastack. Il surveille les logs de vos serveurs et utilise la détection d'anomalies
00:05:35pour vous alerter avant que ça ne casse. Il suit aussi les erreurs front-end grâce à l'IA.
00:05:42Testez Betastack dès aujourd'hui.
00:05:49to use them for a new agent or to download its own ones which may even be more appropriate for the
00:05:56task at hand? I mean this orchestrator if anthropic ever release it will have to go through a bunch of
00:06:02user data already, agents, tools, skills just before it can decide if it needs to make its own sub-agent
00:06:10and what things it should add to it. I actually don't know if the team are working on this feature
00:06:16right now as I speak or if they've decided it's too complicated and won't release it. I don't know.
00:06:22Speaking of features if you're using an AI or a human to rapidly add features to a project and you
00:06:28want to make sure things don't break then you really need to check out Betastack because it's able to
00:06:33monitor logs on your servers and use anomaly detection to tell you if anything goes wrong
00:06:38before it does. And it also has AI native error tracking to let you know if anything goes wrong
00:06:44on your front end. So go and check out Betastack today.