La fonctionnalité la plus puissante de Claude Code vient de sortir et personne n'en parle

CChase AI
컴퓨터/소프트웨어AI/미래기술

Transcript

00:00:00C'est la mise à jour de Claude Code la plus puissante depuis des mois, et personne n'en parle.
00:00:04UltraCode permet à Claude Code de gérer des tâches extrêmement vastes et complexes en déployant une armée
00:00:10d'agents. Et je ne parle pas juste d'une poignée. Je parle potentiellement de centaines
00:00:14d'agents pour répartir le travail et tout accomplir en une seule fois. Mais la vraie puissance d'UltraCode
00:00:20ne réside pas dans le nombre d'agents qu'il peut générer. C'est le fait qu'il construit un cadre personnalisé
00:00:24adapté à votre tâche spécifique à la volée. Normalement, Claude Code adopte une approche universelle
00:00:29pour résoudre votre problème. Mais avec cette toute nouvelle fonctionnalité, ce n'est plus le cas.
00:00:34Alors dans cette vidéo, je vais expliquer exactement comment cela fonctionne pour que vous puissiez commencer à exploiter
00:00:38cette nouvelle fonctionnalité immédiatement. Alors pourquoi devriez-vous vous intéresser à UltraCode et aux flux de travail dynamiques ? Eh bien,
00:00:43c'est assez simple. C'est le meilleur moyen de gérer des tâches vastes et complexes avec Claude Code. C'est tout.
00:00:49Et il y parvient grâce à des cadres personnalisés. C'est une façon élégante de dire qu'il va créer
00:00:56une manière inédite de résoudre ce que vous essayez de résoudre. Un excellent exemple est la façon dont il
00:01:02gère quelque chose comme la recherche approfondie. Si vous avez une question assez compliquée, comme : devrions-nous migrer
00:01:08notre service de paiement vers un nouveau fournisseur ? Si j'utilise simplement Claude Code comme il fonctionne normalement, je me contente d'aller
00:01:14dans la fenêtre de prompt et je lui donne cette consigne. Eh bien, il va utiliser son cadre
00:01:20par défaut statique. Ce sera en une seule session, n'est-ce pas ? Nous allons utiliser une seule fenêtre de contexte.
00:01:24Il va effectuer quelques recherches sur le Web. Il va récupérer les meilleurs résultats. Il va vérifier,
00:01:30résumer et nous donner un rapport de recherche générique. Par défaut, nous parlons d'un cadre statique. Ce
00:01:34que nous disons vraiment, c'est que vous ouvrez simplement Claude Code ici dans une seule fenêtre de contexte, et nous ne
00:01:38lui disons pas d'utiliser des sous-agents ou de faire une sorte d'examen contradictoire de son processus de réflexion initial.
00:01:44C'est donc assez simple. Il utilise moins de jetons, et au final, vous obtenez une réponse générique. Attention,
00:01:51c'est très bien pour la plupart des problèmes. Nous parlons ici aujourd'hui de sujets vastes et complexes. En revanche, si nous utilisons
00:01:57UltraCode dans un flux de travail dynamique, et je parlerai dans un instant de la différence entre les deux, nous obtenons un
00:02:02cadre personnalisé conçu pour ce problème. Nous aurons une manière différente de résoudre cette question.
00:02:09Nous ne resterons pas simplement dans une seule fenêtre de contexte. Nous allons faire intervenir différents agents, et les différents
00:02:12agents feront des choses différentes, encore une fois, selon la tâche. Donc dans cet exemple,
00:02:17où je dis : hé, devrions-nous migrer notre service de paiement vers un nouveau fournisseur, au lieu de simplement effectuer
00:02:22quelques recherches sur le Web et de proposer un résumé, avec un flux de travail dynamique, il va
00:02:26se dire : d'accord, qu'est-ce que notre service de paiement ? Il va donc lire notre code de facturation. Il va en fait
00:02:30aller au fond de notre fonctionnement réel. À partir de là, il va vérifier les fonctionnalités
00:02:35par rapport à la documentation du nouveau fournisseur. Il va évaluer notre volume de transactions. Il va avoir un
00:02:40véritable agent avocat du diable pour dire : hmm, est-ce que cela a vraiment du sens ? Et au final, nous obtenons une recommandation spécifique
00:02:47plutôt qu'une générique. Donc, ce qui est important avec les flux de travail dynamiques, c'est que le processus
00:02:55par lequel nous parvenons à une réponse est différent. Il est personnalisé, et il dépend de la question que nous posons. Et en procédant
00:03:02de cette façon, nous obtenons de meilleurs résultats. C'est pourquoi vous devriez vous en soucier. Maintenant, avant de parler de la place d'UltraCode
00:03:07dans tout cela, d'abord, un message du sponsor d'aujourd'hui, moi-même. Il n'y a pas si longtemps, j'ai lancé une Masterclass
00:03:13Claude Code, et c'est le meilleur moyen de passer de zéro à développeur IA, surtout si vous n'avez pas
00:03:19de bagage technique. Je la mets à jour chaque semaine. J'ai récemment ajouté des modules pour une Masterclass Codex
00:03:24également. Et si vous voulez y accéder, vous pouvez la trouver à l'intérieur de Chase AI Plus. Je mettrai
00:03:29un lien vers cela dans le commentaire épinglé.
00:03:31Alors, qu'est-ce qu'UltraCode ? Ils devaient s'en soucier pour lui donner ce graphisme sophistiqué lorsque vous tapez
00:03:35slash effort. Donc, UltraCode est lié au niveau d'effort. Donc, si vous tapez slash effort
00:03:41à l'intérieur de Claude Code, vous verrez le spectre qui apparaît, de bas jusqu'à UltraCode.
00:03:46Normalement, par défaut sur Opus 4.8, nous sommes sur élevé, mais UltraCode va un peu au-delà du maximum. Enfin,
00:03:53en quelque sorte. Ce qui se passe réellement quand je tape slash UltraCode, deux choses se produisent. Un,
00:04:00mon niveau d'effort passe de élevé à extra élevé. Nous ne sommes pas au maximum. Nous sautons simplement à extra élevé.
00:04:05Et deuxièmement, j'ai maintenant une orchestration automatique de flux de travail dynamiques. Donc, il y a deux choses dont nous parlons
00:04:11ici, n'est-ce pas ? Dans cette vidéo, nous avons parlé des flux de travail dynamiques, qui est, vous savez, cette idée que
00:04:16nous créons des cadres personnalisés pour notre tâche, et nous avons UltraCode. Ok, donc UltraCode change l'effort
00:04:22en extra élevé et permet automatiquement l'orchestration de flux de travail dynamiques. Les flux de travail dynamiques sont
00:04:29aussi une chose en soi à l'intérieur de Claude Code. Donc, si je suis dans Claude Code et que je fais quelque chose comme
00:04:34slash workflows, je force maintenant Claude Code à créer un flux de travail pour le prompt que je lui donne,
00:04:42vous savez, comme insérer une tâche. Mais si nous sommes dans UltraCode, ce qui est le cas maintenant, Claude Code décidera de lui-même
00:04:48hé, est-ce que cela nécessite un flux de travail dynamique ou non ? Nous avons donc la possibilité d'invoquer toujours
00:04:55des flux de travail dynamiques si nous tapons simplement slash workflow, ou si je dis quelque chose comme : hé, utilise
00:04:59les flux de travail. Donc c'est presque comme une compétence que je peux invoquer, c'est le même genre de chose. Ou alors UltraCode permet
00:05:06à Claude Code d'être intelligent à ce sujet. Et il va se dire : hé, selon le prompt,
00:05:10parfois nous utiliserons simplement le cadre statique. Nous n'avons pas toujours besoin de faire des folies. Ou si c'est assez
00:05:15complexe, eh bien, j'utiliserai des flux de travail dynamiques. C'est là qu'intervient UltraCode. C'est comme une couche
00:05:20automatique. Vous n'avez pas à y penser. S'il a besoin de flux de travail dynamiques, il le fera. Vous n'avez pas
00:05:23besoin d'utiliser votre cerveau. D'accord ? Et c'est génial. Donc, cela étant dit, pour maximiser réellement UltraCode,
00:05:30nous devons plonger un peu plus dans les flux de travail dynamiques parce que vous comprenez le pourquoi, vous
00:05:34comprenez UltraCode versus les flux de travail dynamiques. Maintenant, parlons un peu plus de cela.
00:05:39Et Claude Code en fait, Anthropic a écrit un blog entier à ce sujet. Donc, le blog, qui est sorti il y a environ
00:05:44une semaine, s'intitule Un Cadre pour Chaque Tâche, Flux de Travail Dynamiques dans Claude Code. Nous n'allons pas
00:05:48plonger dans tout ce blog dans cette vidéo. Je vais juste aborder les parties que vous devez connaître.
00:05:52Et je mettrai un lien vers celui-ci dans la description également. Maintenant, la première chose que je veux souligner est
00:05:55pourquoi les flux de travail dynamiques. Nous l'avons évoqué au début. Hé, c'est mieux pour les tâches complexes.
00:05:59Mais pourquoi Claude n'est-il normalement pas assez bon pour ce genre de chose ? Eh bien, c'est parce que plus Claude
00:06:04travaille sur une tâche complexe dans une seule fenêtre de contexte, plus il devient inefficace. Et les trois choses qu'ils
00:06:09évoquent ici peuvent toutes entrer dans la catégorie de la dégradation du contexte, l'idée de paresse agentique.
00:06:16Vous savez, nous avons tous été confrontés à cela, lorsque vous dites à Claude Code de faire quelque chose d'assez vaste,
00:06:20et qu'il n'en fait qu'une partie. Nous avons aussi le biais d'autosatisfaction, faisant référence à la tendance de Claude
00:06:25à préférer ses propres résultats ou conclusions, surtout lorsqu'on lui demande de les vérifier ou de les juger
00:06:30par rapport à une grille d'évaluation. Hé, si vous vous souvenez de ma vidéo d'il y a quelques jours où je vous ai montré grill me
00:06:34codex, en intégrant codex dans l'équation, c'est quelque chose dont j'ai parlé là aussi, n'est-ce pas ?
00:06:38Claude n'est pas très doué pour évaluer son propre travail, surtout si vous lui demandez d'évaluer le travail
00:06:44dans la même session. Comme si vous étiez dans la même fenêtre de contexte, il n'est pas très doué pour ça.
00:06:49Et puis enfin, la dérive des objectifs. Et encore une fois, je continue de marteler ce point : tâche complexe, la dérive des objectifs
00:06:54va être un problème majeur. Nous devons gérer cela. Nous ne pouvons pas faire ces choses en une seule session.
00:06:57Et donc, créer un flux de travail, un flux de travail dynamique, aide à combattre ces problèmes en orchestrant des sous-agents Claude
00:07:03distincts avec leurs propres fenêtres de contexte et des objectifs ciblés et isolés, n'est-ce pas ? Cela vous semble familier ?
00:07:10GSD, super-pouvoirs, toutes ces choses, ces derniers mois, convergent toutes vers ce point : comment gérer de grandes tâches
00:07:16avec une fenêtre de contexte limitée ? Tout finit par revenir aux sous-agents, aux nouvelles fenêtres de contexte,
00:07:21à ce genre de choses. Maintenant, la dernière chose que j'aborderai de ce blog, ce sont certains des modèles de flux de travail
00:07:26qu'ils présentent. Ce n'est pas exhaustif. Il existe une infinité de modèles de flux de travail,
00:07:30mais je pense qu'il est utile, lorsque nous parlons de cadres personnalisés et de flux de travail dynamiques, de voir
00:07:35ce dont nous parlons réellement, visuellement. Maintenant, le premier exemple qu'ils donnent est classifier et agir.
00:07:40C'est un modèle de flux de travail où nous avons une sorte de tâche. Cette tâche implique un certain nombre de sous-tâches,
00:07:45et nous voulons les répartir entre des sous-agents appropriés. Pour ce faire, nous avons besoin d'un classificateur et en utilisant un
00:07:51flux de travail dynamique. Claude Code saura déjà, c'est la partie importante, Claude Code saura déjà que
00:07:56c'est le genre de modèle de flux de travail dont vous avez besoin, n'est-ce pas ? Il le configurera automatiquement pour vous.
00:08:00Un autre exemple est déployer et synthétiser. Pensez à la recherche approfondie. Hé, je veux que tu recherches quelque chose.
00:08:05J'ai besoin que tu ailles chercher une tonne d'informations auprès d'une tonne de sources différentes,
00:08:09potentiellement des centaines de sources. Je veux que tu les ramènes. Je ne veux pas seulement que tu résumes.
00:08:13Je veux que tu vérifies. Je veux que tu fasses des recoupements, et puis à la fin,
00:08:17je veux un rapport final. Encore une fois, si vous demandez à Claude Code, en utilisant UltraCode ou en utilisant des flux de travail dynamiques
00:08:22d'effectuer une recherche approfondie sur un sujet, eh bien, c'est le genre de flux de travail à mettre en place.
00:08:27Et cela continue. Vérification contradictoire, boucler jusqu'à la fin, une sorte de style tournoi
00:08:32où vous avez un tas d'idées et de juges différents, et à la fin, vous obtenez un gagnant final,
00:08:36générer et filtrer. Le blog lui-même détaille tout cela, mais au moins pour moi, il était
00:08:41utile de voir ce dont ils parlent. Je me dis : d'accord, cadre personnalisé, qu'est-ce que cela
00:08:44signifie exactement ? Eh bien, cela signifie simplement qu'il y a un certain nombre de chemins pour trouver une solution. Et avec un
00:08:50flux de travail dynamique personnalisé, nous obtenons toutes ces options. Et le but est qu'elles soient adaptées à la tâche
00:08:55contrairement, vous savez, au cadre statique : effectuer une recherche Web, poser quelques questions, résumer. Nous pouvons faire mieux.
00:09:03Et enfin, avant de passer à la démonstration, je vous suggère fortement de prendre cinq minutes de votre temps,
00:09:09d'aller voir la documentation de Claude Code et de lire réellement ce qu'ils ont écrit sur les flux de travail dynamiques afin de mieux
00:09:13comprendre comment cela fonctionne sous le capot par rapport à quelque chose comme les équipes d'agents. Indice : cela exécute en réalité
00:09:18un script au moment de l'exécution et des choses comme comment enregistrer les flux de travail car vous pouvez les répéter. Ce sont
00:09:24en quelque sorte comme des compétences dans ce sens et ce genre de choses. Ils ont en fait une très bonne documentation
00:09:28ici. Et dans cette documentation, ils nous parlent en fait d'un flux de travail dynamique préchargé qui vient avec
00:09:34Claude Code. C'est en fait un flux de travail de recherche approfondie, similaire à la recherche approfondie qui existe depuis
00:09:39un certain temps sur l'application Web. Donc nous ferons deux démos. La première que je vais vous montrer pour que vous puissiez voir
00:09:44comment tout cela fonctionne est cette recherche approfondie. Et elle est dans votre Claude Code dès maintenant si
00:09:48vous êtes à jour. Tout ce que vous avez à faire est de taper slash deep research. Donc à l'intérieur de Claude Code,
00:09:52nous allons taper slash deep research. Et puis je vais juste lui donner un prompt. Eh bien,
00:09:56en fait, ce serait une sorte de méta-prompt. Nous allons lui demander de faire une recherche approfondie sur les flux de travail dynamiques
00:10:01et les meilleures pratiques pour les créer. Peux-tu faire une recherche approfondie sur les tout nouveaux flux de travail
00:10:08dynamiques et UltraCode dans Claude Code ? Je veux un rapport détaillant les meilleures pratiques.
00:10:14On parle beaucoup de l'existence de cadres personnalisés.
00:10:17Avec les flux de travail dynamiques, comment s'assurer que le cadre personnalisé qui est construit
00:10:22en utilisant des flux de travail dynamiques est le meilleur pour le travail ? Ou est-ce que c'est quelque chose au niveau de l'utilisateur où nous attendons juste
00:10:28que Claude Code s'en occupe ? Alors voilà. Donc quand nous avons fait cela, vous voyez que nous avons reçu quelques
00:10:32messages. Exécution du flux de travail de recherche approfondie, sujet assez clair, procéder, flux de travail, flux de travail dynamique,
00:10:38recherche approfondie. Et puis il nous dit que le flux de travail a été lancé en arrière-plan. Il a
00:10:43cinq phases : portée, recherche, récupération, vérification et synthèse. Et nous avons la possibilité de le regarder
00:10:49en direct. Donc si je tape slash workflows, vous pouvez voir juste ici, tous les agents, ce qui
00:10:57se passe en temps réel. Et donc pour la portée, nous avons juste un seul agent. Pour la recherche, nous aurons
00:11:02cinq agents. Et dès qu'ils commencent à travailler, nous pouvons en fait, oups, une fois qu'ils commencent à travailler, nous pouvons
00:11:07voir leur utilisation de jetons. Parce que l'un des gros coûts de cela, n'est-ce pas, vous pouvez le voir
00:11:13juste ici. L'un des coûts importants auxquels nous devons penser lorsque nous utilisons des flux de travail dynamiques et
00:11:17UltraCode, c'est le coût en jetons. C'est gourmand en jetons. Maintenant, il y a certainement un argument à faire valoir que
00:11:23nous prépayons en quelque sorte le coût. Et qu'en vertu du fait que nous obtenons des résultats plus efficaces d'UltraCode
00:11:30et des flux de travail dynamiques, nous économisons probablement des jetons à long terme. Mais ne soyez pas
00:11:35surpris, surtout si vous utilisez un flux de travail dynamique comme je le disais au début, cela utilise plus de 100
00:11:41agents. Ne soyez pas surpris si vous avez un coût en jetons faramineux à la fin de cela. Donc nous pouvons voir ici pour nos
00:11:46cinq agents qui sont en train de chercher en ce moment. Ils ont utilisé environ 250 000 jetons chacun. La portée elle-même a pris
00:11:53environ 40 000. Et puis la récupération ici semble avoir potentiellement 12 sous-agents. Et nous avons aussi
00:11:59une liste ici, n'est-ce pas ? Quatre agents sur 22 et deux minutes se sont écoulées. Et je ferai aussi référence à mon
00:12:06utilisation hebdomadaire totale à la fin de cela, ainsi qu'à la quantité que j'ai brûlée. Donc 101 agents, 3,7 millions de jetons
00:12:12et 11 minutes plus tard, le flux de travail est terminé. Et en termes d'utilisation sur mon plan hebdomadaire maximum,
00:12:18c'était 4 % et je suis sur le plan maximum à 200 $ par mois. Donc, les histoires de jetons, ce n'est pas une blague. Genre,
00:12:25vous devez savoir quand appliquer cela. Et puis j'ai dû transformer le rapport en cet actif HTML
00:12:30que vous voyez ici. Et il reformule à peu près beaucoup de ce que nous voyons dans la documentation réelle de Claude Code
00:12:35concernant les flux de travail dynamiques. Donc, quels sont d'autres cas d'utilisation pour les flux de travail dynamiques dans
00:12:42UltraCode ? Eh bien, Anthropic nous les explique en fait. Des choses comme des chasses aux bugs à l'échelle de la base de code,
00:12:46des migrations importantes et du travail critique qui doit être vérifié deux fois. Un autre exemple qu'Anthropic évoque
00:12:52est la réécriture de Bun avec des flux de travail dynamiques où ils ont en fait porté Bun de Zig à Rust au cours
00:13:00d'environ une semaine en utilisant cette fonctionnalité. Testons-le avec une chasse aux bugs. Je suis dans le répertoire
00:13:05de mon site Web d'agence IA, qui sert aussi de backend du côté administrateur. C'est un peu comme mon
00:13:11centre de commande de création de contenu. Donc nous allons lui demander d'exécuter un flux de travail dynamique pour faire une sorte de chasse aux bugs.
00:13:18Peux-tu utiliser des flux de travail dynamiques dans ce répertoire pour mener une chasse aux bugs et voir quel genre
00:13:26de bugs nous avons dans ce répertoire actuel ? Une fois que tu as créé le rapport, transforme-le en rapport HTML et
00:13:33affiche-le dans mon navigateur. Donc vous pouvez voir juste ici l'appel de la commande de flux de travail cluster parallel bug
00:13:38hunt à travers l'application Next JS. Vérifier de manière contradictoire chaque découverte, synthétiser un rapport classé par gravité.
00:13:45Donc ça tourne en arrière-plan. Et comme toujours, nous pouvons taper slash workflows pour jeter un œil. Donc pour ce rapport de bugs, cela a pris
00:13:51environ la moitié du temps et utilisé la moitié des jetons que la recherche approfondie. Nous avons eu 34 bugs confirmés. Il y avait sept bugs qui étaient des faux positifs. Et sur ces 34, deux sont élevés, neuf sont moyens et 23 sont bas.
00:14:04J'ai la possibilité de cliquer dessus. Cela me montre ce qui ne va pas, la preuve, la correction, et puis
00:14:10aussi le vérificateur contradictoire qui dit : hé, c'est effectivement un bug. Voici le problème.
00:14:15Et il me donne ce rapport pour presque tous, où se trouve le problème, ce qu'il définit comme
00:14:21l'erreur, ce qui ne va pas, la preuve, la correction, le vérificateur contradictoire. Donc c'est assez profond en termes
00:14:26de ce qu'il trouve réellement. Et je pense que le meilleur aspect de cela est le vérificateur contradictoire.
00:14:30Parce qu'encore une fois, l'un des gros problèmes avec Claude Code et les tâches complexes est : peux-tu confirmer
00:14:34qu'il a vraiment fait ce qu'il est censé faire ? Donc c'est là que je vous laisse pour cette
00:14:38vidéo. Nous avons abordé pourquoi vous devriez vous intéresser à UltraCode et aux flux de travail dynamiques, comment ils fonctionnent,
00:14:43et nous avons passé en revue quelques exemples. Je pense que c'est une fonctionnalité géniale. Je pense qu'elle est extrêmement
00:14:47puissante. Oui, c'est extrêmement gourmand en jetons, mais parfois nous avons besoin de gros moyens, surtout
00:14:53pour des tâches qui nous tiennent vraiment, vraiment à cœur. Et avant cela, c'était assez difficile, n'est-ce pas ? Nous faisions des choses
00:14:58bricolées. Nous faisions intervenir des couches d'orchestration externes. Et maintenant, tout est prêt à l'emploi à l'intérieur
00:15:03de Claude Code lui-même. Donc, comme toujours, faites-moi savoir ce que vous en avez pensé. Assurez-vous de consulter Chase
00:15:08AI Plus si vous voulez mettre la main sur ma Masterclass Claude Code, et on se voit plus tard.

Key Takeaway

UltraCode transforme la capacité de traitement de Claude Code en déployant une orchestration dynamique de sous-agents, permettant de résoudre des problèmes complexes inaccessibles aux sessions de contexte uniques.

Highlights

  • La fonctionnalité UltraCode permet à Claude Code d'orchestrer automatiquement des flux de travail dynamiques et de passer le niveau d'effort à « extra élevé ».

  • Contrairement au cadre statique universel, les flux de travail dynamiques créent des cadres personnalisés adaptés à la complexité spécifique de chaque tâche.

  • L'utilisation d'UltraCode mobilise de nombreux sous-agents isolés avec leurs propres fenêtres de contexte, limitant ainsi la dégradation du contexte et la paresse agentique.

  • Une recherche approfondie via UltraCode peut consommer des millions de jetons, comme illustré par une session traitant 3,7 millions de jetons avec 101 agents.

  • Les flux de travail dynamiques incluent des modèles prédéfinis comme « classifier et agir », « déployer et synthétiser » ou la « vérification contradictoire » pour garantir la qualité des résultats.

Timeline

Introduction à UltraCode et aux flux de travail dynamiques

  • UltraCode déploie une armée d'agents pour accomplir des tâches vastes en une seule fois.
  • Le cadre statique par défaut limite la résolution de problèmes à une seule fenêtre de contexte.
  • Les flux de travail dynamiques personnalisent le processus de résolution en fonction de la question posée.

UltraCode va au-delà d'une approche universelle en créant des structures de résolution sur mesure. Alors qu'une recherche classique se contente d'un résumé générique dans une session unique, un flux de travail dynamique segmente la tâche. Il fait intervenir des agents spécialisés pour lire le code réel, évaluer les besoins et confronter les résultats, offrant ainsi une recommandation spécifique.

Mécanique d'UltraCode et orchestration

  • L'invocation de la commande « /effort » avec l'option « UltraCode » passe le niveau d'effort à extra élevé.
  • La fonctionnalité automatise l'orchestration des flux de travail dynamiques sans intervention manuelle.
  • La commande « /workflow » permet d'invoquer manuellement ces flux si nécessaire.

UltraCode agit comme une couche automatique intelligente au-dessus de Claude Code. Lorsqu'il est activé, le système décide lui-même si une tâche nécessite le déploiement de flux de travail complexes. Cette automatisation libère l'utilisateur de la gestion manuelle des sous-processus pour les questions complexes.

Défis de contexte et modèles de flux de travail

  • La dégradation du contexte et la paresse agentique limitent l'efficacité des tâches complexes dans une seule session.
  • Les flux de travail isolent les objectifs dans des fenêtres de contexte distinctes pour chaque sous-agent.
  • Des modèles comme « classifier et agir » ou « vérification contradictoire » structurent la résolution.

Claude Code peine à évaluer son propre travail lorsqu'il est confiné à une fenêtre de contexte unique, menant à des résultats superficiels. L'utilisation de sous-agents avec des objectifs isolés combat ces biais. Les modèles de flux de travail, tels que le style tournoi ou la synthèse après recoupement, fournissent des chemins de résolution multiples et vérifiés.

Démonstrations pratiques et coûts

  • La recherche approfondie via « /deep research » utilise cinq phases : portée, recherche, récupération, vérification et synthèse.
  • L'exécution d'un flux de travail dynamique peut être très gourmande en jetons, atteignant plusieurs millions par session.
  • La chasse aux bugs démontre l'utilité du vérificateur contradictoire pour valider chaque erreur trouvée.

Une démonstration de recherche approfondie sur les flux de travail a nécessité 101 agents et 3,7 millions de jetons sur 11 minutes. Une seconde démonstration de chasse aux bugs a permis d'identifier 34 bugs confirmés avec un rapport classé par gravité. Ces exemples confirment la puissance de l'outil pour des travaux critiques malgré une consommation de jetons importante.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video