Le plan complet du système d'exploitation Claude

AAI LABS
Computing/SoftwareInternet Technology

Transcript

00:00:00Imaginez que vous êtes un roi médiéval. Vous avez tout un royaume à diriger, mais vous préféreriez ne faire absolument
00:00:04rien pendant que les autres s'en chargent pour vous. Le problème, c'est que vous ne pouvez pas, car votre personnel a l'habitude
00:00:10d'être assisté en permanence. Ce qu'il vous faut, c'est un système qui gère tout le royaume par lui-même,
00:00:15et c'est exactement ce qu'est devenu Claude Code. Depuis qu'Anthropic publie des
00:00:19mises à jour, ce n'est plus seulement un agent de codage, c'est devenu un véritable système d'exploitation qui
00:00:25coordonne tout sur votre machine. Mais ce sont les flux de travail dynamiques qui soudent le tout.
00:00:30Alors, avant que notre roi ne confie tout son royaume à un agent, voyons comment cela fonctionne réellement.
00:00:35Depuis qu'Anthropic a commencé à proposer de nouvelles façons de gaspiller des jetons, ce qui n'est au fond que leur
00:00:40excuse pour gagner plus d'argent avec Claude Code, c'est bien plus qu'un simple agent de codage. C'est
00:00:44devenu un système d'exploitation complet. Tout comme un OS forme la base de chaque
00:00:50tâche et coordonne ce que vous faites sur votre machine, Claude Code joue désormais ce même rôle. Il coordonne
00:00:55et contrôle tout ce que vous faites. Mais avant de plonger dans la façon dont les flux de travail dynamiques complètent ce
00:01:00système, vous devez connaître les autres composants. La seule différence entre un
00:01:04système d'exploitation informatique et celui de Claude Code, c'est que vous n'avez pas à travailler
00:01:08aussi dur sur l'installation, sauf si vous utilisez Arch. Et non, vous n'aurez pas à installer
00:01:12un paquet de pilotes juste pour faire fonctionner le micro afin de pouvoir dicter vos commandes comme un dieu des vibes.
00:01:17Et comme tout vrai OS, il est constitué de multiples parties. Chacune est assez importante pour que le
00:01:22système ne soit pas complet sans elle. Dans un OS, le noyau est la couche la plus importante, il forme le cœur et
00:01:28contrôle toutes les opérations. L'équivalent dans Claude Code est le fichier Claude.md et vos fichiers de contexte.
00:01:33Nous avons déjà fait une vidéo complète sur la façon de structurer votre fichier Claude.md pour que votre agent
00:01:39soit le plus performant possible. C'est important ici car le noyau est le programme moteur de tout votre agent.
00:01:44S'il n'est pas configuré correctement, l'agent ne peut pas comprendre ce que votre projet attend vraiment. Et les autres
00:01:48parties s'effondrent avec lui. Un peu comme quand votre vie s'écroule après le mariage. Ensuite, il y a
00:01:53les pilotes, les éléments qui permettent au système d'interagir avec des périphériques externes. L'équivalent dans
00:01:58Claude Code, c'est MCP. Donc, chaque fois que Claude a besoin d'un outil externe, il l'atteint via MCP et appelle
00:02:04cet outil pour faire le travail. Viennent ensuite les programmes du quotidien, qui dans Claude Code sont les compétences et
00:02:09d'autres commandes. Ils contiennent des instructions structurées pour des tâches répétables et vous pouvez les invoquer chaque fois que vous
00:02:14en avez besoin. Chaque OS a également besoin d'un planificateur ou d'un cron job pour exécuter une tâche spécifique à une heure donnée.
00:02:20De la même manière, Claude Code a récemment ajouté des boucles et des routines. Ce sont en gros ses cron jobs et
00:02:25ils vous évitent d'avoir à surveiller manuellement les tâches. Ils automatisent le travail répétitif que vous feriez
00:02:29autrement à la main. Donc, même si votre système est éteint, les tâches continuent de tourner toutes seules. Vous pouvez donc
00:02:34dormir paisiblement en sachant que votre application SaaS B2B, que personne n'utilise, est bien prise
00:02:40en charge. Et enfin, le plus important, il y a la pièce qui lie le tout en un
00:02:45système d'exploitation complet. Cette pièce, c'est le flux de travail dynamique, la nouvelle fonctionnalité livrée avec Opus
00:02:504.8. Vous savez peut-être déjà que Claude Code possède des flux de travail dynamiques. En gros, c'est une autre tentative
00:02:55d'Anthropic pour simplifier les tâches de longue durée. Ils fonctionnent comme des instructions répétables qui génèrent plusieurs
00:03:01agents pour effectuer la tâche pour laquelle ils sont conçus. Alors, en quoi est-ce différent des autres architectures que
00:03:06vous avez déjà ? Pour les comparer, la première et la plus simple est celle des compétences. Les compétences sont des instructions répétables pour
00:03:11les tâches nécessitant des étapes guidées. Mais une compétence est générée par un seul agent, et c'est ce même agent qui lit les instructions
00:03:17qui s'y trouvent. Cela guide simplement l'agent pour qu'il fasse une tâche qu'il connaît déjà d'une meilleure façon, sans aider avec
00:03:22les tâches de longue haleine. C'est juste un seul agent qui fait tout le boulot. Ensuite, il y a la commande de but (goal).
00:03:27Elle itère vers un objectif final prédéfini et l'agent boucle jusqu'à ce que la condition de fin soit atteinte. C'était une
00:03:32tentative exceptionnelle pour améliorer les tâches de longue durée. Nous l'utilisons beaucoup dans nos propres flux de travail
00:03:38depuis sa sortie. À la fois le but et le flux de travail peuvent coordonner plusieurs agents, mais ils sont différents.
00:03:43Ce qui les sépare, c'est le déterminisme. Le but est non-déterministe, ce qui signifie que le système décide
00:03:48de ce qu'il faut faire ensuite. Un flux de travail est déterministe et c'est le code qui décide exactement ce qui se passe. Vous créez votre
00:03:54premier flux de travail simplement en utilisant le mot-clé “workflow”. À partir de ce mot dans votre prompt, Claude identifie le
00:03:59flux de travail dynamique nécessaire à la tâche, mais c'est un mot que nous utilisons tout le temps dans nos prompts, donc vous pourriez
00:04:04penser qu'il se déclencherait à chaque fois. Ce ne sera pas le cas, à moins que le prompt n'exprime réellement l'intention
00:04:09d'en créer un. C'est là que les flux de travail sont réellement différents. Au lieu du Markdown habituel utilisé par les autres,
00:04:14il crée du code JavaScript. Il vit à l'intérieur du répertoire “workflow” dans le dossier .Claude,
00:04:19et il utilise tout ce script pour contrôler l'ensemble. Donc, au lieu que votre plan vive dans la
00:04:23fenêtre de contexte, ce plan est écrit sous forme de code, définissant comment les sous-agents travailleront étape par
00:04:28étape. Il définit des schémas stricts, qui sont essentiellement des formulaires pour les sous-agents, afin qu'ils fournissent la
00:04:33sortie dans un format strict. Chaque agent est appelé avec le prompt et le formulaire qu'il doit remplir. Il continue de
00:04:39travailler jusqu'à ce que la sortie corresponde à ce schéma, puis renvoie ses conclusions. Vous les invoquez avec la commande slash
00:04:44suivie du nom du flux de travail, puis vous pouvez lui donner le plan que vous voulez tester. Il s'exécute en
00:04:49arrière-plan, vous permettant de continuer votre travail, et vous pouvez lui donner un autre prompt pour que votre chef de projet
00:04:53soit enfin fier de votre productivité avec l'IA. Pour vérifier la progression, lancez simplement la commande
00:04:58du flux de travail. Vous pourrez voir chaque étape de chaque flux de travail, tous les modèles invoqués par chaque agent,
00:05:03et voir combien de jetons chaque tâche a consommés. Et si votre session se termine alors qu'un flux de travail est en cours,
00:05:08vous n'avez pas à craindre de perdre votre progression. Elle persiste après que vous ayez lancé la commande “resume”. Chaque flux de travail
00:05:14garde son propre ID. Et quand vous reprenez, il récupère tout le travail mis en cache de l'agent depuis la mémoire et reprend là
00:05:19où il s'était arrêté. Contrairement à ma grand-mère, il n'oublie pas de payer la facture Claude AI et se
00:05:24souvient réellement de ce qu'il doit faire. Une chose à noter avant d'utiliser un flux de travail : comme il est en mode
00:05:29aperçu de recherche, les flux de travail dynamiques consomment beaucoup plus de jetons qu'une session Claude Code typique. C'est parce que
00:05:35ils utilisent plusieurs sous-agents en coulisses et que chacun tourne dans sa propre fenêtre de contexte. Vous devez
00:05:40bien réfléchir au moment où vous en avez vraiment besoin, sinon vous épuiserez votre forfait de 200 $ en quelques
00:05:45heures. Il y a quelques indicateurs clés qui vous diront si un flux de travail est la meilleure option. Le premier
00:05:50est que la tâche peut être divisée en unités indépendantes. Si les agents dépendent du travail des uns et des autres,
00:05:55ils finissent par attendre, et il n'y a aucun intérêt à lancer un flux de travail car vous perdez tout le
00:06:00parallélisme. C'est pourquoi, si les tâches dépendent moins les unes des autres, vous obtenez un meilleur parallélisme et
00:06:05des résultats plus rapides. Ce dont votre startup devrait s'inspirer, car elle dépend encore de l'argent de vos parents
00:06:10pour survivre. La raison suivante d'utiliser des flux de travail dynamiques est si la tâche nécessite plus qu'une seule fenêtre de
00:06:15contexte pour s'exécuter et doit être divisée en morceaux. Les flux de travail utilisent plusieurs sous-agents, chacun ayant sa
00:06:21propre fenêtre de contexte, donc la tâche doit être assez grande pour justifier ces fenêtres séparées. Sinon,
00:06:26vous ne ferez que perdre du temps et des jetons. Chaque sous-agent s'exécute dans son propre contexte frais et renvoie
00:06:31uniquement le résultat. Le reste de son raisonnement reste dans le fichier de code et n'entre jamais dans la fenêtre de contexte principale
00:06:36sauf si vous en avez besoin. La raison suivante est que la tâche mérite d'être vérifiée. Utilisez un flux de travail quand une mauvaise réponse
00:06:41est suffisamment coûteuse pour nécessiter une vérification croisée avant d'aller plus loin. Cela inclut des choses comme
00:06:46les failles de sécurité, les déclarations de bogues et les migrations. Mais cette vérification coûte des agents supplémentaires qui brûlent
00:06:52des jetons et du temps. Assurez-vous donc que la tâche en vaut vraiment la peine et que vous n'êtes pas juste en train de générer cinq agents
00:06:57parce que vous avez récemment entendu un PDG de l'IA dire que plus de jetons égale plus d'argent. La dernière raison est que
00:07:03votre tâche est déterministe. Un flux de travail utilise du code pour appeler des agents dans une structure fixe. Donc si la tâche est
00:07:09déterministe, allez-y. Si la tâche n'est pas déterministe et nécessite qu'un agent évalue quelle
00:07:14devrait être la prochaine tâche au moment de l'exécution, les flux de travail ne sont pas faits pour cela. Donc, quand vous choisissez entre workflow et
00:07:20goal, pensez à la forme de la tâche. Une tâche peut être large ou profonde. “Large” signifie qu'elle peut être divisée en plusieurs
00:07:25sous-tâches pouvant s'exécuter en même temps. “Profonde” signifie une tâche à la fois, allant étape par étape plus loin dedans.
00:07:32Un flux de travail est large, donc au lieu d'aller plus profondément, il appelle juste les agents et les laisse itérer. Pour les tâches
00:07:37profondes, la commande “goal” prend une tâche à la fois et ne fait pas tourner les choses en parallèle comme le font les flux de
00:07:43travail. N'utilisez un flux de travail que lorsque la tâche correspond réellement, pour ne pas gaspiller de jetons.
00:07:48Claude Code est déjà livré avec un flux de travail dynamique intégré appelé “Deep Research”. C'est essentiellement le
00:07:53pipeline de recherche multi-étapes que nous avions l'habitude de construire à la main avec plusieurs fichiers de contexte et Claude.md. Maintenant
00:07:58c'est juste un flux de travail que vous pouvez invoquer depuis n'importe quel projet. Cette recherche forme une partie clé de tout l'OS que
00:08:04vous construisez. Elle garantit que les sources d'information derrière cet OS sont dignes de confiance, afin que votre maman ne puisse pas vous nourrir
00:08:09d'infos bidon de son groupe Facebook pour boomers et vous gronder ensuite quand vous vérifiez ses dires. Cela fonctionne en cinq
00:08:14parties, et chacune mène à la suivante. D'abord, il cherche des informations, puis récupère les détails
00:08:19des sources trouvées. Après cela vient la vérification contradictoire pour valider les affirmations,
00:08:24et il synthétise ce qui survit dans un document final. Vous pouvez le regarder travailler depuis la
00:08:29commande de flux de travail, où chaque sous-agent hérite de ses outils du parent, et c'est vraiment très
00:08:34intensif en jetons, donc cela peut brûler toute votre limite en un rien de temps. Ce seul test a pris un million de jetons sur un
00:08:39petit sujet. En dehors de la recherche multi-étapes, vous pouvez créer d'autres flux de travail de recherche qui deviennent une partie de
00:08:45votre système de recherche. L'un de ceux que nous avons créés recherche les concurrents, vérifie leurs performances,
00:08:49et trouve l'avantage concurrentiel qu'ils possèdent. C'est un élément important si vous êtes un constructeur de produits. Vous
00:08:54avez besoin de savoir comment vos concurrents se débrouillent sur le marché pour pouvoir construire quelque chose de meilleur.
00:08:59Celui-ci est divisé en quatre phases, comme le flux de travail de recherche, et une fois terminé, il rapporte
00:09:04les résultats. Notre test a utilisé 679 000 jetons et 34 agents et a rédigé un rapport Markdown complet avec ses conclusions.
00:09:11Il s'améliore aussi au fur et à mesure. Quand il rencontre un problème, il applique une correction, donc la prochaine fois que vous le lancez,
00:09:17il ne rencontrera pas les mêmes problèmes qu'au début. Le rapport est accompagné de mesures de comparaison clairement définies
00:09:21et de toutes ses conclusions, donc lorsque vous construisez votre produit, vous pouvez l'utiliser comme source
00:09:26pour analyser le marché avant le lancement. Aussi, si vous appréciez notre contenu, pensez à appuyer
00:09:30sur le bouton “hype” car cela nous aide à créer plus de contenu comme celui-ci et à toucher plus de personnes.
00:09:35Chaque système d'exploitation a besoin de son noyau, de ses pilotes et des pièces qui le complètent. Ensemble,
00:09:41ils le laissent fonctionner sans votre intervention. Un exemple d'un tel système est une configuration de “second cerveau”. C'est
00:09:45définitivement utile si votre premier cerveau, comme le nôtre, est devenu complètement foiré à force de rester inutilisé depuis que
00:09:50nos appareils ont été bénis par les LLM. Le noyau de ce second cerveau devient votre Claude.md,
00:09:55qui contient les informations sur la façon de naviguer dans tout le système. Les programmes du quotidien, les choses répétables,
00:10:01sont vos compétences. Ils contiennent les instructions pour les tâches que vous faites encore et encore. Voici la meilleure
00:10:06façon d'en configurer un. Lorsque vous êtes en pleine session longue et réalisez que c'est quelque chose que vous ferez souvent,
00:10:11demandez simplement à Claude de combiner les enseignements de cette session en une compétence. La mémoire de cet OS est composée de tous
00:10:16les fichiers que vous créez et maintenez dans votre coffre-fort. Ils enregistrent ce que vous faites et comment vous le faites. Cela
00:10:21signifie qu'il en sait plus sur vous que vous-même, et ils donnent à Claude du contexte sur tout ce que vous
00:10:25faites. Nous avons souvent besoin que le second cerveau accède à des sources externes, nous avons donc configuré les
00:10:29MCP Google Calendar et Notion. De cette façon, il peut accéder aux fichiers de projet dans Notion et synchroniser les données,
00:10:35lire l'emploi du temps sur le calendrier, et créer ou mettre à jour des entrées afin de pouvoir glisser un peu de “toucher de l'herbe”
00:10:41entre vos horaires déjà bien chargés. Nous avons documenté les formats exacts qu'il doit suivre dans le fichier Claude.md
00:10:46et le plus important est de créer les flux de travail pour votre configuration. Ils vous permettent de paralléliser
00:10:51vos tâches répétables et de les confier à des sous-agents. Le flux de travail de briefing matinal que nous avons construit lance des sous-agents
00:10:57pour rassembler des informations à partir de multiples sources et renvoie un résumé pour commencer notre journée. Une fois que tout cela est
00:11:02configuré, vous lui donnez simplement un prompt. Il charge la bonne compétence et le bon contexte, crée les fichiers aux bons endroits,
00:11:07et connecte les informations aux parties pertinentes par lui-même. Si vous utilisez le second cerveau
00:11:12depuis un certain temps, vous devriez construire un flux de travail d'audit. Il vérifie les liens brisés, expose chaque problème
00:11:17dans la configuration et les rapporte. À partir de là, vous pouvez exécuter les corrections et garder votre second cerveau en excellente
00:11:22forme, mais connaissant le genre d'homme que vous êtes, vous paierez aussi pour ses séances de thérapie dès la semaine prochaine.
00:11:27De la même manière que vous pouvez configurer tout un système d'exploitation pour des projets non liés au codage, vous pouvez faire de même pour
00:11:32vos projets de codage. Vous configurez votre Claude.md comme noyau et mettez toutes les informations
00:11:37du projet à l'intérieur. Vous configurez les agents pour votre projet qui agissent comme vos programmes du quotidien.
00:11:42Vous configurez également des “hooks” pour différents cas, comme le formatage d'un fichier après qu'un agent ait fini de l'éditer,
00:11:46pour que, entre le bordel absolu que vous appelez votre relation et votre code, au moins une chose
00:11:51soit organisée. Vous créez des compétences pour différentes tâches, comme l'ajout d'un nouveau point de terminaison. De cette façon, chaque point de terminaison
00:11:56suit exactement le schéma que vous voulez, et vous pouvez créer des flux de travail pour des choses comme la révision des changements avant
00:12:01l'envoi, la migration de la base de code ou de la base de données, et l'exécution de tests de bout en bout pour confirmer que toute
00:12:07l'application fonctionne. Au lieu que votre manager vous réveille à 2h du matin parce que votre prod est encore tombée, le
00:12:12contexte pour cet OS devient les fichiers de votre dossier docs et le code lui-même. Les flux de travail sont exceptionnellement
00:12:17utiles pour les migrations de projet. Vous pouvez en construire un qui convertit tout votre projet d'une bibliothèque à
00:12:22une autre et laisser les agents individuels gérer la conversion. Nous l'avons testé, et sans
00:12:27flux de travail, cela prenait plus d'une heure, mais avec un flux de travail, cela ne prenait que 21 minutes. Donc, le temps gagné
00:12:32avec les flux de travail peut être utilisé pour des choses plus importantes, comme parcourir les deepfakes inappropriés de Dario.
00:12:37C'est ainsi que notre système d'exploitation s'étend aux cas d'utilisation du codage, de sorte que lorsque vous construisez des projets,
00:12:43vous n'avez pas à tout gérer à la main. Vous laissez le système d'exploitation le faire pour vous. Si vous voulez
00:12:47fonder la prochaine grande société SaaS IA B2B mais que vous ne savez pas par où commencer, vous devriez être dans AI Labs Pro.
00:12:53C'est là que vous trouverez les flux de travail utilisés dans cette vidéo, avec toutes les autres ressources,
00:12:57guides et goodies que nous avons rassemblés. Vous pourrez aussi rencontrer un groupe de nerds partageant les mêmes idées,
00:13:01y compris notre équipe. Le lien est dans la description, vous pouvez aller voir ça.
00:13:05C'est la fin de cette vidéo. Si vous souhaitez soutenir la chaîne et nous aider à continuer à faire
00:13:09des vidéos comme celle-ci, vous pouvez le faire en utilisant le bouton “super thanks” ci-dessous. Comme toujours, merci de
00:13:14m'avoir regardé et je vous vois dans la prochaine.

Key Takeaway

Claude Code transforme l'automatisation du développement en un système d'exploitation modulaire, utilisant des flux de travail dynamiques déterministes pour diviser les tâches complexes en unités parallèles, réduisant ainsi drastiquement les délais d'exécution.

Highlights

  • Claude Code agit comme un système d'exploitation complet coordonnant des agents, des outils MCP et des flux de travail automatisés.

  • Le fichier Claude.md sert de noyau au système, déterminant les capacités de l'agent et la compréhension du projet.

  • Les flux de travail dynamiques permettent de paralléliser des tâches complexes en générant plusieurs sous-agents dotés de fenêtres de contexte isolées.

  • La conversion d'un projet via un flux de travail dédié prend 21 minutes contre plus d'une heure en exécution manuelle.

  • Le mode de flux de travail en aperçu consomme un volume élevé de jetons en raison de l'activation simultanée de multiples sous-agents.

  • La commande 'resume' permet de reprendre un flux de travail là où il s'est arrêté après une interruption de session grâce aux données mises en cache.

Timeline

Architecture du système Claude Code

  • Claude Code fonctionne comme un système d'exploitation pour coordonner les tâches sur une machine.
  • Le noyau du système est défini par le fichier Claude.md et les fichiers de contexte associés.
  • Le protocole MCP (Model Context Protocol) agit comme un pilote permettant l'interaction avec des outils externes.
  • Les routines automatisées et les boucles remplacent les interventions manuelles pour les tâches répétitives.

Le système repose sur une structure modulaire similaire à un OS informatique. Le fichier Claude.md joue le rôle de noyau, centralisant les instructions nécessaires à la compréhension du projet par l'agent. Les compétences répétables et les outils MCP assurent l'exécution des tâches quotidiennes et l'accès aux ressources externes, tandis que les routines automatisées permettent une exécution autonome, même en l'absence de l'utilisateur.

Flux de travail dynamiques vs architectures classiques

  • Les flux de travail dynamiques introduits avec Opus 4.8 sont déterministes et pilotés par du code JavaScript.
  • Contrairement aux 'buts' (goals) non-déterministes, les flux de travail imposent une structure fixe et des schémas de sortie stricts.
  • Chaque flux est stocké dans le répertoire .Claude/workflow et permet une persistance de progression via la commande 'resume'.

Les flux de travail dynamiques se distinguent des méthodes de compétences simples ou des objectifs itératifs par leur caractère déterministe. Ils utilisent du code JavaScript pour définir les étapes que les sous-agents doivent suivre. Cette structure permet un contrôle strict sur le format des résultats attendus et garantit une reprise efficace du travail après une coupure de session.

Optimisation de l'utilisation des flux

  • L'exécution de flux de travail consomme un grand nombre de jetons en raison de l'isolation des fenêtres de contexte par sous-agent.
  • Le parallélisme est optimal uniquement lorsque les sous-tâches sont indépendantes les unes des autres.
  • La recherche multi-étapes est un flux intégré qui automatise la vérification croisée des sources d'information.

L'utilisation des flux de travail doit être stratégique pour éviter une consommation excessive de jetons. Il est conseillé de privilégier cette méthode pour des tâches déterministes, vérifiables et suffisamment larges pour être parallélisées. Le système inclut des flux natifs comme 'Deep Research', qui automatise la collecte et la synthèse d'informations avec une rigueur de vérification élevée.

Configuration d'un second cerveau et automatisation projet

  • Un système de second cerveau centralise la gestion des calendriers, des notes Notion et des tâches récurrentes.
  • Les flux de travail auditent régulièrement la configuration pour détecter les liens brisés ou les problèmes de structure.
  • Pour le codage, les flux automatisent les migrations de bibliothèques et l'ajout standardisé de points de terminaison.

L'implémentation d'un second cerveau via Claude Code permet d'intégrer des outils de productivité comme Notion et Google Calendar. En automatisant les tâches répétitives et en instaurant des audits réguliers, le système maintient une organisation rigoureuse. Cette approche s'applique également aux projets de développement, où les flux de travail gèrent des opérations critiques comme les migrations de base de code, garantissant ainsi une efficacité accrue.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video