00:00:00Le principal problème des agents IA est la fenêtre de contexte limitée,
00:00:03qui restreint ce qu'ils retiennent des actions précédentes.
00:00:06Quand on confie une tâche plus importante à Claude Code,
00:00:08il se compacte plusieurs fois en tentant une seule fonctionnalité,
00:00:11oubliant la tâche principale qu'on lui a demandé d'implémenter,
00:00:14ce qui le rend moins efficace pour les tâches de longue durée.
00:00:17Anthropic vient de publier une solution basée sur la façon dont de vraies équipes travaillent dans un environnement d'ingénierie réel.
00:00:22Ils ont identifié deux raisons principales pour lesquelles il échoue sur les tâches longues.
00:00:26Beaucoup d'entre nous ont essayé de réaliser des applications entières ou de grosses fonctionnalités en une seule fois,
00:00:31et en faire trop fait que le modèle épuise son contexte.
00:00:34Après des compactages répétés,
00:00:35la fenêtre de contexte est rafraîchie avec la fonctionnalité à moitié implémentée,
00:00:39sans aucune mémoire de sa progression,
00:00:41ce qui conduit à une implémentation incomplète.
00:00:43Le deuxième problème est que,
00:00:44en raison de capacités de test limitées,
00:00:46Claude marque les fonctionnalités non testées comme terminées.
00:00:49Il suppose que la fonctionnalité est complète,
00:00:51même si elle ne fonctionne pas correctement.
00:00:53Leur solution consistait à utiliser un agent d'initialisation et un agent de codage en harmonie,
00:00:57inspirés par le fonctionnement des vraies équipes logicielles.
00:00:59Ce flux de travail est initialement conçu pour les agents que vous construisez vous-même,
00:01:03mais j'ai réalisé qu'il pouvait aussi s'appliquer aux instances de Claude Code.
00:01:06Le premier agent se concentre sur l'initialisation correcte de votre agent de codage,
00:01:10et il faut être patient car cela prend un peu de temps.
00:01:12J'ai un projet Next.js vide et je veux construire un compilateur Python en ligne.
00:01:16Avant de commencer,
00:01:17créez un fichier Claude.md en utilisant la commande init.
00:01:20Ce fichier est un document pour votre base de code et se trouve à la racine de votre projet,
00:01:24contenant un aperçu et toutes les informations importantes.
00:01:27Ensuite,
00:01:27générez le JSON de la liste des fonctionnalités à la racine du projet.
00:01:30Il doit lister toutes les fonctionnalités et leurs étapes de test correspondantes,
00:01:33avec tous les tests marqués comme échouant initialement,
00:01:36afin que Claude soit forcé de les tester.
00:01:38Nous utilisons JSON au lieu de Markdown car les fichiers JSON sont plus faciles à gérer dans le contexte.
00:01:43Puisque Claude ne peut tester que le code,
00:01:44et non l'interface que nous voyons sur le navigateur,
00:01:47j'ai connecté Puppeteer pour les tests de navigateur.
00:01:49Après cela,
00:01:49créez un script d'initialisation pour guider le démarrage du serveur de développement et un fichier de suivi de progression afin que le système puisse suivre l'état d'avancement du projet.
00:01:57Pour les directives,
00:01:58Claude doit mettre à jour progress.md après chaque exécution et tester chaque fonctionnalité après implémentation.
00:02:04La pratique la plus importante est de committer sur Git.
00:02:07Nous sous-estimons à quel point il est crucial de committer dans un état fusionnable.
00:02:10Les commits Git avec des logs clairs montrent ce qui est terminé et vous permettent de revenir en arrière si l'implémentation échoue.
00:02:15Enfin,
00:02:16Claude ne doit pas modifier la liste des fonctionnalités au-delà du marquage des fonctionnalités comme implémentées.
00:02:20L'environnement étant prêt, nous passons à la partie codage.
00:02:23L'idée était d'implémenter chaque fonctionnalité une par une à partir du JSON des fonctionnalités.
00:02:27Claude a également créé des messages de commit descriptifs après chaque fonctionnalité testée et a également lancé le navigateur si nécessaire.
00:02:33Une fois qu'il a vérifié que l'application fonctionnait,
00:02:35il a mis à jour les champs JSON de false à true et a mis à jour progress.md avec ce qui avait été accompli jusqu'à présent.
00:02:42Enfin,
00:02:42il a committé les changements et vérifié que le commit avait réussi.
00:02:45L'avantage de cette approche incrémentale est que même si la session se termine,
00:02:49vous pouvez reprendre exactement là où vous vous étiez arrêté.
00:02:51Tout est suivi dans les logs Git,
00:02:53vous n'avez donc pas à vous soucier de casser le code.
00:02:55Claude peut comprendre le projet à partir des logs Git et du fichier de progression,
00:02:59et non du code lui-même,
00:03:00vous pouvez donc reprendre la session facilement.
00:03:02Votre prochaine instruction est simplement d'implémenter la prochaine fonctionnalité marquée
00:03:06"Non fait"
00:03:06.
00:03:06Cette approche réduit également la tendance de Claude à marquer les fonctionnalités comme terminées sans tests appropriés.
00:03:11Chaque itération garantit que l'application est construite de bout en bout avec de vrais tests,
00:03:15aidant à identifier les bugs qui ne sont pas évidents à partir du code seul.
00:03:19Nous répétons ce cycle jusqu'à ce que toutes les fonctionnalités soient marquées comme vraies.
00:03:22Vous pourriez penser que c'est similaire à la méthode BMAD.
00:03:24Il y a des similitudes,
00:03:25mais je pense que le flux de travail de Claude est meilleur à certains égards.
00:03:28C'était plus facile car vous n'appeliez pas les agents séparément,
00:03:31et l'utilisation du contexte était également meilleure.
00:03:33Après avoir implémenté tant de fonctionnalités,
00:03:36il n'a utilisé que 84% du contexte,
00:03:37alors que BMAD aurait déjà compacté deux fois à cause des grandes histoires qu'il crée.
00:03:42Cela dit,
00:03:42BMAD est toujours un système complet prêt à l'emploi,
00:03:45tandis que ceci n'est encore qu'une idée qui doit être implémentée.
00:03:48Mais BMAD pourrait tirer parti de certaines choses de cette approche,
00:03:50comme le système Git.
00:03:51Après avoir enseigné à des millions de personnes comment construire avec l'IA,
00:03:54nous avons commencé à implémenter ces flux de travail nous-mêmes.
00:03:57Nous avons découvert que nous pouvions construire de meilleurs produits plus rapidement que jamais auparavant.
00:04:00Nous avons aidé à donner vie à vos idées,
00:04:02qu'il s'agisse d'applications ou de sites web.
00:04:04Peut-être avez-vous regardé nos vidéos en pensant :
00:04:06"J'ai une excellente idée,"
00:04:07mais je n'ai pas d'équipe technique pour la construire.
00:04:09"C'est exactement là que nous intervenons."
00:04:10Pensez à nous comme à votre copilote technique.
00:04:12Nous appliquons les mêmes flux de travail que nous avons enseignés à des millions de personnes directement à votre projet,
00:04:17transformant les concepts en solutions réelles et fonctionnelles sans les tracas de l'embauche ou de la gestion d'une équipe de développement.
00:04:22Prêt à transformer rapidement votre idée en réalité ?
00:04:25Contactez-nous à hello@autometer.dev.
00:04:27Cela nous amène à la fin de cette vidéo..
00:04:29Si vous souhaitez soutenir la chaîne et nous aider à continuer à faire des vidéos comme celle-ci,
00:04:33vous pouvez le faire en utilisant le bouton Super Merci ci-dessous.
00:04:36Comme toujours,
00:04:36merci d'avoir regardé,
00:04:37et je vous dis à la prochaine.