Gemini Conductor : Le nouvel outil de Google pour améliorer le codage IA

AAI LABS
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Si vous suivez la chaîne,
00:00:01vous devez connaître les différents types de workflows d'ingénierie de contexte que nous avons abordés ici.
00:00:05Eh bien, Google en a également publié un nouveau.
00:00:07J'aimerais pouvoir dire qu'il est meilleur que les autres workflows.
00:00:10Mais la vérité, c'est qu'il ne l'est pas.
00:00:11Et il y a de nombreux problèmes avec celui-ci.
00:00:13Même si vous soutenez qu'il est meilleur pour l'écosystème Gemini,
00:00:16il n'est toujours pas bon.
00:00:17Avant d'expliquer pourquoi il n'était pas nécessaire de publier cela,
00:00:20faisons une petite pause pour parler d'Automata.
00:00:22Après avoir enseigné à des millions de personnes comment créer avec l'IA,
00:00:25nous avons commencé à implémenter nous-mêmes ces workflows.
00:00:27Nous avons découvert que nous pouvions créer de meilleurs produits plus rapidement que jamais.
00:00:31Nous aidons à donner vie à vos idées,
00:00:33qu'il s'agisse d'applications ou de sites web.
00:00:35Peut-être avez-vous regardé nos vidéos en pensant : j'ai une excellente idée mais je n'ai pas d'équipe technique pour la réaliser.
00:00:40C'est exactement là que nous intervenons..
00:00:42Considérez-nous comme votre copilote technique.
00:00:44Nous appliquons les mêmes workflows que nous avons enseignés à des millions de personnes directement à votre projet,
00:00:49transformant les concepts en solutions concrètes et fonctionnelles sans les tracas d'embaucher ou de gérer une équipe de développement.
00:00:55Prêt à accélérer la concrétisation de votre idée?
00:00:57Contactez-nous à hello@automata.dev..
00:00:59Maintenant,
00:01:00avant d'expliquer pourquoi il s'agit simplement d'une autre tentative médiocre de workflow d'ingénierie de contexte,
00:01:05examinons d'abord comment Conductor fonctionne réellement.
00:01:07Voici donc l'article et je mettrai un lien dans la description ci-dessous.
00:01:11À la fin,
00:01:11vous obtiendrez une commande pour installer ceci en tant qu'extension dans Gemini CLI.
00:01:15Pour ceux qui ne le savent pas,
00:01:16les extensions sont des ensembles de commandes,
00:01:18de MCP et d'autres règles qui sont regroupés et transformés en un package que les gens peuvent ensuite héberger et partager avec d'autres.
00:01:24Claude a également quelque chose de similaire appelé plugins.
00:01:27Donc,
00:01:27pour lancer le workflow,
00:01:28vous utilisez la commande et il s'installe.
00:01:30Après l'installation,
00:01:31vous pouvez utiliser ses commandes slash dans Conductor.
00:01:33Vous obtiendrez ces cinq commandes qui contrôlent réellement Conductor et la façon dont vous utilisez le workflow.
00:01:38La toute première commande que vous allez utiliser est la commande setup..
00:01:41Ce que fait cette commande,
00:01:43c'est d'abord vérifier si les fichiers Conductor existants,
00:01:45tels que l'état de configuration et les autres fichiers qui lui indiquent si un projet a déjà été initialisé,
00:01:50sont disponibles ou non.
00:01:51Au lieu de stories,
00:01:52il crée ces fichiers appelés tracks et les complète un par un.
00:01:56Ensuite,
00:01:57il a initialisé un nouveau dépôt GitHub et a demandé ce qu'il fallait construire.
00:02:00Pour le tester,
00:02:01j'ai créé un projet simple mais je voulais tester si l'architecture qu'il créerait serait réellement bonne.
00:02:06Donc,
00:02:06juste pour tester s'il recommanderait les choses dont j'aurais réellement besoin,
00:02:10je lui ai dit qu'il devait être prêt pour la production et évolutif pour un plus grand nombre d'utilisateurs.
00:02:15Ensuite,
00:02:16il a créé le fichier product.md qui contenait le concept réel de ce que je voulais construire.
00:02:20Pour le raffiner et le peaufiner,
00:02:21il a commencé à me poser des questions et à la fin,
00:02:24parce que les questions ne menaient nulle part et qu'elles étaient vraiment simplistes,
00:02:28je l'ai simplement laissé tout générer automatiquement.
00:02:30Après avoir approuvé et enregistré le guide produit,
00:02:33il voulait créer un autre fichier qui était les directives produit,
00:02:36principalement axées sur le style du produit et certains principes de conception.
00:02:39Il a également approuvé cela et enregistré les directives produit.
00:02:42Ensuite,
00:02:43il a défini la pile technologique et c'est l'une des raisons pour lesquelles le workflow n'était pas bon.
00:02:48Il a mal géré la pile technologique qu'il me proposait parce qu'il connaissait l'ensemble de mon projet et ne recommandait toujours pas ce qui était approprié.
00:02:55Après avoir fait corriger cela,
00:02:56il a également approuvé la pile technologique et mis à jour ce fichier MD également.
00:03:00Il a aussi ces fichiers appelés guides de style de code.
00:03:03Si je vais dans le dossier actuel,
00:03:04ce sont les seuls langages qu'il possède et s'il pense que nous allons utiliser l'un d'entre eux dans le projet,
00:03:09il les ajoute aux guides de style de code de notre projet actuel pendant l'initialisation.
00:03:13Le workflow par défaut qu'il utilise est en fait plutôt bon.
00:03:16Par défaut,
00:03:16il inclut une couverture de test de code à 80 % et pendant qu'il configurait les choses et écrivait les composants de base,
00:03:22il s'assurait que les tests étaient également écrits et après avoir terminé les tâches,
00:03:26il les testait également.
00:03:27En même temps,
00:03:28il validait les modifications après chaque tâche et utilisait également les notes git pour que nous puissions suivre où et quand quelque chose tournait mal.
00:03:35Après avoir terminé la configuration initiale,
00:03:37il a créé des exigences produit de haut niveau afin que nous puissions commencer la piste initiale.
00:03:41Voici la première piste qu'il essayait d'implémenter..
00:03:45Encore une fois,
00:03:45c'était trop large et devait être divisé en pistes plus petites.
00:03:48C'était trop à faire en une seule piste et il y avait beaucoup de risques de se tromper s'il faisait tout cela en même temps.
00:03:54Donc,
00:03:54une fois que vous avez terminé cela,
00:03:56vous pouvez commencer votre travail en exécutant la commande implement et dans le dossier tracks,
00:04:00vous avez différentes pistes qu'il implémente une par une.
00:04:03Chaque piste a deux fichiers, un plan.md et un spec.md.
00:04:06Le spec.md contient l'objectif et les détails techniques extraits de la pile technologique et des informations que nous avons saisies au début.
00:04:12Le plan.md contient en fait les tâches qu'il doit implémenter une par une.
00:04:15Lorsque vous utilisez réellement la commande implement,
00:04:18il regarde le tracks.md et examine essentiellement chaque piste où,
00:04:21en fonction du statut,
00:04:22il sait réellement quoi faire.
00:04:23Donc si c'est vide, ce n'est pas démarré.
00:04:25Cela signifie qu'il est en cours et cela signifie que la piste a été complétée.
00:04:28Et comme vous pouvez le voir,
00:04:30cette piste actuelle est en cours.
00:04:31Quant aux autres commandes,
00:04:32la commande status vous donne un rapport d'état de ce qui se passe actuellement et quelles pistes sont suivies et lesquelles ne sont pas terminées.
00:04:39Si vous utilisez la commande new track,
00:04:41il va vous poser à nouveau les différentes questions pour la nouvelle tâche.
00:04:44Je l'ai également implémenté dans un dépôt préexistant et cela s'est passé à peu près de la même manière.
00:04:49C'était un peu différent parce qu'il regardait les fichiers existants et me posait simplement des questions de clarification et il ne demandait pas de nouvelle piste..
00:04:57J'ai dû implémenter une nouvelle piste moi-même en tant que nouvelle fonctionnalité.
00:05:01Et puis il y a revert,
00:05:02une autre fonctionnalité vraiment intelligente qui atténue réellement tout dommage et est consciente de git.
00:05:06Elle utilise donc git pour aider si l'agent se trompe quelque part.
00:05:09Maintenant,
00:05:09actuellement la gestion et la structure des fichiers ne sont pas si mauvaises.
00:05:12La façon dont il implémente de nouvelles fonctionnalités ou des tâches existantes dans les pistes,
00:05:16puis en assure le suivi,
00:05:17est en fait plutôt bonne.
00:05:18Mais la façon dont les instructions ont été écrites ou comment ces fichiers de commande ont été écrits nécessite du travail parce qu'ils ne gèrent pas vraiment correctement la boucle de contexte où il doit tout vérifier.
00:05:27Et s'il y a un changement,
00:05:29alors comment il doit le modifier.
00:05:30Parce que même pendant ce processus initial,
00:05:32il y a eu beaucoup d'erreurs.
00:05:33La première erreur est que pendant qu'il demandait la création de chaque document,
00:05:36il n'a pas vraiment disséqué mon idée correctement.
00:05:38Et j'ai dû le guider à travers beaucoup de choses.
00:05:40Quand j'ai pensé que c'était adéquat,
00:05:42je l'ai simplement laissé générer automatiquement le reste du contenu.
00:05:45Et encore une fois,
00:05:46comme je l'ai mentionné précédemment,
00:05:47lors de la définition de la pile technologique,
00:05:49il a également raté beaucoup de choses.
00:05:51L'option B était bonne.
00:05:52Mais comme je lui ai dit que je voulais une application entièrement évolutive avec un grand nombre d'utilisateurs,
00:05:56il a raté beaucoup de choses que j'ai dû clarifier et lui dire explicitement qu'il avait également besoin,
00:06:01puis il a modifié le plan.
00:06:02Lorsque la piste initiale a été générée,
00:06:03je suis entré et j'ai regardé le plan et les spécifications qu'il avait générés et le schéma de base de données était totalement incomplet.
00:06:09Il avait raté beaucoup de choses qui étaient cruciales pour configurer l'application et j'ai dû le guider à nouveau et le diriger dans la bonne direction.
00:06:15Maintenant, Gemini est en fait un très bon modèle.
00:06:17Je dois donc supposer que ce sont les commandes qui ont été implémentées qui le font se comporter de cette façon..
00:06:23Et puis la plus grande raison pour laquelle je pense que même si la configuration elle-même est plutôt bonne,
00:06:27il y a beaucoup de problèmes dans les commandes principales slash et surtout dans le workflow dot MD,
00:06:31c'est parce qu'il a complètement raté une partie vraiment importante après que je lui ai dit que je voulais changer NPM.
00:06:36Et à la place,
00:06:37je voulais utiliser PNPM puisque j'avais oublié de le mentionner plus tôt.
00:06:40Pour une raison quelconque,
00:06:41il a essayé de faire une sauvegarde d'abord..
00:06:43Et en faisant cela,
00:06:44il a déclaré qu'il devait supprimer les fichiers créés avec NPM.
00:06:47Mais il a fini par supprimer le dossier conductor entier lui-même,
00:06:50qui contenait tous les fichiers de planification.
00:06:52Après avoir supprimé cela,
00:06:53il cherchait continuellement le dossier.
00:06:55Et quand il n'a pas pu le trouver,
00:06:56il a dit qu'il allait reconstruire le dossier conductor en utilisant son contexte et tout ce qu'il avait dans sa mémoire..
00:07:02Donc en gros,
00:07:03il a dû tout réécrire contrairement à ce qu'un workflow de contexte normal devrait faire,
00:07:06où le changement ne devrait affecter que les fichiers de contexte principaux et les fichiers liés à cette tâche spécifique,
00:07:11ce qui est la façon dont be mad fonctionne efficacement.
00:07:13Maintenant,
00:07:14si je ne lui avais pas demandé de changer quelque chose brusquement,
00:07:16peut-être que cela aurait bien fonctionné.
00:07:18Mais quand même,
00:07:19lorsqu'il initialisait toutes les tâches,
00:07:20et que je lui ai demandé de commencer à implémenter la première trace,
00:07:23il a commencé et initialisé le projet et les autres services principaux dont j'avais besoin.
00:07:27Maintenant,
00:07:27quand il s'agissait de configurer les variables d'environnement pour la connexion super base,
00:07:31pour une raison quelconque,
00:07:32il a automatiquement marqué la tâche comme terminée tout en mettant clairement une clé factice dedans.
00:07:36Il ne m'a même pas demandé de configurer le projet super base ou de lui fournir une vraie clé.
00:07:40Et il a automatiquement essayé de pousser le schéma de base de données.
00:07:43Comme il n'y avait pas de vraie clé, ça a échoué.
00:07:45Et ensuite il m'a demandé de vérifier la chaîne.
00:07:47Donc même les tâches ne sont pas correctement mises à jour,
00:07:49et il ne les suivait pas vraiment correctement.
00:07:51Honnêtement,
00:07:51je n'utiliserais pas cela pour le moment pour le développement de spécifications de bout en bout.
00:07:55Be mad est une bien meilleure option.
00:07:57Et pour les petits projets,
00:07:58je crée encore mes propres fichiers de contexte.
00:08:00Cela nous amène à la fin de cette vidéo.
00:08:01Si vous souhaitez soutenir la chaîne et nous aider à continuer à faire des vidéos comme celle-ci,
00:08:05vous pouvez le faire en utilisant le bouton super thanks ci-dessous.
00:08:08Comme toujours,
00:08:09merci d'avoir regardé et je vous retrouve dans la prochaine..

Key Takeaway

Gemini Conductor de Google est un workflow d'ingénierie de contexte qui, malgré quelques bonnes idées comme la gestion des fichiers et l'intégration git, souffre de nombreux problèmes d'implémentation et n'est pas recommandé pour le développement de bout en bout comparé à des alternatives comme Be Mad.

Highlights

Google a lancé Gemini Conductor, un nouveau workflow d'ingénierie de contexte, mais il présente de nombreux problèmes et n'est pas meilleur que les alternatives existantes

Conductor s'installe comme une extension dans Gemini CLI avec cinq commandes principales : setup, implement, status, new track et revert

Le workflow par défaut inclut une couverture de test de code à 80% et utilise git pour le versioning, ce qui est plutôt bon

Conductor a commis des erreurs majeures lors des tests : pile technologique inadéquate, schéma de base de données incomplet, et suppression accidentelle du dossier conductor entier

Le système de gestion des tâches est défaillant : il a marqué des tâches comme terminées avec des clés factices sans demander les vraies credentials

Be Mad reste une meilleure option pour le développement de bout en bout selon l'auteur

Pour les projets évolutifs avec beaucoup d'utilisateurs, Conductor n'a pas recommandé les technologies appropriées malgré les informations fournies

Timeline

Introduction et présentation d'Automata

L'auteur introduit le sujet en mentionnant que Google a publié un nouveau workflow d'ingénierie de contexte appelé Gemini Conductor, mais annonce d'emblée qu'il n'est pas meilleur que les autres workflows existants et présente de nombreux problèmes. Avant d'expliquer les défauts de Conductor, il fait une pause sponsorisée pour présenter Automata, leur service qui aide à donner vie aux idées en créant des applications et sites web. Le service s'adresse à ceux qui ont des idées mais pas d'équipe technique, en appliquant les workflows d'IA enseignés à des millions de personnes directement aux projets des clients. Cette introduction établit le contexte critique de la revue à venir tout en présentant l'expertise de l'auteur dans le domaine des workflows d'IA.

Installation et commandes de base de Conductor

L'auteur commence l'explication technique de Conductor en présentant l'article officiel avec un lien dans la description. Conductor s'installe comme une extension dans Gemini CLI, similaire aux plugins de Claude, qui sont des ensembles de commandes, MCP et règles regroupés en package partageable. Après l'installation via une commande, l'utilisateur obtient accès à cinq commandes slash principales qui contrôlent le workflow : setup, implement, status, new track et revert. Cette section établit les bases techniques nécessaires pour comprendre comment Conductor fonctionne. L'auteur compare cette approche à celle d'autres outils pour contextualiser l'architecture de Conductor.

La commande setup et initialisation du projet

L'auteur explique en détail le fonctionnement de la commande setup, qui est la première étape du workflow. Cette commande vérifie d'abord l'existence de fichiers Conductor préexistants pour savoir si un projet a déjà été initialisé. Au lieu de 'stories', Conductor crée des fichiers appelés 'tracks' qu'il complète progressivement, initialise un nouveau dépôt GitHub et demande ce qu'il faut construire. Pour tester le système, l'auteur a créé un projet simple mais volontairement demandé qu'il soit prêt pour la production et évolutif pour tester si l'architecture recommandée serait appropriée. Conductor crée ensuite le fichier product.md avec le concept du projet et pose des questions de clarification, bien que l'auteur note que ces questions étaient simplistes et ne menaient nulle part, le forçant à tout générer automatiquement.

Création des fichiers de configuration et problèmes de pile technologique

Après l'approbation du guide produit, Conductor crée un fichier de directives produit axé sur le style et les principes de conception. Ensuite vient la définition de la pile technologique, et c'est là que l'auteur identifie un problème majeur : Conductor a mal géré les recommandations technologiques malgré une compréhension complète du projet. L'auteur a dû faire corriger la pile technologique manuellement. Conductor possède également des guides de style de code pour différents langages qu'il ajoute automatiquement pendant l'initialisation. Le workflow par défaut est décrit comme plutôt bon, incluant une couverture de test de code à 80%, l'écriture de tests pendant le développement, la validation des modifications après chaque tâche et l'utilisation de notes git pour le suivi. Cette section révèle la première faille significative de Conductor dans la sélection technologique.

Structure des tracks et commande implement

Après la configuration initiale, Conductor crée des exigences produit de haut niveau pour commencer la première track (piste). L'auteur critique cette première piste comme étant trop large et nécessitant d'être divisée en pistes plus petites avec trop de risques d'erreurs si tout est fait simultanément. Pour démarrer le travail, on utilise la commande implement qui traite les différentes pistes dans le dossier tracks. Chaque piste contient deux fichiers : plan.md avec les tâches à implémenter une par une, et spec.md avec l'objectif et les détails techniques extraits de la pile technologique. La commande implement examine le fichier tracks.md où le statut de chaque piste (vide = non démarré, en cours, ou complété) détermine les actions à prendre. Cette structure organisationnelle est l'un des aspects positifs du système.

Autres commandes et implémentation dans un dépôt existant

L'auteur présente les autres commandes disponibles dans Conductor. La commande status fournit un rapport d'état montrant les pistes en cours et terminées. La commande new track pose des questions pour créer une nouvelle tâche. L'auteur a également testé Conductor sur un dépôt préexistant, où le processus était légèrement différent car le système examinait les fichiers existants et posait seulement des questions de clarification sans demander de nouvelle piste automatiquement. La commande revert est présentée comme une fonctionnalité intelligente qui atténue les dommages grâce à une intégration git consciente, permettant de revenir en arrière si l'agent se trompe. Cette section montre la polyvalence du système mais aussi ses limitations dans différents contextes d'utilisation.

Première série d'erreurs : questions et pile technologique

L'auteur commence à détailler les nombreuses erreurs rencontrées lors de l'utilisation de Conductor. Bien que la gestion et la structure des fichiers soient décentes, et que l'implémentation et le suivi des tâches soient plutôt bons, les instructions et fichiers de commande sont mal écrits et ne gèrent pas correctement la boucle de contexte. La première erreur majeure est que pendant le processus initial, Conductor n'a pas correctement disséqué l'idée du projet malgré de nombreuses questions, obligeant l'auteur à beaucoup le guider avant de laisser le système générer automatiquement. Lors de la définition de la pile technologique, Conductor a raté beaucoup d'éléments essentiels malgré la demande explicite d'une application évolutive pour un grand nombre d'utilisateurs, nécessitant des clarifications manuelles. Ces erreurs suggèrent des problèmes fondamentaux dans l'implémentation des commandes plutôt que dans le modèle Gemini lui-même.

Erreurs critiques : schéma de base de données et suppression de fichiers

L'auteur révèle des erreurs encore plus graves dans le fonctionnement de Conductor. Le schéma de base de données généré pour la première piste était totalement incomplet, manquant des éléments cruciaux pour configurer l'application, nécessitant à nouveau un guidage manuel. L'erreur la plus grave s'est produite lorsque l'auteur a demandé de changer NPM pour PNPM après coup : Conductor a tenté de faire une sauvegarde mais a fini par supprimer le dossier conductor entier contenant tous les fichiers de planification. Après cette suppression, le système cherchait continuellement le dossier manquant et a finalement déclaré qu'il allait reconstruire tout le dossier conductor en utilisant son contexte et sa mémoire. Cette erreur majeure contraste fortement avec des workflows comme Be Mad où un changement n'affecte que les fichiers de contexte principaux et les fichiers liés à la tâche spécifique, démontrant une défaillance architecturale fondamentale.

Problèmes d'implémentation et gestion des tâches défaillante

L'auteur continue à documenter les problèmes rencontrés lors de l'implémentation réelle. Lorsque Conductor a initialisé le projet et les services principaux, il a rencontré un problème majeur avec les variables d'environnement pour la connexion Supabase. Au lieu de demander les vraies credentials, le système a automatiquement marqué la tâche comme terminée tout en insérant clairement une clé factice dans la configuration. Il n'a pas demandé de configurer le projet Supabase ni de fournir une vraie clé, puis a automatiquement tenté de pousser le schéma de base de données, ce qui a échoué en raison de l'absence de vraie clé. Cette séquence d'événements révèle que les tâches ne sont pas correctement mises à jour et que le système ne les suit pas correctement, posant des questions sérieuses sur la fiabilité du workflow pour un développement réel.

Conclusion et recommandations

L'auteur conclut sa revue en déclarant qu'il n'utiliserait pas Conductor pour le moment pour le développement de spécifications de bout en bout, recommandant plutôt Be Mad comme une bien meilleure option. Pour les petits projets, il préfère encore créer ses propres fichiers de contexte manuellement. Il termine la vidéo en invitant les spectateurs à soutenir la chaîne via le bouton Super Thanks et remercie l'audience. Cette conclusion ferme résume l'opinion négative de l'auteur sur Conductor malgré quelques aspects positifs comme la structure de fichiers et l'intégration git, soulignant que les problèmes fondamentaux d'implémentation et de gestion des tâches rendent l'outil non recommandable dans son état actuel.

Community Posts

View all posts