Le toolkit du PDG de Y Combinator pour rendre Claude Code incroyable

BBetter Stack
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00Le PDG de YCombinator a créé son propre kit d'outils pour Claude Code appelé GStack, son secret
00:00:06pour abattre près de cent PR en sept jours, incluant neuf flux de travail spécialisés,
00:00:13un mode de navigation sans tête via Playwright, l'intégration de Greptile, une QA sensible aux diffs et bien
00:00:18bien plus encore.
00:00:19Mais le récent tweet de Garry sur l'avenir du code a vraiment agacé
00:00:24beaucoup de développeurs.
00:00:25Alors, qu'est-ce que cela signifie pour l'avenir de GStack ?
00:00:28Abonnez-vous et découvrons-le ensemble.
00:00:33Garry Tan est le PDG de YCombinator depuis 2023 et avant cela, il a cofondé une société de
00:00:39capital-risque en 2011.
00:00:42Il a donc énormément d'expérience lorsqu'il s'agit d'analyser des pitchs et de découvrir ce
00:00:46qui rend une nouvelle technologie unique.
00:00:49Et il a mis toute cette connaissance dans son propre kit d'outils pour Claude Code, ce qui
00:00:53se voit rien qu'aux noms qu'il a donnés à beaucoup de ses workflows.
00:00:57En fait, essayons un peu ce GStack.
00:00:59Pour que GStack fonctionne, vous devrez avoir installé Claude Code ainsi que Bun, mais une fois
00:01:03que vous l'avez correctement installé sur Claude Code via ce texte exact ou simplement
00:01:08en téléchargeant les skills, vous devriez avoir ces informations ajoutées à votre fichier Claude.md.
00:01:12Le mien était vide.
00:01:13C'est pourquoi c'est la seule chose ici, mais si vous avez déjà du texte, cela s'ajoutera
00:01:17à la suite.
00:01:18Cela place également toutes les compétences pertinentes dans le répertoire skills si vous voulez les partager
00:01:21avec votre équipe, puis installe Playwright avec le navigateur approprié.
00:01:25Maintenant, je vais utiliser GStack pour ajouter une fonctionnalité à cette application React Vite afin de donner
00:01:30à l'utilisateur la possibilité de télécharger l'image d'un tweet avec une URL spécifique.
00:01:34Vous m'avez peut-être déjà vu ajouter cette fonctionnalité dans une vidéo précédente.
00:01:37Je mettrai un lien dans la description si vous voulez voir les résultats, mais
00:01:41nous allons voir si GStack peut faire mieux.
00:01:44D'abord, je dois commencer en mode plan, puis utiliser la skill "plan CEO review" et donner à GStack
00:01:49quelques informations sur la fonctionnalité.
00:01:51Je vais dire : ajoute une fonction qui prend une capture d'écran d'un tweet à partir de l'URL fournie
00:01:56par l'utilisateur.
00:01:57Je veux aussi que l'utilisateur puisse personnaliser et télécharger l'image, et que Claude respecte
00:02:02la mise en page et les styles existants.
00:02:03Après avoir validé, GStack vérifie d'abord s'il y a des mises à jour pour cette skill, puis
00:02:08consulte le journal git avant de continuer.
00:02:10Ce mode repense le problème du point de vue d'un fondateur/PDG et essaie d'imaginer
00:02:16la meilleure version possible de ce que nous essayons de construire et remet en question les hypothèses
00:02:20sur la portée et la valeur.
00:02:21Une fois cela fait, il nous permet de choisir à quel point nous voulons modifier
00:02:26le périmètre initial.
00:02:27Ici, je vais choisir l'extension de périmètre car elle propose le plus de fonctionnalités.
00:02:30Ensuite, il nous laisse choisir une décision architecturale critique.
00:02:33Je vais choisir celle recommandée car c'est la plus simple.
00:02:36Puis il pose quelques questions supplémentaires, où encore une fois, je vais suivre
00:02:39l'approche recommandée.
00:02:40Et maintenant qu'il a fini, il a élaboré un méga plan montrant le mode de périmètre sélectionné
00:02:44et tout ce qu'il va faire dans ce cadre.
00:02:47Il a également noté ce qui n'est pas inclus dans le périmètre pour cette fonctionnalité.
00:02:50Et en bas, nous avons le plan d'implémentation, avec un schéma d'architecture, les décisions
00:02:55clés et les différentes étapes.
00:02:57C'est un plan incroyablement détaillé, similaire à ce que j'obtiendrais de Superpowers si je suivais
00:03:01le même chemin.
00:03:02Notez qu'il y a aussi une skill "plan engineering review" dans GStack, qui transforme Claude en
00:03:07responsable ingénierie ou en tech lead pour créer des schémas d'architecture, fixer la pile
00:03:12technique, définir les cas limites, et cetera.
00:03:15Mais il semble que la skill "plan CEO review" ait déjà anticipé une partie de cela.
00:03:20Nous passons donc directement à l'implémentation.
00:03:22Maintenant que c'est fait, nous pouvons lancer la commande "review" pour vérifier les cas limites manquants,
00:03:27trouver des bugs qui auraient passé la CI et intercepter tout problème avant la mise en production.
00:03:32Encore une fois, cela vérifie les mises à jour du script et consulte le diff.
00:03:36Maintenant, il vérifie si la tâche est complète avant de nous donner un résumé indiquant
00:03:40qu'aucun problème n'a été trouvé.
00:03:41Nous pouvons maintenant lancer la commande "ship", qui synchronise avec la branche principale, lance les tests
00:03:46et résout les éventuelles revues Greptile existantes.
00:03:49Et ici, on voit qu'il a créé une pull request sans même que je lui demande.
00:03:54À ce stade, on peut lancer la commande "QA", qui testera uniquement les changements
00:03:58que nous avons faits en se basant sur le diff.
00:03:59On voit ici qu'il a lancé le serveur localement, et qu'il parcourt le site pour tester
00:04:05les fonctionnalités fraîchement implémentées en utilisant des captures d'écran et plus encore.
00:04:09Il a trouvé des erreurs 500 via les captures et a détecté un bug avec JSON.parse, qu'il
00:04:15semble avoir corrigé.
00:04:16Et voilà.
00:04:17Il a vérifié et poussé le correctif.
00:04:20Et maintenant, il a rédigé un rapport final avec les problèmes résolus.
00:04:24C'est vraiment génial.
00:04:25D'accord.
00:04:26C'est terminé.
00:04:27Allons essayer cette fonctionnalité.
00:04:28Nous avons maintenant une page de capture d'écran.
00:04:30Prenons un tweet de Tana.
00:04:32Celui-ci, je le colle ici.
00:04:34Ce n'est pas le tweet le plus passionnant, mais c'est juste pour tester si ça marche.
00:04:37Et wow, d'accord, c'est super impressionnant.
00:04:40Nous avons le tweet ici.
00:04:42On peut choisir la luminosité et il capture à nouveau.
00:04:44Oh, wow.
00:04:45D'accord.
00:04:46On a donc le mode clair et le mode sombre.
00:04:47Voyons s'il l'a mis en cache.
00:04:49Et oui, c'est top.
00:04:51Je peux masquer les actions et voilà.
00:04:53Je peux afficher ou masquer les images et changer l'arrière-plan.
00:04:58C'est vraiment cool.
00:04:59On a LinkedIn, Twitter, blog, un dégradé violet, et on peut même le personnaliser
00:05:03ou changer l'angle du dégradé.
00:05:07Wow.
00:05:08C'est ultra complet et on peut changer le format d'image.
00:05:11On a du 9:16, 16:9, 1:1, et cetera.
00:05:16Téléchargeons maintenant l'image.
00:05:18Et voilà.
00:05:19Si je clique dessus, vous voyez tous mes onglets.
00:05:22On a l'image ici.
00:05:23Je vais l'ouvrir dans Aperçu.
00:05:24Et voilà le résultat.
00:05:25C'est l'image que je viens de prendre avec la fonction créée via GStack, ce qui est incroyablement
00:05:29impressionnant, mais on peut faire encore plus car si on retourne sur la PR, on voit que
00:05:34Greptile a fait un résumé : il a trouvé des risques d'épuisement de ressources serveur, une race condition,
00:05:40une absence d'expiration de cache, etc.
00:05:42Et au lieu de demander moi-même à Claude d'analyser et de résoudre, on va juste
00:05:47lancer la commande "review".
00:05:49Il a trouvé tous les commentaires.
00:05:50Il m'a donné des options en bas pour les corriger, que je vais valider.
00:05:53Et maintenant, il a tout corrigé.
00:05:55Enfin, à part un faux positif, et il a poussé le code. Greptile a l'air satisfait.
00:06:00Utilisant régulièrement Superpowers, je vois déjà l'avantage de GStack, même
00:06:05si certains aspects sont assez complexes.
00:06:08Mais qu'en est-il du commentaire de Garry sur Twitter disant que le Markdown est le nouveau code ?
00:06:13Eh bien, je vois un peu ce qu'il veut dire.
00:06:15Je ne pense pas qu'il dise qu'un diplômé en informatique a perdu son temps simplement
00:06:20parce qu'on peut écrire du Markdown et que ça génère le code.
00:06:22Je pense que c'est plutôt lié aux instructions, car les nouveaux modèles arrivent mieux à
00:06:27obéir aux instructions Markdown ; avant, j'avais besoin d'un hook Claude Code
00:06:32juste pour m'assurer qu'il utilise Bun pour l'installation au lieu de NPM.
00:06:36Mais maintenant, je peux le mettre dans le Claude.md et avec un bon modèle comme Opus, il obéit
00:06:4290 à 95 % du temps.
00:06:44Donc je pense qu'il veut dire que si vous avez un fichier Markdown assez détaillé et bien structuré,
00:06:49le modèle peut créer un bon logiciel à partir de ces instructions.
00:06:55Mais cela ne veut pas dire que GStack n'est qu'une pile d'instructions Markdown.
00:06:59Chaque skill a son propre répertoire, même la possibilité de mettre à jour GStack.
00:07:03Et si on regarde la skill "browse", on voit qu'il y a un fichier template et le
00:07:08fichier de la skill proprement dit.
00:07:09Et cela n'a rien à voir avec les Go templates, quoi qu'en dise la page GitHub.
00:07:14Le fonctionnement est le suivant : si on va dans scripts puis dans genskill, le fichier TypeScript
00:07:20va lire les templates et remplacer les placeholders par du vrai Markdown.
00:07:26Mais je ne vais pas m'attarder sur chaque skill individuellement car elles sont très détaillées.
00:07:30Cependant, je note que la skill "browse" contient plus qu'un simple fichier skill.md car
00:07:35nous avons un répertoire de tests ici et aussi le répertoire source qui contient l'implémentation
00:07:40réelle pour la gestion du navigateur, etc.
00:07:42On voit donc déjà que les commandes ici sont assez sophistiquées.
00:07:46Mais si on jette un œil au changelog, il montre des fonctionnalités vraiment intéressantes comme
00:07:49l'observabilité de bout en bout, les sauvegardes d'éval incrémentales, etc., utilisées pour développer
00:07:55l'application.
00:07:56Il partage les revues sous forme de liste de tâches.
00:07:58Il supporte la capture d'éléments et le découpage de zones, sans oublier toutes les intégrations
00:08:03avec Greptile et le fait qu'il a été conçu avec Conductor en tête.
00:08:07Alors, la question à un million : vais-je personnellement utiliser GStack ?
00:08:11Et je dirais qu'en fait, je vais l'essayer pendant 30 jours.
00:08:15Je vais donc supprimer le plugin Superpowers et faire de GStack mon outil de code principal pour préparer
00:08:21les fonctionnalités et corriger les bugs, et voir ce que ça donne.
00:08:23Qui sait ?
00:08:24Je pourrais bien cloner le prochain outil open source de Vercel et relancer un clash sur Twitter.

Key Takeaway

GStack transforme Claude Code en un agent d'ingénierie autonome capable de gérer tout le cycle de vie d'un logiciel, de la vision stratégique du PDG à l'assurance qualité automatisée.

Highlights

Présentation de GStack, un kit d'outils personnalisé pour Claude Code créé par Garry Tan, PDG de Y Combinator.

Intégration de workflows spécialisés comme "plan CEO review" qui analyse les projets sous l'angle de la valeur commerciale.

Automatisation du cycle de développement incluant la navigation sans tête avec Playwright et l'analyse de code avec Greptile.

Capacité de GStack à générer des plans d'implémentation ultra-détaillés et à créer des Pull Requests de manière autonome.

Réflexion sur l'affirmation de Garry Tan selon laquelle le "Markdown est le nouveau code" pour les modèles d'IA modernes.

Démonstration concrète de la création d'une fonctionnalité de capture d'écran de tweets hautement personnalisable.

L'engagement du créateur de contenu à tester GStack exclusivement pendant 30 jours pour remplacer ses outils actuels.

Timeline

Introduction à GStack et Garry Tan

Cette section introduit GStack, le toolkit optimisé pour Claude Code développé par le PDG de Y Combinator, Garry Tan. L'intervenant souligne l'expérience de Tan en capital-risque pour expliquer la pertinence des flux de travail intégrés. On y mentionne des fonctionnalités clés comme la navigation sans tête via Playwright et l'intégration de Greptile pour la revue de code. Ce segment pose le contexte d'un outil ayant permis de traiter près de cent PR en seulement sept jours. Il souligne également la controverse suscitée par les propos de Tan sur l'avenir du développement logiciel.

Installation et configuration technique

Le présentateur détaille les prérequis techniques pour faire fonctionner GStack, notamment l'installation de Claude Code et de l'environnement d'exécution Bun. Il explique comment les "skills" ou compétences sont ajoutées au fichier Claude.md, transformant un fichier initialement vide en un centre de commandes structuré. Le processus installe automatiquement Playwright et configure les navigateurs nécessaires pour les tests automatisés. Cette étape est cruciale car elle prépare l'environnement pour une démonstration pratique sur une application React Vite. L'objectif est de surpasser les résultats obtenus lors de précédentes expérimentations de codage assisté par IA.

Le workflow 'Plan CEO Review'

Cette partie explore la compétence unique de révision par le PDG, qui oblige l'IA à repenser le problème sous l'angle d'un fondateur d'entreprise. L'utilisateur demande l'ajout d'une fonction de capture d'écran de tweets, et GStack propose différents périmètres d'extension pour maximiser la valeur du produit. Le système génère un méga plan incluant des schémas d'architecture, des décisions critiques et une liste précise de ce qui est hors périmètre. Ce mode permet de remettre en question les hypothèses initiales sur la portée du projet tout en assurant une cohérence stylistique avec l'existant. C'est une approche qui simule la collaboration entre un chef de produit visionnaire et un architecte logiciel.

Implémentation, Revue et Expédition (Ship)

L'intervenant démontre l'utilisation des commandes 'review', 'ship' et 'QA' pour finaliser la fonctionnalité. La commande de revue détecte les cas limites et les bugs potentiels avant même que le code ne soit poussé en production. GStack synchronise automatiquement le travail avec la branche principale et crée une Pull Request sans intervention humaine supplémentaire. La fonction QA est particulièrement impressionnante car elle lance un serveur local et utilise Playwright pour tester les changements via des captures d'écran réelles. Dans cet exemple, l'IA parvient à identifier et corriger seule une erreur 500 liée à un problème de parsing JSON.

Démonstration des résultats et intégration Greptile

La vidéo montre le résultat final : une interface de capture d'écran de tweets extrêmement riche avec des options de mode sombre, de gestion du cache et de formats d'image variés (16:9, 1:1, etc.). L'analyse se poursuit sur GitHub où l'outil Greptile a identifié des risques de sécurité et d'épuisement des ressources. Au lieu de corriger manuellement, l'utilisateur relance la commande de revue de GStack qui traite automatiquement les retours de Greptile. Le code est mis à jour et poussé instantanément, validant l'efficacité du cycle de correction automatisé. Le présentateur exprime son admiration devant la complexité et la fluidité de l'intégration des différents outils.

Analyse philosophique : Le Markdown est-il le nouveau code ?

Le débat se déplace vers la déclaration de Garry Tan affirmant que le Markdown devient le langage de programmation principal. L'intervenant clarifie cette pensée en expliquant que les modèles récents comme Claude 3 Opus obéissent beaucoup mieux aux instructions structurées en Markdown. GStack utilise des templates TypeScript pour transformer ces instructions Markdown en code fonctionnel complexe et en scripts d'automatisation. Il ne s'agit pas de dire que l'informatique traditionnelle est obsolète, mais que le niveau d'abstraction s'élève vers la spécification textuelle détaillée. La structure interne de GStack, avec ses répertoires de tests et ses sources sophistiquées, prouve que l'outil est bien plus qu'une simple liste de prompts.

Conclusion et perspectives d'utilisation

Dans la conclusion, le créateur examine le changelog de GStack, notant des fonctionnalités avancées comme l'observabilité de bout en bout et les sauvegardes d'évaluations incrémentales. Il décide officiellement d'abandonner son outil précédent, Superpowers, pour adopter GStack comme outil principal pendant une période d'essai de 30 jours. Cette décision souligne la crédibilité de l'outil pour un usage professionnel quotidien dans le développement de fonctionnalités et la correction de bugs. La vidéo se termine sur une note humoristique concernant les futures interactions sur Twitter et le potentiel de ces outils open source. C'est un plaidoyer pour l'adoption d'agents de codage plus autonomes et mieux intégrés.

Community Posts

View all posts