La couche de mémoire manquante pour le codage par l'IA (Graphify)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00C'est peut-être l'une des manières les plus folles de donner vie à votre base de code.
00:00:04Si vous utilisez Claude Code ou Cursor sur un vrai projet, vous pensez que le plus dur est d'écrire du code.
00:00:09Eh bien, non. Le plus difficile, c'est simplement de comprendre votre propre dépôt.
00:00:13Vous posez une question et votre IA brûle vos jetons juste pour essayer de comprendre ce qui se passe.
00:00:18C'est lent, coûteux, et la moitié du temps, c'est encore approximatif.
00:00:22Et si, au lieu d'envoyer tout votre projet à chaque fois, vous donniez à l'IA une carte de celui-ci ?
00:00:27C'est exactement ce que fait Grafyy, et cela peut réduire l'utilisation de jetons de plus de 70 %.
00:00:32Laissez-moi vous montrer comment tout cela fonctionne.
00:00:34Actuellement, votre IA voit votre projet comme ceci. Juste une pile de fichiers.
00:00:44Il n'y a pas de vraies connexions. Pas de structure. Pas de mémoire.
00:00:48Donc, chaque fois que vous posez une question, elle doit tout réapprendre de zéro.
00:00:53C'est pourquoi les réponses semblent proches, mais pas tout à fait correctes.
00:00:56Et oui, c'est exactement ce que Karpathy a souligné avec le problème du "dossier brut".
00:01:01Grafyy est apparu juste après. C'est plutôt une couche de mémoire.
00:01:06Si vous aimez ce genre d'outils et de conseils de codage, n'oubliez pas de vous abonner.
00:01:09Nous publions des vidéos tout le temps.
00:01:11Bon, maintenant laissez-moi vous montrer. J'ai un petit dépôt ici : diagramme de doc de code.
00:01:16Normalement, je devrais expliquer tout cela à l'IA à chaque fois.
00:01:20À la place, je lance une commande, Grafyy, juste ici. Attendez un instant. Regardez ça.
00:01:27Une fois que Claude exécute Grafyy, ce ne sont plus seulement des fichiers. C'est un véritable graphe.
00:01:33Tout est connecté. Je peux cliquer et disséquer précisément ce qui se passe
00:01:38et ce qui est lié, juste ici, dans le fichier HTML qu'il a généré.
00:01:42Ensuite, au lieu de demander à l'IA de tout relire, je peux lui demander ce qui se connecte à la couche API.
00:01:50Et maintenant, elle répond en utilisant les relations, grâce au fichier MD généré par cet appel.
00:01:56Ce ne sont pas des suppositions, ce sont des relations. Et voici la partie qui m'a surpris.
00:02:00Avant cela, environ 14 000 jetons étaient utilisés, peu importe le nombre exact.
00:02:04Après cela, une fois la première exécution faite, on tombe à peut-être quelques centaines.
00:02:09Même question, coût complètement différent. Tout ça grâce à cette carte générée.
00:02:14Alors, que fait-il réellement ? Grafyy est essentiellement le Google Maps de votre base de code.
00:02:20Au lieu de texte brut, vous obtenez des nœuds et des connexions.
00:02:24Sous le capot, il utilise des "tree-sitters" pour comprendre la structure, puis un LLM pour extraire le sens.
00:02:30Ensuite, il peut tout regrouper en clusters, et il ne s'agit pas seulement de code.
00:02:35Il lit les PDF, les diagrammes, et même l'audio et la vidéo. Tout localement, rien ne quitte la machine.
00:02:41Ce que vous en tirez est simple. On obtient un graphe visuel, un rapport écrit,
00:02:46et une base de connaissances que nous pouvons réellement explorer.
00:02:49Ce graphe visuel est énorme pour beaucoup d'entre nous car on voit comment les éléments se connectent.
00:02:54Voici maintenant comment cela change la façon dont le codage par IA fonctionne habituellement.
00:02:57La plupart des outils utilisent le RAG, ce qui signifie en gros trouver des blocs de texte similaires.
00:03:03Eh bien, Grafyy ne fait pas ça. Il construit de réelles relations.
00:03:07Telle fonction appelle telle autre. Ce module dépend de celui-là.
00:03:11Cette idée vient de ce document, et il vous indique même son niveau de confiance.
00:03:16Ainsi, au lieu de "cela semble lié", nous obtenons "ceci est réellement connecté"
00:03:21dans une véritable représentation visuelle de ce qui est lié.
00:03:24Et la plus grande différence ici, c'est qu'il se souvient aussi, puisqu'il a généré ce fichier MD
00:03:30sur lequel il peut revenir. Nous ne repartons pas de zéro à chaque fois.
00:03:33Il ne met à jour que ce qui a changé, donc votre IA a enfin un contexte qui dure.
00:03:38Bon, j'ai trouvé tout ça plutôt génial.
00:03:42Mais quels sont les points positifs et négatifs ici et maintenant ?
00:03:44Premier point : l'efficacité est cumulative.
00:03:47Chaque question devient moins chère. Et parce qu'il connecte le code,
00:03:51les docs et les diagrammes, vous découvrez des relations dont vous ignoriez l'existence.
00:03:56C'est énorme pour l'onboarding sur ces projets désordonnés où l'on nous parachute.
00:04:00C'est super. Maintenant, les inconvénients sont les suivants.
00:04:03Le premier lancement peut être lent et coûter des jetons, surtout avec beaucoup de documents.
00:04:08Après cela, c'est mis en cache. Mais oui, ce premier impact est réel.
00:04:12C'est aussi récent, donc le support à long terme reste encore limité.
00:04:17Quand vous installez ceci, c'est Grafyy avec deux "y", pas un seul.
00:04:20Vérifiez bien l'orthographe. Les relations ne sont pas toujours parfaites,
00:04:23mais il les étiquette clairement : extraites, déduites, ambiguës,
00:04:28pour que vous sachiez ce que vous pouvez croire. Et si votre dépôt est minuscule,
00:04:32ce sera un peu excessif. Alors, est-ce que ça en vaut la peine ?
00:04:35Je veux dire, oui, si vous utilisez l'IA sur n'importe quel projet sérieux, c'est cool.
00:04:38Je pense que ça vaut le coup. Parce que votre plus gros problème n'est pas d'exécuter le code,
00:04:42c'est de le comprendre à travers les fichiers, le temps et le contexte.
00:04:46Et c'est exactement ce que cela corrige. L'économie de jetons à elle seule justifie l'essai,
00:04:51mais le plus grand gain est celui-ci : votre IA arrête de deviner et commence à raisonner.
00:04:56Si vous travaillez en solo, faites de la recherche ou gérez de gros systèmes, c'est une sérieuse mise à niveau.
00:05:01Si vous travaillez sur de petits scripts, c'est probablement superflu,
00:05:04vous n'avez donc pas vraiment besoin de l'essayer. Mais pour la plupart des développeurs,
00:05:07ce sera un outil formidable. Si vous aimez les outils et astuces de codage
00:05:10qui accélèrent votre flux de travail, n'oubliez pas de vous abonner à la chaîne Better Stack.
00:05:14On se retrouve dans une prochaine vidéo.

Key Takeaway

Grafyy transforme les dépôts de code en graphes relationnels locaux pour réduire l'usage des jetons de 70 % et supprimer les approximations des IA de codage.

Highlights

  • Grafyy réduit la consommation de jetons de l'IA de plus de 70 % en remplaçant la lecture brute des fichiers par une carte relationnelle.

  • L'outil transforme une base de code de 14 000 jetons en une requête de quelques centaines de jetons après la première indexation.

  • L'analyse structurelle utilise des tree-sitters pour la syntaxe et un LLM pour extraire le sens sémantique des connexions.

  • Grafyy indexe localement le code, les documents PDF, les diagrammes, l'audio et la vidéo sans qu'aucune donnée ne quitte la machine.

  • Le système étiquette explicitement les relations comme extraites, déduites ou ambiguës pour quantifier le niveau de confiance des informations.

  • L'efficacité de l'outil est cumulative car il ne met à jour que les fichiers modifiés au lieu de réapprendre tout le projet à chaque question.

Timeline

Le problème du dossier brut et l'inefficacité des jetons

  • La compréhension de la structure d'un dépôt constitue l'obstacle principal du codage assisté par IA.
  • L'absence de connexions entre les fichiers force l'IA à réapprendre le contexte à chaque interaction.
  • Le traitement de fichiers comme une pile de texte brut génère des réponses approximatives et coûteuses.

Les outils comme Claude Code ou Cursor traitent souvent les projets comme des dossiers bruts sans mémoire structurelle. Cette approche consomme une quantité massive de jetons car l'IA doit analyser l'intégralité du code pour répondre à la moindre question. L'inefficacité provient du manque de liens logiques entre les composants, ce qui empêche une compréhension profonde de l'architecture logicielle.

Transformation du code en graphe de connaissances

  • Grafyy génère un fichier Markdown et un graphe visuel HTML pour cartographier les dépendances du projet.
  • Le passage d'une lecture intégrale à une navigation par relations divise le coût par cinquante.
  • L'IA utilise les relations documentées plutôt que des suppositions pour identifier les connexions avec la couche API.

Une simple commande transforme une liste de fichiers en un véritable graphe interactif où chaque élément est connecté. Dans un exemple concret, une analyse qui demandait initialement 14 000 jetons tombe à quelques centaines après l'indexation par Grafyy. Cette méthode permet à l'utilisateur de cliquer et de disséquer précisément les liens entre les modules directement dans un navigateur.

Mécanismes techniques et analyse locale

  • L'outil combine des tree-sitters pour la structure technique et un LLM pour l'extraction de sens.
  • Le traitement local garantit la confidentialité des données pour le code, les PDF et les médias.
  • Le regroupement en clusters permet d'organiser les connaissances au-delà du simple texte brut.

Grafyy agit comme un système de navigation pour le code en créant des nœuds et des connexions sémantiques. Il dépasse le cadre du code source en intégrant des ressources variées comme des diagrammes ou des fichiers audio. Cette base de connaissances exploratrice offre un rapport écrit détaillé et une vue visuelle indispensable pour l'intégration sur des projets complexes.

Différences entre RAG et mémoire relationnelle

  • Grafyy remplace la recherche par similarité (RAG) par une structure de relations explicites.
  • Le système conserve une mémoire persistante via des fichiers MD pour éviter de repartir de zéro.
  • Les mises à jour incrémentales ciblent uniquement les changements récents du code.

Contrairement au RAG classique qui cherche des blocs de texte similaires, Grafyy identifie quel module dépend de quel autre. Il documente l'origine des idées à partir des documents sources et fournit un niveau de confiance pour chaque lien établi. Cette approche garantit que l'IA dispose d'un contexte durable et évolutif plutôt que d'une vision éphémère du projet.

Avantages, limites et critères d'utilisation

  • L'efficacité économique s'accroît à chaque nouvelle question posée grâce au cache.
  • Le coût initial en jetons et en temps est élevé lors de la première indexation d'un gros projet.
  • L'outil est superflu pour les scripts isolés mais devient indispensable pour les systèmes complexes.

Les bénéfices sont particulièrement marqués pour l'onboarding dans des projets désordonnés où les relations sont méconnues. Bien que le premier lancement puisse être lent, la réduction drastique de la consommation de jetons justifie l'investissement. Grafyy permet à l'IA de passer du stade de la devinette à celui du raisonnement logique basé sur des faits structurels vérifiables.

Community Posts

View all posts