MemPalace : l'outil qui empĂȘche Claude d'oublier
BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology
Transcript
00:00:00Claude vient de faire la mĂȘme erreur pour la troisiĂšme fois, non pas parce que le modĂšle est idiot,
00:00:04mais parce qu'il n'a aucun souvenir de votre projet. Il ne se rappelle pas de la décision prise la semaine derniÚre,
00:00:09il ne se souvient pas pourquoi vous ĂȘtes passĂ© Ă GraphQL, et il ne se souvient pas de vos conversations Ă©tranges.
00:00:14Voici MemPallas, et il a explosé avec plus de 52 000 étoiles sur GitHub. Il est censé nous offrir
00:00:20une mémoire locale, sans perte et à long terme pour nos outils d'IA. Je vais vous montrer ce qu'est MemPallas,
00:00:26comment il fonctionne et les différences clés par rapport aux outils dont nous disposons déjà .
00:00:35En résumé, MemPallas stocke nos conversations mot pour mot, fonctionne localement,
00:00:43dispose de hooks pour Claude Code, prend en charge les outils MCP, et ne nécessite pas de clés API pour le flux de mémoire principal.
00:00:49Le point principal que je dois aborder ici, c'est que quelqu'un va forcément dire :
00:00:52nous avons déjà le mode contexte. Oui, c'est vrai, nous l'avons. Le mode contexte est utile pour éviter qu'une longue session
00:00:59de codage ne fasse exploser votre fenĂȘtre de contexte. MemPallas est diffĂ©rent. Il donne Ă votre IA un accĂšs
00:01:06Ă une mĂ©moire permanente Ă travers diffĂ©rentes discussions et mĂȘme sur plusieurs jours. Ils fonctionnent trĂšs bien ensemble,
00:01:12donc vous pouvez les utiliser cĂŽte Ă cĂŽte. MemPallas est trĂšs simple,
00:01:17alors laissez-moi vous montrer comment le configurer et comment cela fonctionne dans le monde réel. Si vous aimez les outils de codage
00:01:22qui accélÚrent votre flux de travail, n'hésitez pas à vous abonner. Nous publions des vidéos réguliÚrement.
00:01:27Commençons par la démonstration, car c'est là que beaucoup d'outils de mémoire échouent.
00:01:30Je vais exĂ©cuter âuv tool install MemPallasâ. Le dĂ©pĂŽt recommande actuellement de l'installer avec âuvâ
00:01:37pour Ă©viter les conflits de dĂ©pendances, bien que âpipâ fonctionne toujours si c'est votre configuration. Ensuite, je vais initialiser un
00:01:43âpalaceâ pour mon projet juste en exĂ©cutant âMemPallas initâ dans le projet. Vous crĂ©ez une base de donnĂ©es locale
00:01:51pour les choses que votre IA ne devrait pas oublier. Maintenant, vous analysez les fichiers du projet, les notes et les anciennes
00:01:58sessions Claude Code. Je peux le faire en disant âMemPallas mineâ. Ensuite, je vais analyser avec âMemPallas mineâ les
00:02:06conversations Claude passĂ©es. Et c'est essentiel ici car le contexte rĂ©el d'un projet n'est jamais au mĂȘme endroit.
00:02:11Il est dispersé dans les commits, la documentation, les discussions, les notes, les fichiers Markdown aléatoires, et vous vous souvenez à peine avoir créé la moitié
00:02:18de tout ça. Maintenant, je peux demander Ă âMemPallas searchâ une question, comme âPourquoi sommes-nous passĂ©s Ă GraphQL ?â. Et au lieu
00:02:25de deviner Ă partir du prompt d'aujourd'hui, il rĂ©cupĂšre les anciennes discussions oĂč cette dĂ©cision a Ă©tĂ© prise. C'est le
00:02:32premier contraste vraiment important. Votre IA n'a pas besoin d'un plus gros prompt, elle a juste besoin d'une meilleure mémoire.
00:02:37Quand nous exĂ©cutons âMemPallas mineâ, c'est l'Ă©tape qui lui apprend tout. Il va dans le dossier que nous lui indiquons,
00:02:44il lit chaque fichier qu'il trouve et le divise en morceaux plus petits. Il les décharge ensuite et enregistre
00:02:50tout mot pour mot dans votre palais de la mémoire pour que nous puissions le rechercher. Maintenant, que fait réellement MemPallas ?
00:02:55La démonstration a fonctionné, nous avons vu comment ça marche. Il utilise une métaphore de palais de la mémoire,
00:03:00les projets ou les personnes devenant l'infrastructure réelle, les faits et les événements
00:03:06vivant dans différentes piÚces. Le texte source original vit dans ces tiroirs, mais ne vous laissez pas distraire par
00:03:12cette métaphore. Ce qui est important, c'est que le contenu original reste intact. La plupart des systÚmes de mémoire font
00:03:18l'évidence d'abord. Ils prennent la conversation désordonnée et demandent à un LLM de la transformer en faits propres. Cela semble
00:03:25intelligent, mais cela pose un gros problÚme. Si le résumé supprime une contrainte bizarre, un cas limite ou la raison derriÚre
00:03:31une décision, ce détail disparaßt de la mémoire. MemPallas fait le pari inverse. Il garde le texte original
00:03:38mot pour mot et construit ensuite un index compact au-dessus, afin que l'IA puisse trouver la bonne zone sans
00:03:44jeter ce qu'il y a à l'intérieur. Dans l'ensemble, c'est assez convivial pour les développeurs. ChromaDB sur disque pour la récupération,
00:03:51SQLite pour le graphe de connaissances. Intégration MCP pour que les agents puissent réellement utiliser la mémoire et des hooks
00:03:57Claude Code pour que cela puisse s'intégrer dans un flux de travail de codage réel au lieu de rester sur le cÎté. MemZero et Zapp
00:04:03sont souvent plus produits, plus axés sur les SDK, et meilleurs si vous construisez de la mémoire dans une application ou
00:04:09un produit. MemPallas ressemble davantage à un outil pour les développeurs qui veulent que leurs agents de codage se souviennent de l'historique
00:04:16de travail réel localement. Le compromis ici est clair. Si vous voulez un produit hébergé, d'autres outils seront
00:04:21meilleurs. Si vous voulez un systÚme de mémoire local qui conserve votre source originale, MemPallas a l'avantage
00:04:27ici. Maintenant, l'intĂ©gration Claude Code est lĂ oĂč cela commence Ă sembler plus pratique. Le plugin peut dĂ©marrer le
00:04:33serveur MCP, exposer les outils, apprendre à Claude le protocole de mémoire, et rechercher dans le palais avant de répondre
00:04:39aux questions sur les travaux passés. Le détail semble mineur, mais il ne l'est pas. Il y a une énorme différence entre
00:04:45âj'ai une base de donnĂ©es quelque partâ et âmon agent de codage sait quand chercher en mĂ©moire avant de rĂ©pondreâ.
00:04:50Voici ce que les développeurs semblent apprécier. D'abord, le rappel exact. Si vous avez dit quelque chose d'étrange mais important il y a trois
00:04:57semaines, il peut récupérer le libellé original au lieu d'un résumé nettoyé. Ensuite, il y a le coût et
00:05:03la confidentialité. La documentation officielle indique que le contenu reste local en utilisant ChromaDB et SQLite sur disque sans clé API
00:05:11requise pour le flux principal. Ensuite, c'est le faible contexte de démarrage. Vous n'avez pas besoin de coller 40 000 jetons de
00:05:18connaissances de projet Ă chaque fois. Il va exĂ©cuter cela. Vous chargez suffisamment de pointeurs pour que l'agent sache oĂč
00:05:24chercher. Le graphe de connaissances temporel est aussi trÚs important ici car les décisions logicielles expirent.
00:05:31Nous utilisons une API REST. C'Ă©tait peut-ĂȘtre vrai il y a quelques mois, et cela pourrait ĂȘtre faux le mois dernier.
00:05:38Les bases de données de faits classiques peuvent manquer cela. Un systÚme de mémoire conscient du temps a une meilleure chance
00:05:44de comprendre ce qui a changé et quand. C'est le deuxiÚme grand contraste. La mémoire n'est pas seulement une question de faits,
00:05:50c'est une question de temps. La hiérarchie du palais est intelligente, mais elle n'est en aucun cas parfaite. Pour certains projets,
00:05:57une recherche sémantique ChromaDB simple sur vos transcriptions pourrait vous donner la plupart de votre valeur avec moins
00:06:02de concepts. Il y a aussi la configuration et la maintenance, donc les bases de données locales sont géniales jusqu'à ce que vous ayez besoin de sauvegardes,
00:06:08de nettoyage, de migration ou de synchronisation. Et ce n'est pas un gestionnaire complet pour gérer votre plateforme de mémoire. Si vous
00:06:15voulez des contrĂŽles d'administration, des tableaux de bord, de la gestion des permissions, cet outil n'en est pas encore lĂ . Un avertissement pratique ici,
00:06:21parce que ce projet est devenu viral, il existe des domaines contrefaits. Le fichier README indique que les sources officielles sont
00:06:28le dĂ©pĂŽt GitHub, le packaging Python et le site de documentation. Donc, n'installez pas Ă partir de sites Web âMem Palaceâ alĂ©atoires
00:06:34que vous trouvez lors d'une recherche. Ce n'est pas un petit avertissement. C'est un outil qui touche votre historique
00:06:39de projet, alors traitez-le comme faisant partie de votre environnement de développement. Si vous utilisez Claude Code,
00:06:44Cursor ou des agents locaux, cela a du sens. Ou si vous vous souciez des outils locaux en priorité et
00:06:48que vous détestez payer des abonnements, juste pour que votre IA se souvienne de ce que vous lui avez déjà dit.
00:06:53Je vous conseille d'éviter cela si vous voulez un service hébergé sans configuration,
00:06:57ou si vos projets sont assez courts pour qu'un fichier README et un bon prompt résolvent déjà le problÚme.
00:07:02Si vous aimez les outils de codage comme celui-ci, assurez-vous de vous abonner à la chaßne BetterStack. On se voit dans une autre vidéo.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video