00:00:00Andrey Karpathy vient de nous donner les clés
00:00:02de son système RAG personnel sur Obsidian.
00:00:06Et je mets "RAG" entre guillemets
00:00:07car cette base de connaissances boostée par Obsidian
00:00:10n'a pas de base de données vectorielle, ni d'embeddings,
00:00:12et aucun processus de récupération compliqué.
00:00:15Pourtant, elle résout exactement le même problème
00:00:17que ces structures RAG plus complexes prétendent résoudre,
00:00:21à savoir permettre à notre grand modèle linguistique
00:00:23de gérer de grandes quantités de documents, de répondre à des questions
00:00:27et de rassembler des informations précises à leur sujet.
00:00:30Et le meilleur avec ce système basé sur Obsidian,
00:00:32c'est qu'il est très léger, essentiellement gratuit,
00:00:36et qu'il constitue le compromis idéal
00:00:38pour un utilisateur solo ou une petite équipe.
00:00:41Aujourd'hui, je vais donc vous montrer
00:00:42comment fonctionne le système de connaissances Obsidian de Karpathy,
00:00:45comment le mettre en place vous-même
00:00:46et en quoi il diffère des systèmes RAG traditionnels,
00:00:50pour que vous sachiez si c'est la bonne option pour vous.
00:00:52Le processus par lequel nous allons créer
00:00:54ce système de connaissances alimenté par Obsidian a été exposé hier
00:00:58dans un post Twitter très complet d'Andrej Karpathy.
00:01:02Le point essentiel à retenir de ce post,
00:01:04c'est que nous sommes capables de créer
00:01:05des bases de connaissances pour modèles linguistiques
00:01:07qui fonctionnent essentiellement de la même manière
00:01:09que des solutions comme Light RAG ou RAG Anything,
00:01:12ou tout autre système Graph RAG avec Obsidian.
00:01:17Et nous pouvons le faire de manière assez simple
00:01:20juste en ayant une structure astucieuse de notre système de fichiers
00:01:23et de la façon dont nous ingérons réellement les données.
00:01:25Le résultat final est que je peux ingérer
00:01:28une quantité assez importante de données et de documents
00:01:32dans mon coffre Obsidian et utiliser Claude Code
00:01:35pour poser des questions à ce sujet,
00:01:36pour établir des liens entre différentes choses,
00:01:38soit exactement la même chose que ce que vous feriez
00:01:41avec un système RAG traditionnel,
00:01:43mais sans la lourdeur et avec une configuration bien plus simple.
00:01:46Et comme Andre l'explique, la configuration ressemble à ceci.
00:01:49D'abord, nous avons l'ingestion des données.
00:01:51Nous importons des articles,
00:01:52nous importons des documents de recherche,
00:01:53des dépôts de codes provenant d'Internet ou d'ailleurs,
00:01:57et nous les plaçons dans un répertoire "raw" (brut)
00:02:00à l'intérieur de notre coffre Obsidian.
00:02:02C'est essentiellement la zone de transit
00:02:03avant que cela ne soit transformé en Wiki.
00:02:05En tant qu'être humain dans cette interaction,
00:02:07nous pouvons voir tout cela se produire via Obsidian.
00:02:10Obsidian est, à toutes fins utiles, notre interface front-end.
00:02:13C'est là que je peux voir comment tous les documents sont disposés.
00:02:15C'est là que je peux lire tous les Wikis.
00:02:17Ce n'est donc pas une sorte d'abstraction dans une boîte noire,
00:02:20comme c'est le cas pour un système RAG.
00:02:21Il est assez difficile, même dans une config Graph RAG comme Light RAG,
00:02:25d'aller vraiment à l'intérieur et de tout voir.
00:02:29Enfin, je peux le faire, mais aussi cool que cela paraisse,
00:02:31ce n'est pas très efficace.
00:02:33Ensuite, il suffit de faire du questions-réponses
00:02:35via un outil comme Claude Code.
00:02:37Et comme Andre l'a souligné ici,
00:02:38il s'attendait à devoir recourir
00:02:40à quelque chose comme le RAG,
00:02:42mais le modèle linguistique s'est révélé très efficace
00:02:43pour auto-maintenir des fichiers d'index
00:02:45et de brefs résumés de tous les documents qu'il lit.
00:02:47C'est quelque chose que nous allons pouvoir faire aussi
00:02:49avec un fichier Claude.md assez simple,
00:02:52que je vais vous fournir.
00:02:53Vous pourrez trouver ce fichier Claude.md,
00:02:55ainsi qu'un guide écrit
00:02:56comprenant toute une série de prompts,
00:02:57au sein de ma communauté gratuite Chase AI.
00:03:00Il y aura un lien vers celle-ci
00:03:01dans la description de cette vidéo.
00:03:03Et en parlant de Chase AI, et vous vous y attendiez,
00:03:06petite promo pour ma masterclass Claude Code.
00:03:08Je l'ai sortie il y a quelques semaines,
00:03:09et c'est le meilleur endroit pour devenir un dev IA en partant de zéro,
00:03:12surtout si vous n'avez pas de formation technique.
00:03:15Vous trouverez un lien vers celle-ci dans le commentaire épinglé.
00:03:18Alors n'hésitez pas à aller voir,
00:03:19si vous voulez vraiment maîtriser cet outil.
00:03:22Maintenant, avant d'entrer dans les détails
00:03:24sur la façon de configurer ce système Obsidian pour vous-même,
00:03:28passons en revue la structure réelle des fichiers,
00:03:30car il est important de comprendre
00:03:32comment les données arrivent dans notre coffre
00:03:34pour être ensuite transformées en Wikis.
00:03:36Le coffre Obsidian est l'endroit où tout réside.
00:03:39Comme vous le verrez, si vous ne l'avez jamais utilisé,
00:03:41lorsque vous téléchargez Obsidian,
00:03:42vous allez désigner un dossier spécifique comme étant le coffre.
00:03:45Dans mon cas, il s'appelle littéralement "the vault".
00:03:48C'est là que tout ce qui concerne Obsidian se trouve.
00:03:50Comme sous-dossier de ce coffre,
00:03:52nous allons avoir le dossier "raw".
00:03:54C'est dans ce dossier que toutes nos recherches sont déversées.
00:03:58Tout ce que nous voulons inclure manuellement dans ces Wikis y est placé.
00:04:01C'est essentiellement le dossier de transit.
00:04:02C'est donc là que toutes les données brutes seront conservées.
00:04:05Il peut s'agir de fichiers Markdown.
00:04:06Il peut s'agir de PDF.
00:04:07Et je vais vous montrer comment utiliser l'extension Obsidian Clipper
00:04:10pour transformer n'importe quelle page web en fichier Markdown
00:04:14envoyé automatiquement vers le dossier "raw".
00:04:16Nous aurons un autre sous-dossier
00:04:18qui sera le dossier "Wiki".
00:04:19Ce que le modèle linguistique va faire,
00:04:21ce que Claude Code fera pour nous, à la demande,
00:04:24ou via une compétence ou un automatisme,
00:04:27c'est que nous allons le pointer vers le dossier "raw" et dire :
00:04:29"Hé, je veux que tu crées un Wiki sur n'importe quel sujet
00:04:33sur lequel tu as rassemblé des informations."
00:04:35À partir de là, il créera un Wiki à ce sujet.
00:04:37Vous pouvez voir que nous avons trois Wikis différents ici,
00:04:41un pour les agents IA, un pour les systèmes RAG,
00:04:43et un pour la création de contenu.
00:04:45Maintenant, entre le dossier Wiki et ces sous-dossiers Wiki
00:04:50se trouve l'index principal en Markdown.
00:04:53Il s'agit essentiellement d'une simple liste
00:04:54de tous les différents Wikis qui ont été créés.
00:04:58Parce que l'idée est que lorsque vous, c'est-à-dire vous,
00:05:02parlez à Claude Code, d'accord,
00:05:04c'est Claude Code là-bas, et que vous dites :
00:05:06"Hé, je veux en savoir plus sur les agents IA.
00:05:08Je veux poser des questions sur mon Wiki."
00:05:12Eh bien, que va-t-il faire ?
00:05:13Il va aller dans le coffre,
00:05:15car vous y êtes probablement déjà.
00:05:17Il va ensuite aller dans le dossier Wiki.
00:05:18Il va aller dans le dossier de l'index principal et dire :
00:05:21"Hé, quels Wikis avons-nous créés ?
00:05:23Oh, il veut des infos sur les systèmes RAG."
00:05:26D'accord, il descend vers RAG.
00:05:28Et les dossiers Wiki eux-mêmes ont des fichiers d'index
00:05:31qui détaillent tout le contenu additionnel.
00:05:33Ainsi, ce qu'Obsidian nous apporte,
00:05:35et ce que cette structure de fichiers nous apporte,
00:05:36c'est un chemin très clair pour trouver l'information,
00:05:39même si nous en avons une tonne qui circule.
00:05:41Et cela aide Claude Code
00:05:42car il n'aura pas énormément de mal
00:05:45à trouver les données.
00:05:46Nous n'allons pas lancer un million d'appels d'outils
00:05:48pour voir ce qu'il y a dans notre structure de fichiers.
00:05:50Mais cela vous aide aussi parce que c'est très clair.
00:05:52Par exemple, ici à gauche se trouve mon dossier Obsidian.
00:05:56Je suis dans l'interface d'Obsidian,
00:05:57et nous verrons le téléchargement dans un instant.
00:05:59Mais si je veux voir un Wiki, que dois-je faire ?
00:06:01Je vais simplement dans Wiki.
00:06:03J'ai un index principal
00:06:04qui répertorie tout ce qui s'y trouve.
00:06:06Pour l'instant, il n'y a que trois choses.
00:06:07Mais s'il y en avait 3 000, ce ne serait toujours pas trop difficile.
00:06:10Et à partir de là, vous savez, je peux cliquer dessus.
00:06:12Cela m'amène à l'index de ce Wiki spécifique.
00:06:16Et je peux ensuite regarder différents éléments à l'intérieur.
00:06:18C'est aussi simple que cela.
00:06:19Et c'est tout aussi simple pour l'IA,
00:06:21c'est pourquoi nous pouvons utiliser
00:06:22essentiellement une simple structure de fichiers Markdown
00:06:24pour imiter en quelque sorte un système RAG.
00:06:27Alors, bien que cette théorie soit géniale,
00:06:28voyons maintenant comment configurer cela pour vous.
00:06:31Avant toute chose, vous allez devoir télécharger Obsidian.
00:06:33Rendez-vous simplement sur obsidian.md, cliquez sur Download,
00:06:37suivez l'assistant d'installation.
00:06:38C'est totalement gratuit.
00:06:40Et vous allez désigner un dossier comme étant le coffre.
00:06:43Créez-en un, appelez-le "the vault".
00:06:45C'est plus simple pour moi, et ça marchera sans doute pour vous.
00:06:47Après avoir créé le coffre,
00:06:49nous devons maintenant y mettre en place cette structure de fichiers.
00:06:52La façon la plus simple de le faire est avec Claude Code.
00:06:54Ouvrez simplement Claude Code dans le coffre.
00:06:57C'est le répertoire dans lequel je me trouve.
00:06:59Et vous allez lui donner un prompt
00:07:01lui demandant de créer cette structure de fichiers.
00:07:03Heureusement pour vous, j'ai déjà créé le prompt.
00:07:05Vous n'avez qu'à le copier et le coller dans Claude Code.
00:07:08Maintenant, si vous êtes comme moi et utilisez déjà Obsidian
00:07:10depuis un moment, vous avez probablement déjà
00:07:13un tas de dossiers à l'intérieur.
00:07:14Peut-être que vous ne voulez pas l'appeler "raw".
00:07:17Peut-être préférez-vous un autre nom.
00:07:18L'idée, c'est qu'il vous suffit de désigner
00:07:20un dossier qui servira, comme je l'ai dit, de zone d'attente
00:07:23ou de zone de transit où toutes ces informations
00:07:25seront déposées jusqu'à ce qu'elles soient transformées en Wiki.
00:07:27Adaptez donc selon vos besoins.
00:07:28L'étape suivante est de créer un fichier Claude.md.
00:07:31Pour des projets d'assistants personnels de ce genre,
00:07:33très axés sur le Markdown, les fichiers Claude.md sont parfaits.
00:07:37Et ce fichier Claude.md détaille
00:07:40les règles de la base de connaissances,
00:07:41ainsi que la manière de la parcourir.
00:07:43afin de ne pas gaspiller de jetons
00:07:44lorsque nous posons des questions.
00:07:46Là encore, j'ai tout ce modèle de prompt
00:07:50Clawed.md que vous pouvez utiliser.
00:07:50Ce fichier Clawed.md indique aussi à Claude
00:07:53comment structurer ces fichiers Markdown.
00:07:55Il est donc très facile de parcourir les fichiers
00:07:58avec ce format de liens Wiki.
00:08:00Parlons maintenant de la manière d'importer
00:08:02des éléments dans ce dossier "raw".
00:08:03Comment injecter des données dans notre système.
00:08:06Eh bien, un moyen super simple de le faire
00:08:08est d'utiliser l'Obsidian Web Clipper.
00:08:10Je mettrai un lien vers cet outil dans l'école,
00:08:13ou vous pouvez aller sur obsidian.md/clipper.
00:08:16C'est juste une extension Chrome,
00:08:18qui permet de transformer très facilement
00:08:22une page web en données, en fichier Markdown.
00:08:23Le seul problème avec ce Web Clipper,
00:08:25c'est qu'il a du mal avec les images.
00:08:26Il ne va même pas les importer.
00:08:27Il les affichera sous forme de lien.
00:08:29Mais je veux pouvoir voir les images de ces documents
00:08:31que j'ingère directement dans Obsidian.
00:08:33Alors, que faisons-nous ?
00:08:34Nous allons utiliser une compétence communautaire
00:08:37ou un plugin communautaire Obsidian pour cela.
00:08:39L'un des aspects géniaux d'Obsidian,
00:08:41ce sont ses plugins communautaires.
00:08:42Il y en a des milliers.
00:08:43Si vous êtes dans Obsidian,
00:08:46je suis actuellement dans l'application de bureau.
00:08:47Si je descends ici et clique sur cet engrenage,
00:08:50je vais dans "Community plugins".
00:08:52Je vais dans "Browse".
00:08:54Et là, vous cherchez "local images plus".
00:08:56Vous le téléchargez, l'installez et l'activez.
00:09:00Assurez-vous qu'il est activé.
00:09:01Vous pouvez le confirmer
00:09:03en allant dans l'onglet des plugins communautaires
00:09:05et en vérifiant que ce petit bouton est allumé.
00:09:08Maintenant, si nous utilisons l'Obsidian Web Clipper,
00:09:11que je peux voir ici comme une extension,
00:09:13vous pouvez voir ce qui se passe.
00:09:15Il récupère immédiatement tout le contenu.
00:09:17Et si je clique sur "Add to Obsidian",
00:09:19je vois l'article entier, y compris les images.
00:09:21Il y a une chose que nous devons configurer
00:09:24à l'intérieur du Web Clipper,
00:09:25c'est de s'assurer qu'il envoie le contenu
00:09:26automatiquement dans le dossier "raw".
00:09:29Je ne veux pas avoir à le faire manuellement.
00:09:30Allez simplement dans les options du Web Clipper.
00:09:34Je viens de faire un clic droit dessus.
00:09:35Et ici à gauche, là où il est écrit "default",
00:09:38j'ai créé mon propre nouveau modèle,
00:09:39mais vous pouvez rester sur celui par défaut si vous voulez,
00:09:42là où il est indiqué "location" et "note location".
00:09:47Vous devrez changer "clippings" en "raw".
00:09:52Cela garantira que lorsque vous utilisez le clipper,
00:09:54le fichier ira automatiquement dans le dossier "raw".
00:09:56Ainsi, avec l'extension Obsidian Web Clipper
00:09:59et le plugin communautaire pour les images,
00:10:01nous pouvons transformer n'importe quelle page web
00:10:04en un fichier Markdown pour notre Wiki.
00:10:08Mais ce n'est qu'un seul canal de données.
00:10:10C'est un canal manuel.
00:10:11Claude Code peut aussi faire une grosse partie du travail.
00:10:14Disons que je voulais créer un Wiki
00:10:16sur les compétences de Claude Code.
00:10:17J'ai donc dit à Claude Code :
00:10:18"Créons un Wiki sur les compétences de Claude Code."
00:10:20J'ai déjà inclus des infos dans le dossier "raw",
00:10:23celles récupérées via le Web Clipper.
00:10:25"Fais tes propres recherches et importe les fichiers
00:10:27raw MD pertinents pour générer ce Wiki."
00:10:29Alors, que va-t-il faire ?
00:10:30Il va aller sur Internet via sa recherche web standard,
00:10:32et il va créer son propre Wiki sur les
00:10:36compétences de Claude Code.
00:10:37Vous voyez donc que ce dossier "raw",
00:10:40tout ce pipeline "raw", est plutôt pour vous.
00:10:42C'est pour quand vous voulez insérer manuellement des infos.
00:10:44Vous pouvez aussi demander à Claude Code de le faire,
00:10:46mais Claude Code est aussi assez intelligent pour
00:10:49analyser les recherches,
00:10:50déterminer ce qui est pertinent et créer le Wiki
00:10:53directement. Ce dossier "raw" est vraiment pour vous,
00:10:55l'humain, pour garder un certain niveau d'organisation.
00:10:58Et voici ce que Claude Code a produit.
00:10:59Il a créé le Wiki des compétences de Claude Code.
00:11:02On voit ici dans l'index maître qu'il est référencé.
00:11:05Si je clique dessus,
00:11:07cela nous amène à l'index des compétences Claude Code.
00:11:10Et pour l'instant, il contient quatre articles.
00:11:12Voici l'article de présentation des compétences.
00:11:15Vous voyez qu'il renvoie vers des sites web et aussi
00:11:18vers différents articles de notre coffre Obsidian.
00:11:21Si je clique sur l'écosystème, il y a d'autres éléments.
00:11:25Je clique sur les meilleures compétences, etc.
00:11:27Il y a un cheminement très clair d'un article à l'autre
00:11:30et sur la manière dont ces choses sont liées,
00:11:32ce qui signifie que si vous posez des questions à Claude Code
00:11:34sur ces articles et ces sujets,
00:11:35il lui est facile et peu coûteux d'y répondre,
00:11:39ce qui nous amène à la question évidente.
00:11:41Avons-nous vraiment besoin du RAG ? Vous savez,
00:11:43quand on voit une config comme ce Light RAG.
00:11:45Si vous avez vu mes dernières vidéos sur Light RAG
00:11:48et le RAG, et la simplicité de la config Obsidian,
00:11:51vous vous dites probablement : "Eh bien,
00:11:52pourquoi s'embêter avec ces installations
00:11:55beaucoup plus compliquées ?"
00:11:56Et la vérité est que si vous êtes un développeur solo,
00:11:59un entrepreneur seul ou une petite équipe qui ne gère pas
00:12:02des milliers de documents,
00:12:04la réponse est qu'Obsidian est probablement plus logique.
00:12:08C'est léger et vous n'avez pas vraiment besoin de RAG.
00:12:11Ces grands modèles de langage,
00:12:12ces outils comme Claude Code sont suffisants
00:12:16pour votre cas d'utilisation.
00:12:17On pourrait débattre longuement des
00:12:18différences entre le RAG Obsidian et le vrai RAG.
00:12:21Mais la vérité, c'est que l'enjeu est l'échelle.
00:12:24Cherche-t-on à passer à des millions de documents ou non ?
00:12:27Car à une certaine échelle,
00:12:29il sera moins cher et plus rapide d'utiliser
00:12:32un véritable système de RAG.
00:12:33Peu importe la capacité de Claude Code à naviguer
00:12:38dans ce réseau de fichiers MD que vous avez créé.
00:12:40Mais ce n'est pas une question à laquelle vous devez
00:12:42répondre précisément dès maintenant.
00:12:44Pourquoi ne pas simplement commencer par Obsidian ?
00:12:47Et s'il devient clair que
00:12:48votre volume dépasse les limites de ce qu'il peut gérer,
00:12:51alors passez simplement au RAG.
00:12:53Les gens se focalisent trop sur la réponse à
00:12:55cette question. Essayez simplement, expérimentez.
00:12:58Ça ne vous coûte rien d'utiliser un système de RAG,
00:13:01un système de RAG comme Obsidian.
00:13:03Et si ça ne marche pas, ce n'est pas grave.
00:13:05Utilisez alors Light RAG à la place.
00:13:06Certains voudront débattre sans fin,
00:13:09comme toujours en commentaires, mais testez-le.
00:13:11La réponse deviendra très claire à partir du moment
00:13:14où vous devrez passer à un vrai système RAG.
00:13:16Mais l'avantage ici, encore une fois,
00:13:19c'est que la plupart des gens n'ont pas besoin de vrai RAG.
00:13:21Vraiment pas.
00:13:22Même s'ils sont dans une petite équipe d'entreprise.
00:13:24Donc avoir un système bien
00:13:27orchestré comme cette base de connaissances Obsidian,
00:13:30est selon moi un atout majeur pour la majorité des gens.
00:13:33J'espère donc que cette analyse vous a été utile.
00:13:35Allez voir le post d'Andre à ce sujet.
00:13:37Il donne pas mal de détails.
00:13:39N'oubliez pas d'aller voir l'école gratuite Chase AI.
00:13:41Il y a un lien dans la description qui contient
00:13:43tous les prompts et un guide écrit de la procédure.
00:13:47Si vous avez été un peu perdu, et comme toujours,
00:13:50jetez un œil à Chase AI Plus pour accéder
00:13:52à cette masterclass. À part ça,
00:13:54dites-moi ce que vous en avez pensé et à bientôt.