L'Obsidian RAG de Karpathy + Claude Code = UN CHEAT CODE

CChase AI
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Andrey Karpathy vient de nous donner les clés
00:00:02de son système RAG personnel sur Obsidian.
00:00:06Et je mets "RAG" entre guillemets
00:00:07car cette base de connaissances boostée par Obsidian
00:00:10n'a pas de base de données vectorielle, ni d'embeddings,
00:00:12et aucun processus de récupération compliqué.
00:00:15Pourtant, elle résout exactement le même problème
00:00:17que ces structures RAG plus complexes prétendent résoudre,
00:00:21à savoir permettre à notre grand modèle linguistique
00:00:23de gérer de grandes quantités de documents, de répondre à des questions
00:00:27et de rassembler des informations précises à leur sujet.
00:00:30Et le meilleur avec ce système basé sur Obsidian,
00:00:32c'est qu'il est très léger, essentiellement gratuit,
00:00:36et qu'il constitue le compromis idéal
00:00:38pour un utilisateur solo ou une petite équipe.
00:00:41Aujourd'hui, je vais donc vous montrer
00:00:42comment fonctionne le système de connaissances Obsidian de Karpathy,
00:00:45comment le mettre en place vous-même
00:00:46et en quoi il diffère des systèmes RAG traditionnels,
00:00:50pour que vous sachiez si c'est la bonne option pour vous.
00:00:52Le processus par lequel nous allons créer
00:00:54ce système de connaissances alimenté par Obsidian a été exposé hier
00:00:58dans un post Twitter très complet d'Andrej Karpathy.
00:01:02Le point essentiel à retenir de ce post,
00:01:04c'est que nous sommes capables de créer
00:01:05des bases de connaissances pour modèles linguistiques
00:01:07qui fonctionnent essentiellement de la même manière
00:01:09que des solutions comme Light RAG ou RAG Anything,
00:01:12ou tout autre système Graph RAG avec Obsidian.
00:01:17Et nous pouvons le faire de manière assez simple
00:01:20juste en ayant une structure astucieuse de notre système de fichiers
00:01:23et de la façon dont nous ingérons réellement les données.
00:01:25Le résultat final est que je peux ingérer
00:01:28une quantité assez importante de données et de documents
00:01:32dans mon coffre Obsidian et utiliser Claude Code
00:01:35pour poser des questions à ce sujet,
00:01:36pour établir des liens entre différentes choses,
00:01:38soit exactement la même chose que ce que vous feriez
00:01:41avec un système RAG traditionnel,
00:01:43mais sans la lourdeur et avec une configuration bien plus simple.
00:01:46Et comme Andre l'explique, la configuration ressemble à ceci.
00:01:49D'abord, nous avons l'ingestion des données.
00:01:51Nous importons des articles,
00:01:52nous importons des documents de recherche,
00:01:53des dépôts de codes provenant d'Internet ou d'ailleurs,
00:01:57et nous les plaçons dans un répertoire "raw" (brut)
00:02:00à l'intérieur de notre coffre Obsidian.
00:02:02C'est essentiellement la zone de transit
00:02:03avant que cela ne soit transformé en Wiki.
00:02:05En tant qu'être humain dans cette interaction,
00:02:07nous pouvons voir tout cela se produire via Obsidian.
00:02:10Obsidian est, à toutes fins utiles, notre interface front-end.
00:02:13C'est là que je peux voir comment tous les documents sont disposés.
00:02:15C'est là que je peux lire tous les Wikis.
00:02:17Ce n'est donc pas une sorte d'abstraction dans une boîte noire,
00:02:20comme c'est le cas pour un système RAG.
00:02:21Il est assez difficile, même dans une config Graph RAG comme Light RAG,
00:02:25d'aller vraiment à l'intérieur et de tout voir.
00:02:29Enfin, je peux le faire, mais aussi cool que cela paraisse,
00:02:31ce n'est pas très efficace.
00:02:33Ensuite, il suffit de faire du questions-réponses
00:02:35via un outil comme Claude Code.
00:02:37Et comme Andre l'a souligné ici,
00:02:38il s'attendait à devoir recourir
00:02:40à quelque chose comme le RAG,
00:02:42mais le modèle linguistique s'est révélé très efficace
00:02:43pour auto-maintenir des fichiers d'index
00:02:45et de brefs résumés de tous les documents qu'il lit.
00:02:47C'est quelque chose que nous allons pouvoir faire aussi
00:02:49avec un fichier Claude.md assez simple,
00:02:52que je vais vous fournir.
00:02:53Vous pourrez trouver ce fichier Claude.md,
00:02:55ainsi qu'un guide écrit
00:02:56comprenant toute une série de prompts,
00:02:57au sein de ma communauté gratuite Chase AI.
00:03:00Il y aura un lien vers celle-ci
00:03:01dans la description de cette vidéo.
00:03:03Et en parlant de Chase AI, et vous vous y attendiez,
00:03:06petite promo pour ma masterclass Claude Code.
00:03:08Je l'ai sortie il y a quelques semaines,
00:03:09et c'est le meilleur endroit pour devenir un dev IA en partant de zéro,
00:03:12surtout si vous n'avez pas de formation technique.
00:03:15Vous trouverez un lien vers celle-ci dans le commentaire épinglé.
00:03:18Alors n'hésitez pas à aller voir,
00:03:19si vous voulez vraiment maîtriser cet outil.
00:03:22Maintenant, avant d'entrer dans les détails
00:03:24sur la façon de configurer ce système Obsidian pour vous-même,
00:03:28passons en revue la structure réelle des fichiers,
00:03:30car il est important de comprendre
00:03:32comment les données arrivent dans notre coffre
00:03:34pour être ensuite transformées en Wikis.
00:03:36Le coffre Obsidian est l'endroit où tout réside.
00:03:39Comme vous le verrez, si vous ne l'avez jamais utilisé,
00:03:41lorsque vous téléchargez Obsidian,
00:03:42vous allez désigner un dossier spécifique comme étant le coffre.
00:03:45Dans mon cas, il s'appelle littéralement "the vault".
00:03:48C'est là que tout ce qui concerne Obsidian se trouve.
00:03:50Comme sous-dossier de ce coffre,
00:03:52nous allons avoir le dossier "raw".
00:03:54C'est dans ce dossier que toutes nos recherches sont déversées.
00:03:58Tout ce que nous voulons inclure manuellement dans ces Wikis y est placé.
00:04:01C'est essentiellement le dossier de transit.
00:04:02C'est donc là que toutes les données brutes seront conservées.
00:04:05Il peut s'agir de fichiers Markdown.
00:04:06Il peut s'agir de PDF.
00:04:07Et je vais vous montrer comment utiliser l'extension Obsidian Clipper
00:04:10pour transformer n'importe quelle page web en fichier Markdown
00:04:14envoyé automatiquement vers le dossier "raw".
00:04:16Nous aurons un autre sous-dossier
00:04:18qui sera le dossier "Wiki".
00:04:19Ce que le modèle linguistique va faire,
00:04:21ce que Claude Code fera pour nous, à la demande,
00:04:24ou via une compétence ou un automatisme,
00:04:27c'est que nous allons le pointer vers le dossier "raw" et dire :
00:04:29"Hé, je veux que tu crées un Wiki sur n'importe quel sujet
00:04:33sur lequel tu as rassemblé des informations."
00:04:35À partir de là, il créera un Wiki à ce sujet.
00:04:37Vous pouvez voir que nous avons trois Wikis différents ici,
00:04:41un pour les agents IA, un pour les systèmes RAG,
00:04:43et un pour la création de contenu.
00:04:45Maintenant, entre le dossier Wiki et ces sous-dossiers Wiki
00:04:50se trouve l'index principal en Markdown.
00:04:53Il s'agit essentiellement d'une simple liste
00:04:54de tous les différents Wikis qui ont été créés.
00:04:58Parce que l'idée est que lorsque vous, c'est-à-dire vous,
00:05:02parlez à Claude Code, d'accord,
00:05:04c'est Claude Code là-bas, et que vous dites :
00:05:06"Hé, je veux en savoir plus sur les agents IA.
00:05:08Je veux poser des questions sur mon Wiki."
00:05:12Eh bien, que va-t-il faire ?
00:05:13Il va aller dans le coffre,
00:05:15car vous y êtes probablement déjà.
00:05:17Il va ensuite aller dans le dossier Wiki.
00:05:18Il va aller dans le dossier de l'index principal et dire :
00:05:21"Hé, quels Wikis avons-nous créés ?
00:05:23Oh, il veut des infos sur les systèmes RAG."
00:05:26D'accord, il descend vers RAG.
00:05:28Et les dossiers Wiki eux-mêmes ont des fichiers d'index
00:05:31qui détaillent tout le contenu additionnel.
00:05:33Ainsi, ce qu'Obsidian nous apporte,
00:05:35et ce que cette structure de fichiers nous apporte,
00:05:36c'est un chemin très clair pour trouver l'information,
00:05:39même si nous en avons une tonne qui circule.
00:05:41Et cela aide Claude Code
00:05:42car il n'aura pas énormément de mal
00:05:45à trouver les données.
00:05:46Nous n'allons pas lancer un million d'appels d'outils
00:05:48pour voir ce qu'il y a dans notre structure de fichiers.
00:05:50Mais cela vous aide aussi parce que c'est très clair.
00:05:52Par exemple, ici à gauche se trouve mon dossier Obsidian.
00:05:56Je suis dans l'interface d'Obsidian,
00:05:57et nous verrons le téléchargement dans un instant.
00:05:59Mais si je veux voir un Wiki, que dois-je faire ?
00:06:01Je vais simplement dans Wiki.
00:06:03J'ai un index principal
00:06:04qui répertorie tout ce qui s'y trouve.
00:06:06Pour l'instant, il n'y a que trois choses.
00:06:07Mais s'il y en avait 3 000, ce ne serait toujours pas trop difficile.
00:06:10Et à partir de là, vous savez, je peux cliquer dessus.
00:06:12Cela m'amène à l'index de ce Wiki spécifique.
00:06:16Et je peux ensuite regarder différents éléments à l'intérieur.
00:06:18C'est aussi simple que cela.
00:06:19Et c'est tout aussi simple pour l'IA,
00:06:21c'est pourquoi nous pouvons utiliser
00:06:22essentiellement une simple structure de fichiers Markdown
00:06:24pour imiter en quelque sorte un système RAG.
00:06:27Alors, bien que cette théorie soit géniale,
00:06:28voyons maintenant comment configurer cela pour vous.
00:06:31Avant toute chose, vous allez devoir télécharger Obsidian.
00:06:33Rendez-vous simplement sur obsidian.md, cliquez sur Download,
00:06:37suivez l'assistant d'installation.
00:06:38C'est totalement gratuit.
00:06:40Et vous allez désigner un dossier comme étant le coffre.
00:06:43Créez-en un, appelez-le "the vault".
00:06:45C'est plus simple pour moi, et ça marchera sans doute pour vous.
00:06:47Après avoir créé le coffre,
00:06:49nous devons maintenant y mettre en place cette structure de fichiers.
00:06:52La façon la plus simple de le faire est avec Claude Code.
00:06:54Ouvrez simplement Claude Code dans le coffre.
00:06:57C'est le répertoire dans lequel je me trouve.
00:06:59Et vous allez lui donner un prompt
00:07:01lui demandant de créer cette structure de fichiers.
00:07:03Heureusement pour vous, j'ai déjà créé le prompt.
00:07:05Vous n'avez qu'à le copier et le coller dans Claude Code.
00:07:08Maintenant, si vous êtes comme moi et utilisez déjà Obsidian
00:07:10depuis un moment, vous avez probablement déjà
00:07:13un tas de dossiers à l'intérieur.
00:07:14Peut-être que vous ne voulez pas l'appeler "raw".
00:07:17Peut-être préférez-vous un autre nom.
00:07:18L'idée, c'est qu'il vous suffit de désigner
00:07:20un dossier qui servira, comme je l'ai dit, de zone d'attente
00:07:23ou de zone de transit où toutes ces informations
00:07:25seront déposées jusqu'à ce qu'elles soient transformées en Wiki.
00:07:27Adaptez donc selon vos besoins.
00:07:28L'étape suivante est de créer un fichier Claude.md.
00:07:31Pour des projets d'assistants personnels de ce genre,
00:07:33très axés sur le Markdown, les fichiers Claude.md sont parfaits.
00:07:37Et ce fichier Claude.md détaille
00:07:40les règles de la base de connaissances,
00:07:41ainsi que la manière de la parcourir.
00:07:43afin de ne pas gaspiller de jetons
00:07:44lorsque nous posons des questions.
00:07:46Là encore, j'ai tout ce modèle de prompt
00:07:50Clawed.md que vous pouvez utiliser.
00:07:50Ce fichier Clawed.md indique aussi à Claude
00:07:53comment structurer ces fichiers Markdown.
00:07:55Il est donc très facile de parcourir les fichiers
00:07:58avec ce format de liens Wiki.
00:08:00Parlons maintenant de la manière d'importer
00:08:02des éléments dans ce dossier "raw".
00:08:03Comment injecter des données dans notre système.
00:08:06Eh bien, un moyen super simple de le faire
00:08:08est d'utiliser l'Obsidian Web Clipper.
00:08:10Je mettrai un lien vers cet outil dans l'école,
00:08:13ou vous pouvez aller sur obsidian.md/clipper.
00:08:16C'est juste une extension Chrome,
00:08:18qui permet de transformer très facilement
00:08:22une page web en données, en fichier Markdown.
00:08:23Le seul problème avec ce Web Clipper,
00:08:25c'est qu'il a du mal avec les images.
00:08:26Il ne va même pas les importer.
00:08:27Il les affichera sous forme de lien.
00:08:29Mais je veux pouvoir voir les images de ces documents
00:08:31que j'ingère directement dans Obsidian.
00:08:33Alors, que faisons-nous ?
00:08:34Nous allons utiliser une compétence communautaire
00:08:37ou un plugin communautaire Obsidian pour cela.
00:08:39L'un des aspects géniaux d'Obsidian,
00:08:41ce sont ses plugins communautaires.
00:08:42Il y en a des milliers.
00:08:43Si vous êtes dans Obsidian,
00:08:46je suis actuellement dans l'application de bureau.
00:08:47Si je descends ici et clique sur cet engrenage,
00:08:50je vais dans "Community plugins".
00:08:52Je vais dans "Browse".
00:08:54Et là, vous cherchez "local images plus".
00:08:56Vous le téléchargez, l'installez et l'activez.
00:09:00Assurez-vous qu'il est activé.
00:09:01Vous pouvez le confirmer
00:09:03en allant dans l'onglet des plugins communautaires
00:09:05et en vérifiant que ce petit bouton est allumé.
00:09:08Maintenant, si nous utilisons l'Obsidian Web Clipper,
00:09:11que je peux voir ici comme une extension,
00:09:13vous pouvez voir ce qui se passe.
00:09:15Il récupère immédiatement tout le contenu.
00:09:17Et si je clique sur "Add to Obsidian",
00:09:19je vois l'article entier, y compris les images.
00:09:21Il y a une chose que nous devons configurer
00:09:24à l'intérieur du Web Clipper,
00:09:25c'est de s'assurer qu'il envoie le contenu
00:09:26automatiquement dans le dossier "raw".
00:09:29Je ne veux pas avoir à le faire manuellement.
00:09:30Allez simplement dans les options du Web Clipper.
00:09:34Je viens de faire un clic droit dessus.
00:09:35Et ici à gauche, là où il est écrit "default",
00:09:38j'ai créé mon propre nouveau modèle,
00:09:39mais vous pouvez rester sur celui par défaut si vous voulez,
00:09:42là où il est indiqué "location" et "note location".
00:09:47Vous devrez changer "clippings" en "raw".
00:09:52Cela garantira que lorsque vous utilisez le clipper,
00:09:54le fichier ira automatiquement dans le dossier "raw".
00:09:56Ainsi, avec l'extension Obsidian Web Clipper
00:09:59et le plugin communautaire pour les images,
00:10:01nous pouvons transformer n'importe quelle page web
00:10:04en un fichier Markdown pour notre Wiki.
00:10:08Mais ce n'est qu'un seul canal de données.
00:10:10C'est un canal manuel.
00:10:11Claude Code peut aussi faire une grosse partie du travail.
00:10:14Disons que je voulais créer un Wiki
00:10:16sur les compétences de Claude Code.
00:10:17J'ai donc dit à Claude Code :
00:10:18"Créons un Wiki sur les compétences de Claude Code."
00:10:20J'ai déjà inclus des infos dans le dossier "raw",
00:10:23celles récupérées via le Web Clipper.
00:10:25"Fais tes propres recherches et importe les fichiers
00:10:27raw MD pertinents pour générer ce Wiki."
00:10:29Alors, que va-t-il faire ?
00:10:30Il va aller sur Internet via sa recherche web standard,
00:10:32et il va créer son propre Wiki sur les
00:10:36compétences de Claude Code.
00:10:37Vous voyez donc que ce dossier "raw",
00:10:40tout ce pipeline "raw", est plutôt pour vous.
00:10:42C'est pour quand vous voulez insérer manuellement des infos.
00:10:44Vous pouvez aussi demander à Claude Code de le faire,
00:10:46mais Claude Code est aussi assez intelligent pour
00:10:49analyser les recherches,
00:10:50déterminer ce qui est pertinent et créer le Wiki
00:10:53directement. Ce dossier "raw" est vraiment pour vous,
00:10:55l'humain, pour garder un certain niveau d'organisation.
00:10:58Et voici ce que Claude Code a produit.
00:10:59Il a créé le Wiki des compétences de Claude Code.
00:11:02On voit ici dans l'index maître qu'il est référencé.
00:11:05Si je clique dessus,
00:11:07cela nous amène à l'index des compétences Claude Code.
00:11:10Et pour l'instant, il contient quatre articles.
00:11:12Voici l'article de présentation des compétences.
00:11:15Vous voyez qu'il renvoie vers des sites web et aussi
00:11:18vers différents articles de notre coffre Obsidian.
00:11:21Si je clique sur l'écosystème, il y a d'autres éléments.
00:11:25Je clique sur les meilleures compétences, etc.
00:11:27Il y a un cheminement très clair d'un article à l'autre
00:11:30et sur la manière dont ces choses sont liées,
00:11:32ce qui signifie que si vous posez des questions à Claude Code
00:11:34sur ces articles et ces sujets,
00:11:35il lui est facile et peu coûteux d'y répondre,
00:11:39ce qui nous amène à la question évidente.
00:11:41Avons-nous vraiment besoin du RAG ? Vous savez,
00:11:43quand on voit une config comme ce Light RAG.
00:11:45Si vous avez vu mes dernières vidéos sur Light RAG
00:11:48et le RAG, et la simplicité de la config Obsidian,
00:11:51vous vous dites probablement : "Eh bien,
00:11:52pourquoi s'embêter avec ces installations
00:11:55beaucoup plus compliquées ?"
00:11:56Et la vérité est que si vous êtes un développeur solo,
00:11:59un entrepreneur seul ou une petite équipe qui ne gère pas
00:12:02des milliers de documents,
00:12:04la réponse est qu'Obsidian est probablement plus logique.
00:12:08C'est léger et vous n'avez pas vraiment besoin de RAG.
00:12:11Ces grands modèles de langage,
00:12:12ces outils comme Claude Code sont suffisants
00:12:16pour votre cas d'utilisation.
00:12:17On pourrait débattre longuement des
00:12:18différences entre le RAG Obsidian et le vrai RAG.
00:12:21Mais la vérité, c'est que l'enjeu est l'échelle.
00:12:24Cherche-t-on à passer à des millions de documents ou non ?
00:12:27Car à une certaine échelle,
00:12:29il sera moins cher et plus rapide d'utiliser
00:12:32un véritable système de RAG.
00:12:33Peu importe la capacité de Claude Code à naviguer
00:12:38dans ce réseau de fichiers MD que vous avez créé.
00:12:40Mais ce n'est pas une question à laquelle vous devez
00:12:42répondre précisément dès maintenant.
00:12:44Pourquoi ne pas simplement commencer par Obsidian ?
00:12:47Et s'il devient clair que
00:12:48votre volume dépasse les limites de ce qu'il peut gérer,
00:12:51alors passez simplement au RAG.
00:12:53Les gens se focalisent trop sur la réponse à
00:12:55cette question. Essayez simplement, expérimentez.
00:12:58Ça ne vous coûte rien d'utiliser un système de RAG,
00:13:01un système de RAG comme Obsidian.
00:13:03Et si ça ne marche pas, ce n'est pas grave.
00:13:05Utilisez alors Light RAG à la place.
00:13:06Certains voudront débattre sans fin,
00:13:09comme toujours en commentaires, mais testez-le.
00:13:11La réponse deviendra très claire à partir du moment
00:13:14où vous devrez passer à un vrai système RAG.
00:13:16Mais l'avantage ici, encore une fois,
00:13:19c'est que la plupart des gens n'ont pas besoin de vrai RAG.
00:13:21Vraiment pas.
00:13:22Même s'ils sont dans une petite équipe d'entreprise.
00:13:24Donc avoir un système bien
00:13:27orchestré comme cette base de connaissances Obsidian,
00:13:30est selon moi un atout majeur pour la majorité des gens.
00:13:33J'espère donc que cette analyse vous a été utile.
00:13:35Allez voir le post d'Andre à ce sujet.
00:13:37Il donne pas mal de détails.
00:13:39N'oubliez pas d'aller voir l'école gratuite Chase AI.
00:13:41Il y a un lien dans la description qui contient
00:13:43tous les prompts et un guide écrit de la procédure.
00:13:47Si vous avez été un peu perdu, et comme toujours,
00:13:50jetez un œil à Chase AI Plus pour accéder
00:13:52à cette masterclass. À part ça,
00:13:54dites-moi ce que vous en avez pensé et à bientôt.

Key Takeaway

Le système Obsidian RAG d'Andrej Karpathy utilise une structure de fichiers Markdown organisée par index et le moteur Claude Code pour égaler les performances des systèmes RAG complexes sans nécessiter de base de données vectorielle.

Highlights

Le système Obsidian RAG remplace les bases de données vectorielles et les processus de récupération complexes par une structure de fichiers Markdown simple et un modèle linguistique performant.

L'utilisation du dossier "raw" comme zone de transit permet d'ingérer manuellement des articles, des PDFs et des dépôts de code avant leur transformation en fiches Wiki.

L'extension Obsidian Web Clipper convertit n'importe quelle page web en fichier Markdown, envoyant automatiquement le contenu vers le répertoire de stockage défini.

L'ajout du plugin communautaire "Local Images Plus" permet de conserver et d'afficher les images directement au sein des documents ingérés dans Obsidian.

Le fichier de configuration Claude.md définit les règles de navigation de la base de connaissances pour optimiser la consommation de jetons lors des requêtes de l'IA.

Ce système de gestion de connaissances local est essentiellement gratuit et constitue une alternative efficace aux architectures RAG traditionnelles pour les équipes gérant moins de 1 000 documents.

Timeline

Simplification du RAG avec Obsidian et Claude Code

  • L'architecture simplifiée d'Obsidian élimine le besoin d'embeddings et de bases de données vectorielles pour la gestion documentaire.
  • Les modèles linguistiques actuels possèdent des capacités d'auto-maintenance suffisantes pour organiser des fichiers d'index de manière autonome.
  • Le système permet de rassembler des informations précises et d'établir des liens entre les documents avec une configuration minimale.

Les structures RAG traditionnelles sont souvent trop lourdes pour un usage individuel ou en petite équipe. En utilisant Obsidian comme interface front-end, l'utilisateur garde une visibilité totale sur ses données, contrairement aux systèmes en boîte noire. Cette approche résout les problèmes de gestion de grandes quantités de documents de manière légère et gratuite.

Structure hiérarchique des fichiers et flux de données

  • Le dossier "raw" sert de zone de transit pour toutes les recherches brutes et les documents importés manuellement.
  • Un index principal en Markdown répertorie l'ensemble des thématiques traitées dans le dossier Wiki pour guider l'IA.
  • Les dossiers Wiki individuels contiennent leurs propres fichiers d'index pour détailler le contenu spécifique à chaque sujet.

L'organisation repose sur un cheminement clair qui facilite la navigation pour Claude Code. En consultant d'abord l'index maître, l'IA identifie rapidement le Wiki pertinent avant de descendre dans les sous-dossiers. Cette méthode réduit drastiquement le nombre d'appels d'outils nécessaires pour localiser une information précise au sein de la structure de fichiers.

Configuration technique et outils d'ingestion

  • Le prompt de création de structure permet à Claude Code de générer automatiquement l'arborescence nécessaire dans le coffre Obsidian.
  • Le fichier Claude.md sert de manuel d'instructions à l'IA pour structurer les liens Wiki et respecter les règles de la base de connaissances.
  • Le plugin Local Images Plus corrige les limitations natives du Web Clipper en important les images directement dans les fichiers Markdown.

La mise en place nécessite l'installation gratuite d'Obsidian et la désignation d'un dossier racine nommé "the vault". Pour automatiser l'ingestion, il faut configurer les options du Web Clipper afin que la destination par défaut devienne le dossier "raw". Cette combinaison d'outils transforme n'importe quelle source web en donnée exploitable instantanément par l'IA.

Automatisation des Wikis et comparaison avec le RAG traditionnel

  • Claude Code est capable d'effectuer ses propres recherches web pour générer des Wikis complets sans intervention humaine.
  • Le choix entre Obsidian et un système RAG classique dépend principalement du volume documentaire et de l'échelle du projet.
  • L'utilisation de fichiers Markdown interconnectés offre un cheminement logique qui minimise les coûts opérationnels de l'IA.

L'avantage majeur de cette méthode réside dans sa flexibilité : l'humain peut organiser ses données manuellement tandis que l'IA complète les manques par des recherches autonomes. Le passage à un système RAG complexe n'est justifié que lorsque le volume atteint des millions de documents. Pour la majorité des cas d'utilisation professionnels et personnels, l'orchestration via Obsidian suffit amplement.

Community Posts

View all posts