Log in to leave a comment
No posts yet
Les fichiers Markdown récupérés sur le web sont souvent encombrés de bruits tels que des publicités et des barres de menus. Lorsque ce type de texte est mélangé, les performances du RAG (Génération Augmentée par Récupération) chutent de manière significative. En réalité, les données non raffinées dispersent l'attention du modèle, tandis qu'un Markdown proprement organisé améliore la précision de la recherche. En éliminant le texte superflu, vous réduisez de plus de 30 % les jetons (tokens) consommés par le LLM local, évitant ainsi tout gaspillage financier.
Vous devez utiliser la bibliothèque BeautifulSoup de Python pour éliminer ce bruit.
pip install beautifulsoup4 lxml dans le terminal.decompose() pour supprimer l'intégralité des classes CSS inutiles comme .ad-container ou .nav-menu.lxml, enregistrez-le en Markdown et placez-le dans votre coffre (vault) Obsidian.Lorsque le nombre de fichiers s'élève à plusieurs centaines, même le modèle le plus intelligent perd le fil du contexte. Ne vous contentez pas d'accumuler les fichiers ; divisez-les en zones selon l'état de l'information. J'utilise une structure en trois étapes (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action) basée sur le framework PARA. Cela donne à Claude Code une ligne directrice physique pour savoir à quelles informations se fier et lesquelles consulter.
Utilisez les noms de fichiers et les options du terminal pour éviter que l'agent ne s'égare.
YYYY-MM-DD devant chaque nom de fichier pour indiquer la fraîcheur de l'information.--newer-than pour qu'il ne lise que les fichiers modifiés au cours des dernières 24 heures.03_Project_Action.Une simple recherche textuelle ne permet pas de distinguer si un document est « important » ou s'il s'agit d'une « tâche terminée ». C'est pourquoi vous devez insérer un Frontmatter YAML en haut du document. Avec des métadonnées, vous pouvez donner des instructions beaucoup plus précises à Claude Code.
Trois champs suffisent pour le moteur de travail d'un infopreneur :
topic pour diviser les sujets, source_importance pour évaluer l'importance, et status pour l'état d'avancement en haut de la note.Claude Code, basé sur le terminal, révèle sa véritable puissance lorsqu'il est associé à des scripts shell. En arrivant au travail, il suffit de taper une commande pour que le moteur analyse ce que vous avez appris la veille et génère même des brouillons d'e-mails à envoyer aujourd'hui. Plus besoin de gaspiller de l'énergie chaque matin à se demander par quoi commencer.
Voici comment construire la routine d'automatisation :
.sh ou .bat) contenant la commande claude --bare pour accélérer le démarrage initial.find -mtime -1 dans le script pour ne transmettre à Claude que les notes créées au cours de la dernière journée.Dès que le nombre de fichiers dépasse le millier, la fenêtre de contexte de 200 000 jetons se remplit rapidement. À partir de ce stade, au lieu de lui faire lire tous les fichiers, il faut adopter une méthode en deux étapes consistant à lui faire consulter d'abord master_index.md, qui joue le rôle de carte générale. Cette approche réduit le nombre d'appels API de près de 60 %.
Pour maintenir les performances, vous devez gérer le contexte intelligemment.
/compact pour résumer l'historique.