Obsidian Markdown mit Claude Code verbinden, um eine automatisierte Arbeits-Engine zu erstellen

Zuerst den Müll aus den vom Web-Clipper importierten Daten entfernen

Markdown-Dateien, die aus dem Web gescrapt wurden, sind oft voller Rauschen wie Werbung und Menüleisten. Wenn solcher Text beigemischt ist, sinkt die Leistung von RAG (Retrieval-Augmented Generation) merklich. In der Realität lenken unbereinigte Daten die Aufmerksamkeit des Modells ab, während sauber strukturiertes Markdown die Suchgenauigkeit erhöht. Das Entfernen unnötiger Texte reduziert die von lokalen LLMs verbrauchten Token um über 30 %, sodass kein Geld verschwendet wird.

Verwenden Sie die BeautifulSoup-Bibliothek von Python, um dieses Rauschen zu beseitigen.

Bereiten Sie die Umgebung vor, indem Sie im Terminal pip install beautifulsoup4 lxml eingeben.
Löschen Sie im Skript mit der Methode decompose() ganze CSS-Klassen wie .ad-container oder .nav-menu.
Extrahieren Sie mit dem lxml-Parser nur den Haupttext, speichern Sie ihn als Markdown und verschieben Sie ihn in Ihren Obsidian-Vault.
Dadurch konzentriert sich das Modell nur auf die Kerninhalte, was Halluzinationen reduziert und den Tokenverbrauch auf etwa 25 % des ursprünglichen Niveaus senkt.

Ein Ordner-Design, bei dem Claude Code nicht die Orientierung verliert

Wenn die Anzahl der Dateien in die Hunderte geht, verliert selbst das intelligenteste Modell den Kontext. Stapeln Sie Dateien nicht einfach wahllos, sondern unterteilen Sie Bereiche basierend auf dem Status der Informationen. Ich verwende eine dreistufige Struktur (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action), die eine Abwandlung des PARA-Frameworks ist. Dies gibt Claude Code eine physische Richtlinie, welchen Informationen er vertrauen und worauf er sich beziehen soll.

Nutzen Sie Dateinamen und Terminal-Optionen, damit der Agent nicht umherirrt.

Setzen Sie YYYY-MM-DD vor jeden Dateinamen, um anzuzeigen, wie aktuell die Information ist.
Verwenden Sie beim Ausführen von Claude Code die Option --newer-than, damit nur Dateien gelesen werden, die sich in den letzten 24 Stunden geändert haben.
Legen Sie im Ordner 03_Project_Action nur Dateien ab, die den aktuellen Arbeitsstatus enthalten.
Mit dieser Struktur vermeidet Claude den dummen Fehler, den gesamten Vault zu durchwühlen. Dadurch verkürzt sich eine Suche, die früher 10 Minuten dauerte, auf 30 Sekunden.

Suchlücken mit YAML-Metadaten schließen

Eine einfache Textsuche kann nicht unterscheiden, ob ein Dokument "wichtig" oder "erledigt" ist. Daher müssen Sie YAML-Frontmatter am Anfang des Dokuments einfügen. Mit Metadaten können Sie Claude Code wesentlich präzisere Anweisungen geben.

Für die Arbeits-Engine eines Wissensunternehmers reichen drei Felder aus.

Notieren Sie topic zur Themeneinteilung, source_importance für die Relevanz und status für den Arbeitszustand ganz oben in der Notiz.
Wenden Sie diese Regeln mit dem Obsidian-Plugin "YAML Toolkit" auf hunderte bestehende Dateien gleichzeitig an.
Schreiben Sie in die Konfigurationsdatei von Claude Code (CLAUDE.md): "Erstelle die Aufgabenliste nur basierend auf Dokumenten, deren Status 'Doing' ist."
So befreien Sie sich von der Qual, jeden Morgen zwei Stunden lang Materialien zu ordnen, und können stattdessen in 10 Minuten ein Arbeitsbriefing erhalten.

Daily Briefing Routine mit einer einzigen Befehlszeile

Das terminalbasierte Claude Code entfaltet seine wahre Kraft in Kombination mit Shell-Skripten. Wenn Sie nach der Ankunft am Arbeitsplatz nur einen Befehl eingeben, ist die Engine fertig, die die gestrigen Lerninhalte analysiert und sogar E-Mail-Entwürfe für heute erstellt. Sie müssen keine Energie mehr darauf verschwenden, jeden Morgen zu überlegen, was Sie zuerst tun sollen.

Automatisieren Sie die Routine wie folgt:

Erstellen Sie ein Shell-Skript (.sh oder .bat) mit dem Befehl claude --bare, um die Startgeschwindigkeit zu erhöhen.
Integrieren Sie den Befehl find -mtime -1 in das Skript, um nur die im letzten Tag erstellten Notizen an Claude zu übergeben.
Nutzen Sie die PostToolUse-Funktion von Claude Code, um Tippfehler in den generierten E-Mail-Entwürfen zu korrigieren und sie automatisch in einem bestimmten Ordner zu speichern.
Die Zeit für das Schreiben einer E-Mail reduziert sich von 30 auf 5 Minuten.

Hierarchische Referenzstrategie für explodierende Datenmengen

Wenn die Anzahl der Dateien tausend übersteigt, füllt sich selbst ein Kontextfenster von 200.000 Token schnell. Ab diesem Punkt sollten Sie nicht mehr alle Dateien einlesen lassen, sondern eine zweistufige Methode anwenden, bei der zuerst die master_index.md, die als Gesamtkarte fungiert, gesichtet wird. Diese Methode reduziert die Anzahl der API-Aufrufe um fast 60 %.

Um die Leistung aufrechtzuerhalten, müssen Sie das Kontextmanagement klug angehen.

Verstehen und verwalten Sie den gesamten Tokenverbrauch nach folgendem Schema: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Lassen Sie Claude Code zuerst den Master-Index lesen, um nur die Dateipfade zu finden, die zur Beantwortung der Frage unbedingt erforderlich sind.
Lesen Sie zusätzlich nur die Dateien der gefundenen Pfade ein, um die Antwort zu erstellen, und fassen Sie den Verlauf mit dem Befehl /compact zusammen, wenn das Gespräch zu lang wird.
Durch die Einführung dieser hierarchischen Struktur erhalten Sie sofortige Entscheidungsunterstützung ohne Verzögerungen, egal wie viele Daten sich ansammeln.

Obsidian Markdown mit Claude Code verbinden, um eine automatisierte Arbeits-Engine zu erstellen

Zuerst den Müll aus den vom Web-Clipper importierten Daten entfernen

Verwenden Sie die BeautifulSoup-Bibliothek von Python, um dieses Rauschen zu beseitigen.

Bereiten Sie die Umgebung vor, indem Sie im Terminal pip install beautifulsoup4 lxml eingeben.
Löschen Sie im Skript mit der Methode decompose() ganze CSS-Klassen wie .ad-container oder .nav-menu.
Extrahieren Sie mit dem lxml-Parser nur den Haupttext, speichern Sie ihn als Markdown und verschieben Sie ihn in Ihren Obsidian-Vault.
Dadurch konzentriert sich das Modell nur auf die Kerninhalte, was Halluzinationen reduziert und den Tokenverbrauch auf etwa 25 % des ursprünglichen Niveaus senkt.

Ein Ordner-Design, bei dem Claude Code nicht die Orientierung verliert

Nutzen Sie Dateinamen und Terminal-Optionen, damit der Agent nicht umherirrt.

Setzen Sie YYYY-MM-DD vor jeden Dateinamen, um anzuzeigen, wie aktuell die Information ist.
Verwenden Sie beim Ausführen von Claude Code die Option --newer-than, damit nur Dateien gelesen werden, die sich in den letzten 24 Stunden geändert haben.
Legen Sie im Ordner 03_Project_Action nur Dateien ab, die den aktuellen Arbeitsstatus enthalten.
Mit dieser Struktur vermeidet Claude den dummen Fehler, den gesamten Vault zu durchwühlen. Dadurch verkürzt sich eine Suche, die früher 10 Minuten dauerte, auf 30 Sekunden.

Suchlücken mit YAML-Metadaten schließen

Für die Arbeits-Engine eines Wissensunternehmers reichen drei Felder aus.

Notieren Sie topic zur Themeneinteilung, source_importance für die Relevanz und status für den Arbeitszustand ganz oben in der Notiz.
Wenden Sie diese Regeln mit dem Obsidian-Plugin "YAML Toolkit" auf hunderte bestehende Dateien gleichzeitig an.
Schreiben Sie in die Konfigurationsdatei von Claude Code (CLAUDE.md): "Erstelle die Aufgabenliste nur basierend auf Dokumenten, deren Status 'Doing' ist."
So befreien Sie sich von der Qual, jeden Morgen zwei Stunden lang Materialien zu ordnen, und können stattdessen in 10 Minuten ein Arbeitsbriefing erhalten.

Daily Briefing Routine mit einer einzigen Befehlszeile

Automatisieren Sie die Routine wie folgt:

Erstellen Sie ein Shell-Skript (.sh oder .bat) mit dem Befehl claude --bare, um die Startgeschwindigkeit zu erhöhen.
Integrieren Sie den Befehl find -mtime -1 in das Skript, um nur die im letzten Tag erstellten Notizen an Claude zu übergeben.
Nutzen Sie die PostToolUse-Funktion von Claude Code, um Tippfehler in den generierten E-Mail-Entwürfen zu korrigieren und sie automatisch in einem bestimmten Ordner zu speichern.
Die Zeit für das Schreiben einer E-Mail reduziert sich von 30 auf 5 Minuten.

Hierarchische Referenzstrategie für explodierende Datenmengen

Um die Leistung aufrechtzuerhalten, müssen Sie das Kontextmanagement klug angehen.

Verstehen und verwalten Sie den gesamten Tokenverbrauch nach folgendem Schema: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Lassen Sie Claude Code zuerst den Master-Index lesen, um nur die Dateipfade zu finden, die zur Beantwortung der Frage unbedingt erforderlich sind.
Lesen Sie zusätzlich nur die Dateien der gefundenen Pfade ein, um die Antwort zu erstellen, und fassen Sie den Verlauf mit dem Befehl /compact zusammen, wenn das Gespräch zu lang wird.
Durch die Einführung dieser hierarchischen Struktur erhalten Sie sofortige Entscheidungsunterstützung ohne Verzögerungen, egal wie viele Daten sich ansammeln.

Obsidian Markdown mit Claude Code verbinden, um eine automatisierte Arbeits-Engine zu erstellen

Related Video

Karpathys Obsidian RAG + Claude Code = CHEAT CODE

Obsidian Markdown mit Claude Code verbinden, um eine automatisierte Arbeits-Engine zu erstellen

Zuerst den Müll aus den vom Web-Clipper importierten Daten entfernen

Ein Ordner-Design, bei dem Claude Code nicht die Orientierung verliert

Suchlücken mit YAML-Metadaten schließen

Daily Briefing Routine mit einer einzigen Befehlszeile

Hierarchische Referenzstrategie für explodierende Datenmengen

Comments (0)

Obsidian Markdown mit Claude Code verbinden, um eine automatisierte Arbeits-Engine zu erstellen

Zuerst den Müll aus den vom Web-Clipper importierten Daten entfernen

Ein Ordner-Design, bei dem Claude Code nicht die Orientierung verliert

Suchlücken mit YAML-Metadaten schließen

Daily Briefing Routine mit einer einzigen Befehlszeile

Hierarchische Referenzstrategie für explodierende Datenmengen