Создание автоматического рабочего движка путем связывания Obsidian Markdown с Claude Code

Очистка мусорных данных, полученных через веб-клиппер

Файлы Markdown, скопированные из веба, представляют собой нагромождение шума: рекламы, навигационных меню и прочего. Наличие такого текста заметно снижает производительность RAG (генерации с дополнением поиска). На практике неочищенные данные рассеивают внимание модели, в то время как аккуратно структурированный Markdown повышает точность поиска. Удаление лишнего текста также сокращает потребление токенов локальными LLM более чем на 30%, что избавляет от лишних трат.

Для устранения этого шума стоит использовать библиотеку Python BeautifulSoup.

В терминале введите pip install beautifulsoup4 lxml, чтобы подготовить окружение.
В скрипте используйте метод decompose(), чтобы целиком удалить ненужные CSS-классы, такие как .ad-container или .nav-menu.
Извлеките только основной текст с помощью парсера lxml, сохраните его в Markdown и поместите в хранилище Obsidian.
Таким образом, модель сосредоточится только на ключевом контенте, будет меньше галлюцинировать, а потребление токенов упадет примерно до 25% от исходного уровня.

Структура папок, в которой Claude Code не потеряется

Когда количество файлов вырастает до сотен, даже самая умная модель теряет контекст. Не копите файлы в одной куче, а разделите их на зоны в зависимости от статуса информации. Я использую адаптацию фреймворка PARA — трехступенчатую структуру (01_Raw_Inbox, 02_Processed_Wiki, 03_Project_Action). Это дает Claude Code физические ориентиры: какой информации доверять и на что ссылаться.

Используйте имена файлов и опции терминала, чтобы агент не блуждал:

Добавляйте YYYY-MM-DD в начало всех имен файлов, чтобы модель знала, насколько свежа информация.
При запусте Claude Code используйте опцию --newer-than, чтобы он читал только файлы, измененные за последние 24 часа.
В папке 03_Project_Action оставляйте только файлы с описанием статуса задач.
С такой структурой Claude не будет совершать глупостей, перерывая все хранилище. Благодаря этому поиск, занимавший 10 минут, завершается за 30 секунд.

Заполнение пробелов в поиске с помощью метаданных YAML

Простой текстовый поиск не может отличить, является ли документ «важным» или «завершенным». Поэтому в начало документа нужно добавить YAML Frontmatter. Наличие метаданных позволяет давать Claude Code гораздо более точные команды.

Для рабочего движка создателя контента достаточно трех полей:

Укажите topic для разделения тем, source_importance для приоритетности и status для состояния задачи в верхней части заметки.
С помощью плагина Obsidian «YAML Toolkit» примените эти правила сразу к сотням существующих файлов.
В конфигурационном файле Claude Code (CLAUDE.md) пропишите: "Составляй список задач, просматривая только документы со статусом Doing".
Это освободит вас от двухчасовой утренней рутины по разбору материалов, позволяя получать рабочий брифинг всего за 10 минут.

Ежедневный брифинг одной командой

Терминальный Claude Code проявляет свою истинную мощь в сочетании с шелл-скриптами. Придя на работу и введя одну команду, вы получаете готовый движок, который анализирует изученное вчера и даже готовит черновики писем на сегодня. Больше не нужно тратить энергию каждое утро, раздумывая, с чего начать.

Автоматизация настраивается следующим образом:

Создайте шелл-скрипт (.sh или .bat) с командой claude --bare, чтобы ускорить первоначальный запуск.
Добавьте в скрипт команду find -mtime -1, чтобы передавать Claude только заметки, созданные за последние сутки.
Используйте функцию PostToolUse в Claude Code для исправления опечаток в сгенерированных черновиках и их автоматического сохранения в определенную папку.
Время на написание письма сокращается с 30 до 5 минут.

Стратегия иерархических ссылок при взрывном росте данных

Когда количество файлов превышает тысячу, контекстное окно в 200 тысяч токенов быстро заполняется. В этом случае вместо чтения всех файлов следует использовать двухэтапный подход: сначала заставить модель изучить master_index.md, который играет роль общей карты. Этот метод сокращает количество вызовов API почти на 60%.

Для поддержания производительности нужно грамотно управлять контекстом:

Понимайте и контролируйте общее потребление токенов по следующей формуле: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Пусть Claude Code сначала прочитает мастер-индекс и найдет только те пути к файлам, которые необходимы для ответа на вопрос.
Дополнительно считывайте только файлы по найденным путям для формирования ответа, а при затянувшемся диалоге используйте команду /compact для резюмирования истории.
Внедрение этой иерархической структуры обеспечит мгновенную поддержку в принятии решений без тормозов, сколько бы данных у вас ни накопилось.

Создание автоматического рабочего движка путем связывания Obsidian Markdown с Claude Code

Очистка мусорных данных, полученных через веб-клиппер

Для устранения этого шума стоит использовать библиотеку Python BeautifulSoup.

В терминале введите pip install beautifulsoup4 lxml, чтобы подготовить окружение.
В скрипте используйте метод decompose(), чтобы целиком удалить ненужные CSS-классы, такие как .ad-container или .nav-menu.
Извлеките только основной текст с помощью парсера lxml, сохраните его в Markdown и поместите в хранилище Obsidian.
Таким образом, модель сосредоточится только на ключевом контенте, будет меньше галлюцинировать, а потребление токенов упадет примерно до 25% от исходного уровня.

Структура папок, в которой Claude Code не потеряется

Используйте имена файлов и опции терминала, чтобы агент не блуждал:

Добавляйте YYYY-MM-DD в начало всех имен файлов, чтобы модель знала, насколько свежа информация.
При запусте Claude Code используйте опцию --newer-than, чтобы он читал только файлы, измененные за последние 24 часа.
В папке 03_Project_Action оставляйте только файлы с описанием статуса задач.
С такой структурой Claude не будет совершать глупостей, перерывая все хранилище. Благодаря этому поиск, занимавший 10 минут, завершается за 30 секунд.

Заполнение пробелов в поиске с помощью метаданных YAML

Для рабочего движка создателя контента достаточно трех полей:

Укажите topic для разделения тем, source_importance для приоритетности и status для состояния задачи в верхней части заметки.
С помощью плагина Obsidian «YAML Toolkit» примените эти правила сразу к сотням существующих файлов.
В конфигурационном файле Claude Code (CLAUDE.md) пропишите: "Составляй список задач, просматривая только документы со статусом Doing".
Это освободит вас от двухчасовой утренней рутины по разбору материалов, позволяя получать рабочий брифинг всего за 10 минут.

Ежедневный брифинг одной командой

Автоматизация настраивается следующим образом:

Создайте шелл-скрипт (.sh или .bat) с командой claude --bare, чтобы ускорить первоначальный запуск.
Добавьте в скрипт команду find -mtime -1, чтобы передавать Claude только заметки, созданные за последние сутки.
Используйте функцию PostToolUse в Claude Code для исправления опечаток в сгенерированных черновиках и их автоматического сохранения в определенную папку.
Время на написание письма сокращается с 30 до 5 минут.

Стратегия иерархических ссылок при взрывном росте данных

Для поддержания производительности нужно грамотно управлять контекстом:

Понимайте и контролируйте общее потребление токенов по следующей формуле: $T_{total} = T_{system} + T_{index} + T_{active\_files} + T_{history}$
Пусть Claude Code сначала прочитает мастер-индекс и найдет только те пути к файлам, которые необходимы для ответа на вопрос.
Дополнительно считывайте только файлы по найденным путям для формирования ответа, а при затянувшемся диалоге используйте команду /compact для резюмирования истории.
Внедрение этой иерархической структуры обеспечит мгновенную поддержку в принятии решений без тормозов, сколько бы данных у вас ни накопилось.

Создание автоматического рабочего движка путем связывания Obsidian Markdown с Claude Code

Related Video

Obsidian RAG от Карпати + Claude Code = ЧИТ-КОД

Создание автоматического рабочего движка путем связывания Obsidian Markdown с Claude Code

Очистка мусорных данных, полученных через веб-клиппер

Структура папок, в которой Claude Code не потеряется

Заполнение пробелов в поиске с помощью метаданных YAML

Ежедневный брифинг одной командой

Стратегия иерархических ссылок при взрывном росте данных

Comments (0)

Создание автоматического рабочего движка путем связывания Obsidian Markdown с Claude Code

Очистка мусорных данных, полученных через веб-клиппер

Структура папок, в которой Claude Code не потеряется

Заполнение пробелов в поиске с помощью метаданных YAML

Ежедневный брифинг одной командой

Стратегия иерархических ссылок при взрывном росте данных