Obsidian RAG от Карпати + Claude Code = ЧИТ-КОД

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português 中文

Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Андрей Карпати только что открыл нам доступ

00:00:02к своей личной системе RAG в Obsidian.

00:00:06И я беру слово «RAG» в кавычки,

00:00:07потому что в этой базе знаний на базе Obsidian

00:00:10нет ни векторной базы данных, ни эмбеддингов,

00:00:12ни сложного процесса извлечения данных.

00:00:15Тем не менее, она решает ту же самую проблему,

00:00:17которую якобы решают сложные RAG-структуры,

00:00:21а именно: позволяет большой языковой модели

00:00:23обрабатывать огромные объемы документов

00:00:27и находить в них точную информацию.

00:00:30И самое лучшее в этой системе на Obsidian —

00:00:32то, что она очень легкая, практически бесплатная

00:00:36и является идеальной золотой серединой

00:00:38для индивидуального специалиста или небольшой команды.

00:00:41Поэтому сегодня я покажу вам,

00:00:42как работает система знаний Карпати в Obsidian,

00:00:45как настроить ее самостоятельно

00:00:46и чем она отличается от традиционных RAG-систем,

00:00:50чтобы вы поняли, подходит ли она вам.

00:00:52Процесс создания этой системы знаний

00:00:54был подробно описан вчера

00:00:58в объемном посте Андрея Карпати в Твиттере.

00:01:02Главный вывод из этого поста заключается в том,

00:01:04что мы можем создавать базы знаний

00:01:05для больших языковых моделей,

00:01:07которые по сути работают так же,

00:01:09как LightRAG, RAG-Anything

00:01:12или любая другая система GraphRAG с Obsidian.

00:01:17И мы можем сделать это довольно простым способом,

00:01:20используя продуманную структуру файловой системы

00:01:23и правильный метод загрузки данных.

00:01:25В итоге я могу загрузить

00:01:28внушительный объем данных и документов

00:01:32в свое хранилище Obsidian и использовать Claude Code,

00:01:35чтобы задавать вопросы по ним,

00:01:36находить связи между различными вещами —

00:01:38то есть делать ровно то же самое,

00:01:41что и с традиционной RAG-системой,

00:01:43но без лишних затрат и с гораздо более простой настройкой.

00:01:46Как описывает Андрей, настройка выглядит примерно так.

00:01:49Сначала идет сбор данных.

00:01:51Мы берем статьи,

00:01:52научные работы,

00:01:53репозитории из интернета или откуда угодно

00:01:57и помещаем их в папку «raw» (сырые данные)

00:02:00внутри хранилища Obsidian.

00:02:02По сути, это промежуточная зона,

00:02:03прежде чем данные превратятся в Вики.

00:02:05Мы, как люди, участвующие в этом процессе,

00:02:07можем видеть все происходящее через Obsidian.

00:02:10Obsidian, по всем признакам, является нашим интерфейсом.

00:02:13Здесь я вижу, как распределены все документы.

00:02:15Здесь я могу прочитать все Вики-страницы.

00:02:17Так что это не какая-то абстракция в черном ящике,

00:02:20как это бывает в обычных RAG-системах.

00:02:21Даже в GraphRAG вроде LightRAG бывает трудно

00:02:25заглянуть внутрь и действительно все увидеть.

00:02:29То есть, я могу это сделать, но как бы круто это ни выглядело,

00:02:31это не очень эффективно.

00:02:33А далее вы просто ведете диалог

00:02:35через что-то вроде Claude Code.

00:02:37И, как отметил Андрей,

00:02:38он ожидал, что ему придется прибегнуть

00:02:40к полноценному RAG,

00:02:42но большая языковая модель оказалась хороша

00:02:43в автоматическом ведении индексных файлов

00:02:45и кратких резюме всех прочитанных документов.

00:02:47И мы тоже сможем это сделать

00:02:49с помощью простого файла Claude.md,

00:02:52который я вам предоставлю.

00:02:53Вы сможете найти этот Claude.md,

00:02:55а также письменное руководство

00:02:56с набором промптов

00:02:57в моем бесплатном сообществе Chase AI.

00:03:00Ссылка на него будет

00:03:01в описании к этому видео.

00:03:03И говоря о Chase AI — вы знали, что это будет —

00:03:06небольшая реклама моего мастер-класса по Claude Code.

00:03:08Я выпустил его пару недель назад,

00:03:09и это лучшее место, чтобы стать ИИ-разработчиком с нуля,

00:03:12особенно если у вас нет технического образования.

00:03:15Ссылку на него вы найдете в закрепленном комментарии.

00:03:18Так что обязательно загляните,

00:03:19если вы серьезно настроены освоить этот инструмент.

00:03:22Теперь, прежде чем мы перейдем к деталям

00:03:24настройки этой системы Obsidian для себя,

00:03:28давайте разберем саму структуру файлов,

00:03:30потому что важно понимать,

00:03:32как данные попадают в хранилище

00:03:34и превращаются в Вики.

00:03:36Хранилище (vault) Obsidian — это место, где живет все.

00:03:39Как вы увидите, если никогда им не пользовались,

00:03:41при скачивании Obsidian

00:03:42вам нужно будет назначить папку в качестве хранилища.

00:03:45В моем случае она так и называется — «the vault».

00:03:48Там находится все содержимое Obsidian.

00:03:50Внутри этого хранилища

00:03:52у нас будет подпапка «raw».

00:03:54В папку «raw» сбрасываются все наши исследования.

00:03:58Все, что мы хотим включить в Вики вручную, попадает сюда.

00:04:01По сути, это папка для подготовки данных.

00:04:02Здесь будут храниться все исходные данные.

00:04:05Это могут быть Markdown-файлы.

00:04:06Это могут быть PDF-файлы.

00:04:07И я покажу вам, как использовать веб-клиппер Obsidian,

00:04:10чтобы превращать любую веб-страницу в Markdown-файл,

00:04:14который автоматически отправляется в папку «raw».

00:04:16У нас будет еще одна подпапка —

00:04:18папка «Wiki».

00:04:19Что будет делать большая языковая модель,

00:04:21а точнее Claude Code, так это по запросу —

00:04:24или вы можете сделать это навыком или автоматизировать —

00:04:27мы направим ее на папку «raw» и скажем:

00:04:29«Я хочу, чтобы ты создала Вики по теме,

00:04:33информацию о которой ты собирала».

00:04:35После этого она создаст соответствующую Вики.

00:04:37Как видите, здесь у нас три разные Вики-папки:

00:04:41одна про ИИ-агентов, одна про RAG-системы

00:04:43и одна про создание контента.

00:04:45Между папкой «Wiki» и этими тематическими папками

00:04:50находится главный индексный файл Markdown.

00:04:53По сути, это просто список

00:04:54всех созданных Вики-страниц.

00:04:58Идея в том, что когда вы — это вы —

00:05:02когда вы общаетесь с Claude Code,

00:05:04а вон там у нас Claude Code, и говорите:

00:05:06«Я хочу узнать больше об ИИ-агентах.

00:05:08Я хочу задать вопросы по моей Вики».

00:05:12Что она сделает?

00:05:13Она пойдет в хранилище,

00:05:15в котором вы, скорее всего, уже находитесь.

00:05:17Затем она перейдет в папку «Wiki».

00:05:18Она заглянет в главный индексный файл и спросит:

00:05:21«Так, какие Вики у нас созданы?

00:05:23Ага, он хочет знать про RAG-системы».

00:05:26Хорошо, она переходит к RAG.

00:05:28А в самих папках Вики есть свои индексные файлы,

00:05:31которые структурируют весь дополнительный контент.

00:05:33То, что дает нам Obsidian

00:05:35и эта структура файлов —

00:05:36это очень четкий путь для поиска информации,

00:05:39даже если ее накопилось огромное количество.

00:05:41Это помогает Claude Code,

00:05:42потому что у нее не возникнет проблем

00:05:45с поиском нужных данных.

00:05:46Нам не придется делать миллион вызовов инструментов,

00:05:48чтобы понять структуру наших файлов.

00:05:50Но это помогает и вам, потому что сразу ясно, куда идти.

00:05:52Например, слева находится моя папка Obsidian.

00:05:56Я в интерфейсе Obsidian,

00:05:57и через секунду мы перейдем к установке.

00:05:59Если я хочу посмотреть Вики, что я делаю?

00:06:01Я просто иду в раздел «Wiki».

00:06:03Там есть главный индекс,

00:06:04в котором перечислено все содержимое.

00:06:06Сейчас там всего три пункта.

00:06:07Но даже если бы их было 3000, это не составило бы труда.

00:06:10И оттуда я могу просто кликнуть по ссылке.

00:06:12Это приведет меня к индексу конкретной Вики-страницы.

00:06:16А там я уже могу изучать разные материалы.

00:06:18Все предельно просто.

00:06:19И для ИИ это тоже просто,

00:06:21вот почему мы можем использовать

00:06:22по сути обычную структуру Markdown-файлов,

00:06:24чтобы в какой-то мере имитировать RAG-систему.

00:06:27Теория — это круто, но теперь

00:06:28давайте разберем, как настроить это для себя.

00:06:31Прежде всего, вам нужно скачать Obsidian.

00:06:33Зайдите на obsidian.md, нажмите «Download Now»

00:06:37и следуйте подсказкам установщика.

00:06:38Это совершенно бесплатно.

00:06:40Затем вам нужно назначить папку в качестве хранилища.

00:06:43Просто создайте ее и назовите «the vault».

00:06:45Мне так удобнее, и вам, скорее всего, тоже подойдет.

00:06:47После создания хранилища

00:06:49нужно настроить в нем структуру файлов.

00:06:52Проще всего это сделать через Claude Code.

00:06:54Просто откройте Claude Code в папке хранилища.

00:06:57Это та директория, в которой я сейчас нахожусь.

00:06:59И дайте ей промпт

00:07:01с указанием создать нужную структуру файлов.

00:07:03К счастью для вас, я уже составил этот промпт.

00:07:05Так что вы можете просто скопировать его и вставить в Claude Code.

00:07:08Если же вы, как и я, уже какое-то время

00:07:10пользуетесь Obsidian, у вас там наверняка

00:07:13уже есть куча своих папок.

00:07:14Может быть, вы не хотите называть папку «raw».

00:07:17Может, вы хотите назвать ее как-то иначе.

00:07:18Суть в том, что вам просто нужно выделить

00:07:20какую-то папку в качестве зоны ожидания,

00:07:23где будет скапливаться вся информация,

00:07:25пока она не превратится в Вики.

00:07:27Так что подстраивайте под себя.

00:07:28Следующий шаг — создание файла Claude.md.

00:07:31Для проектов типа личных ассистентов,

00:07:33где много работы с Markdown, файлы Claude.md подходят идеально.

00:07:37В этом файле Claude.md прописаны

00:07:40правила базы знаний,

00:07:41а также то, как по ней перемещаться.

00:07:43Итак, мы не будем впустую тратить токены,

00:07:44когда задаем вопросы.

00:07:46Опять же, у меня есть весь этот шаблон промпта

00:07:50для файла Claude.md, который вы можете использовать.

00:07:50Этот файл Claude.md также сообщает Claude,

00:07:53как структурировать эти Markdown-файлы.

00:07:55Благодаря формату Wiki-ссылок

00:07:58перемещаться по файлам очень легко.

00:08:00Теперь давайте поговорим о том,

00:08:02как нам поместить данные в папку "raw".

00:08:03Как вообще загрузить данные в нашу систему.

00:08:06Что ж, очень простой способ сделать это —

00:08:08использовать Obsidian Web Clipper.

00:08:10Я оставлю ссылку на него в школе,

00:08:13или вы можете перейти на obsidian.md/clipper.

00:08:16Это просто расширение для Chrome,

00:08:18которое позволяет легко превратить веб-страницу в данные,

00:08:22в Markdown-файл.

00:08:23Единственная проблема с этим Web Clipper

00:08:25он плохо справляется с изображениями.

00:08:26Он их просто не перенесет.

00:08:27Они останутся в виде ссылок.

00:08:29Но я хочу видеть изображения из документов,

00:08:31которые я импортирую, прямо внутри Obsidian.

00:08:33Так что же нам делать?

00:08:34Мы воспользуемся плагином сообщества Obsidian,

00:08:37чтобы решить эту задачу.

00:08:39Одна из крутых особенностей Obsidian —

00:08:41это плагины сообщества.

00:08:42Их там тысячи.

00:08:43Если вы находитесь в Obsidian —

00:08:46я сейчас в десктопном приложении.

00:08:47Если я спущусь сюда и нажму на эту шестеренку,

00:08:50я перейду в раздел плагинов сообщества.

00:08:52Зайду в обзор (Browse).

00:08:54И затем введу в поиске "local images plus".

00:08:56Вам нужно скачать его, установить и включить.

00:09:00Убедитесь, что он активен.

00:09:01Вы можете подтвердить активацию,

00:09:03зайдя во вкладку установленных плагинов

00:09:05и увидев, что переключатель включен.

00:09:08Теперь, если мы используем Obsidian Web Clipper —

00:09:11я вижу его здесь в расширениях —

00:09:13вы увидите, что произойдет.

00:09:15Он мгновенно извлекает всё содержимое.

00:09:17И если я нажму "Добавить в Obsidian",

00:09:19я увижу всю статью целиком, включая изображения.

00:09:21Теперь нам нужно настроить одну вещь

00:09:24внутри Web Clipper,

00:09:25чтобы он автоматически сохранял данные

00:09:26прямо в папку "raw".

00:09:29Я не хочу делать это вручную.

00:09:30Просто перейдите в настройки вашего Web Clipper.

00:09:34Я просто кликнул правой кнопкой мыши.

00:09:35И здесь слева, где написано "Default",

00:09:38я создал свой новый шаблон,

00:09:39но вы можете оставить стандартный, если хотите,

00:09:42и найти пункты "Location" и "Note Location".

00:09:47Вам нужно изменить значение с "clippings" на "raw".

00:09:52Это гарантирует, что при использовании клипера

00:09:54данные будут сразу попадать в папку "raw".

00:09:56Так что теперь, с расширением Obsidian Web Clipper

00:09:59и плагином для работы с изображениями,

00:10:01мы можем превратить любую веб-страницу в интернете

00:10:04в Markdown-файл для нашей базы знаний (Wiki).

00:10:08Но это лишь один из каналов поступления данных.

00:10:10Это ручной способ.

00:10:11Мы также можем поручить Claude Code основную работу.

00:10:14Допустим, я хочу создать Wiki

00:10:16о навыках Claude Code.

00:10:17Я сказал Claude Code:

00:10:18«Давай создадим Wiki о навыках Claude Code.

00:10:20Я уже добавил информацию в папку "raw"» —

00:10:23то, что мы извлекли через Web Clipper.

00:10:25«Проведи собственное исследование и собери нужные»

00:10:27«MD-файлы в папку raw для генерации этой Wiki».

00:10:29И что же он сделает?

00:10:30Он выйдет в интернет, используя стандартный веб-поиск,

00:10:32и создаст собственную Wiki

00:10:36о навыках Claude Code.

00:10:37Вы видите, что эта папка "raw",

00:10:40весь этот конвейер — он больше для вас.

00:10:42Для случаев, когда вы сами хотите внести данные.

00:10:44Конечно, Claude Code тоже может это делать,

00:10:46но он достаточно умен, чтобы провести исследование,

00:10:49самостоятельно,

00:10:50понять, что важно, и сразу создать Wiki.

00:10:53Эта папка "raw" нужна скорее человеку,

00:10:55чтобы поддерживать определенный уровень порядка.

00:10:58И вот с чем вернулся Claude Code.

00:10:59Он создал Wiki по навыкам Claude Code.

00:11:02Мы видим ссылку на нее в главном индексе.

00:11:05Если я нажму на нее,

00:11:07то попаду в индекс навыков Claude Code.

00:11:10Сейчас там четыре статьи.

00:11:12Вот обзорная статья о навыках.

00:11:15Как видите, она ссылается как на внешние сайты, так и

00:11:18на другие статьи внутри нашего хранилища Obsidian.

00:11:21Нажимаю на "Экосистему навыков" — здесь еще данные.

00:11:25Нажимаю на "Лучшие навыки", и так далее.

00:11:27Существует четкий путь от одной статьи к другой,

00:11:30понятно, как они связаны,

00:11:32а значит, когда вы задаете Claude Code вопросы

00:11:34по этим статьям и темам,

00:11:35ему легко и дешево давать ответы,

00:11:39что подводит нас к очевидному вопросу.

00:11:41Нужен ли нам RAG вообще? Знаете,

00:11:43глядя на такой вариант с "Light RAG".

00:11:45Вы смотрели мои прошлые видео про Light RAG и RAG

00:11:48на чем угодно, и видя, как просто всё настроить в Obsidian,

00:11:51вы, вероятно, думаете:

00:11:52«Зачем мне вообще возиться с этими сложными»

00:11:55«системами?»

00:11:56И правда такова: если вы работаете в одиночку,

00:11:59соло-предприниматель или небольшая команда,

00:12:02у которой нет тысяч документов,

00:12:04то Obsidian, скорее всего, подходит вам больше.

00:12:08Он легкий, и настоящий RAG вам не нужен.

00:12:11Эти большие языковые модели,

00:12:12инструменты вроде Claude Code, вполне справятся

00:12:16с вашими задачами.

00:12:17Мы можем долго копаться в деталях

00:12:18различий между RAG в Obsidian и полноценным RAG.

00:12:21Но главное различие — это масштаб, верно?

00:12:24Пытаемся ли мы масштабироваться до миллионов документов?

00:12:27Потому что при определенном масштабе

00:12:29использовать полноценную RAG-систему

00:12:32будет дешевле и быстрее.

00:12:33Независимо от того, насколько хорошо Claude Code ориентируется

00:12:38в созданной вами сети MD-файлов.

00:12:40Но на этот вопрос не обязательно отвечать

00:12:42прямо сейчас.

00:12:44Почему бы просто не начать с чего-то вроде Obsidian?

00:12:47И если станет ясно,

00:12:48что ваши объемы выходят за рамки возможностей этой системы," —

00:12:51тогда просто переходите на RAG.

00:12:53Мне кажется, люди слишком зацикливаются на

00:12:55поиске ответа, когда нужно просто попробовать.

00:12:58Попытка использовать некое подобие RAG-системы,

00:13:01такой как Obsidian, ничего вам не стоит.

00:13:03А если не сработает — ну и ладно.

00:13:05Тогда используйте Light RAG.

00:13:06Люди любят посидеть и,

00:13:09как обычно бывает в комментариях, спорить об этом.

00:13:11Я думаю, в какой-то момент станет совершенно очевидно,

00:13:14когда пора переходить на настоящий RAG.

00:13:16Но прелесть в том, что

00:13:19большинству людей не нужен полноценный RAG.

00:13:21Просто не нужен, понимаете?

00:13:22Даже если это команда малого бизнеса.

00:13:24Так что наличие грамотно

00:13:27организованной базы знаний в Obsidian,

00:13:30на мой взгляд, станет огромным подспорьем для большинства.

00:13:33Надеюсь, этот разбор был вам полезен.

00:13:35Обязательно посмотрите пост Андре на эту тему.

00:13:37Там довольно много подробностей.

00:13:39Также загляните в бесплатную школу Chase AI.

00:13:41Ссылка в описании — там есть все

00:13:43промпты и текстовый гайд по реализации.

00:13:47Если вы запутались на каком-то этапе, и как всегда,

00:13:50обратите внимание на Chase AI Plus,

00:13:52если хотите получить доступ к мастер-классу.

00:13:54Пишите ваши мысли, и до встречи!

Key Takeaway

Создание легковесной базы знаний в Obsidian с использованием Claude Code для автоматической индексации и навигации позволяет заменить сложные RAG-системы для пользователей с объемом данных до нескольких тысяч документов.

Highlights

Система Obsidian RAG Андрея Карпати заменяет векторные базы данных и эмбеддинги простой структурой Markdown-файлов.
Использование Claude Code в сочетании с файлом Claude.md позволяет ИИ автоматически индексировать документы и создавать резюме.
Расширение Obsidian Web Clipper в паре с плагином Local Images Plus переносит веб-страницы в формат Markdown с сохранением локальных копий изображений.
Папка raw служит буфером для сырых данных, которые Claude Code затем преобразует в структурированную Вики во внутренней папке Wiki.
Метод эффективен для индивидуальных специалистов и команд с объемом документов менее нескольких тысяч единиц.
Для навигации по базе знаний используются стандартные Wiki-ссылки Obsidian, которые минимизируют затраты токенов при поиске информации ИИ-агентом.

Timeline

Концепция безвекторного RAG в Obsidian

Система обходится без векторных баз данных, эмбеддингов и сложных процессов извлечения.
Большие языковые модели эффективно обрабатывают огромные объемы документов через прямую файловую структуру.
Подход Карпати занимает нишу между хаотичными заметками и тяжеловесными корпоративными RAG-структурами.

Традиционные RAG-системы часто представляют собой «черный ящик», где трудно отследить процесс поиска. Использование Obsidian делает базу знаний прозрачной, позволяя человеку видеть распределение документов и связей. Этот метод практически бесплатен и идеально подходит для соло-предпринимателей.

Архитектура папок и логика индексации

Папка raw аккумулирует статьи, научные работы и PDF-файлы перед их обработкой.
Иерархия включает главный индексный файл и вложенные индексы для каждой тематической Вики.
Claude Code самостоятельно поддерживает актуальность резюме прочитанных документов в файле Claude.md.

Файловая структура создает четкий путь для поиска информации: от общего индекса к тематическим папкам. Это избавляет ИИ от необходимости совершать сотни вызовов инструментов для понимания контекста. Пользователь взаимодействует с системой через интерфейс Obsidian, сохраняя полный контроль над данными.

Техническая настройка и импорт данных

Создание структуры папок в хранилище (vault) автоматизируется через промпт в Claude Code.
Плагин Local Images Plus решает проблему потери визуального контента при импорте веб-страниц.
Настройка Note Location в Web Clipper на папку raw автоматизирует конвейер поступления информации.

Процесс начинается с назначения папки в качестве хранилища и создания файла Claude.md, содержащего правила навигации. Для ручного сбора данных используется расширение для Chrome, преобразующее сайты в Markdown. Важно активировать плагины сообщества для корректной работы с изображениями внутри десктопного приложения Obsidian.

Автоматизация исследований и границы масштабирования

Claude Code способен самостоятельно проводить веб-поиск и наполнять папку raw нужными файлами.
Переход на полноценный RAG целесообразен только при масштабировании до миллионов документов.
Для большинства малых бизнесов организованная сеть Markdown-файлов функционально избыточна по сравнению со сложными ИИ-архитектурами.

ИИ-агент может не только индексировать имеющееся, но и расширять базу знаний, находя связи между внешними ресурсами и внутренними заметками. Главное различие между этим методом и сложным RAG заключается в скорости и стоимости при экстремально больших объемах данных. Начинать рекомендуется с Obsidian, переходя к сложным системам только при явном исчерпании возможностей текущей структуры.

Community Posts

Write about this video