Я использовал Claude Code более 2000 часов — вот как я создаю на нем что угодно

CCole Medin
컴퓨터/소프트웨어자격증/평생교육AI/미래기술

Transcript

00:00:00Claude Code стал общедоступным 22 мая прошлого года вместе с релизом Claude 3.5 Sonnet.
00:00:06Но до этого была предварительная исследовательская версия, так что я пользуюсь этим инструментом
00:00:11уже чуть больше года, и я на самом деле подсчитал. Если сложить всё время,
00:00:15затраченное на промпты, проверку кода и мониторинг, то я использовал Claude Code уже более 2000
00:00:21часов. Так что да, мне есть чему вас научить. Именно этим я и хочу заняться в этом видео.
00:00:27Прямо сейчас я хочу поделиться с вами своими проверенными в боях стратегиями, которые превратят вас
00:00:31из обычного пользователя Claude Code в продвинутого «power user». Я объединил всё это в систему,
00:00:37которую называю фреймворком WISC. И вот в чём фишка: эти стратегии действительно работают. Я не один из тех
00:00:43создателей ИИ-контента, кто просто запрыгнул в хайп-поезд Claude Code пару месяцев назад. Как я уже сказал,
00:00:48я использую этот инструмент ежедневно больше года. Поэтому данные стратегии будут работать
00:00:54на любой кодовой базе, даже на огромных проектах с несколькими репозиториями. Я видел, как это
00:01:00применяется на корпоративном уровне, так что над чем бы вы ни работали — это для вас. Это также
00:01:05отлично подходит для любого ИИ-ассистента по кодингу. Я фокусируюсь на Claude Code просто потому, что сейчас он лучший.
00:01:10Я предполагаю, что у вас уже есть базовое понимание работы Claude Code, и теперь
00:01:15вы хотите выйти на новый уровень. Если вам нужны основы построения системы для ИИ-кодинга,
00:01:21я оставлю ссылку на соответствующее видео вот здесь. Все эти стратегии предназначены для случаев,
00:01:25когда мы работаем с реальными, запутанными кодовыми базами, потому что здесь важны стратегии
00:01:32управления контекстом. Это критично, так как «деградация контекста» — главная проблема ИИ-ассистентов
00:01:38на данный момент. Неважно, что у Claude Code теперь лимит в 1 миллион токенов, нам всё равно
00:01:43нужно относиться к контексту как к самому ценному ресурсу, который требует тщательной инженерии
00:01:49при работе с ИИ. Буквы W, I, S и C в названии фреймворка как раз обозначают стратегии,
00:01:56которые помогают в этом, и вы сможете сразу применить их в своих проектах.
00:02:00Сейчас я разложу всё по полочкам. Вы можете спросить:
00:02:05«Коул, почему мы так много внимания уделяем управлению контекстом? Ты использовал Claude Code 2000 часов,
00:02:11и это всё, на чём ты хочешь сосредоточиться?» И мой ответ — да. Я знаю, это звучит очень узко,
00:02:17но сейчас нам нужно сделать упор на борьбу с деградацией контекста. Я бы даже сказал,
00:02:23что в 80% случаев, когда ИИ-агент ошибается в вашем коде, это происходит из-за того, что вы
00:02:28плохо управляете контекстом. Поэтому я хочу начать именно с этой проблемы,
00:02:33а затем мы быстро перейдем к практике, разобрав каждую часть фреймворка WISC. Я начинаю с деградации контекста,
00:02:38чтобы вы поняли причину. Как только вы примените WISC,
00:02:45вы сразу увидите скачок надежности вашего ИИ-кодинга даже в самых запутанных
00:02:50проектах. Я постоянно подчеркиваю важность больших и сложных кодовых баз, потому что именно там
00:02:56деградация контекста становится серьезной проблемой. В индустрии уже проведено много исследований
00:03:02на эту тему, но моим любимым — самым практичным и популярным — является
00:03:07технический отчет Chroma о том, как увеличение входных токенов влияет на производительность LLM. Основная мысль
00:03:13заключается в следующем: то, что вы можете запихнуть определенное количество токенов в контекстное окно,
00:03:18еще не значит, что вы должны это делать. И да, к Claude Code с лимитом в 1 миллион токенов это тоже относится.
00:03:24Потому что большие языковые модели перегружаются информацией так же, как и люди. Это называется
00:03:30проблемой «иголки в стоге сена». Когда вам нужна конкретная деталь или,
00:03:35в случае с кодинг-агентами, конкретный файл, который он прочитал и должен вспомнить, он справится
00:03:41хорошо только в том случае, если контекстное окно не переполнено.
00:03:47Когда загружен огромный объем контекста, появляются так называемые
00:03:52«дистракторы» (отвлекающие факторы). Это фрагменты информации, которые похожи на то, что нужно
00:03:58вспомнить модели, но не совсем то. Мы часто видим это в ИИ-кодинге, особенно в больших
00:04:04проектах. Мы следуем одним и тем же паттернам во всем коде. У нас много
00:04:09сходств в реализации разных частей системы. И LLM может
00:04:14вытащить неверную информацию, будучи при этом абсолютно уверенной в своем исправлении. Уверен,
00:04:19вы постоянно с этим сталкиваетесь. Проблема «иголки в стоге сена» преследует
00:04:24ИИ-кодинг повсюду. В этом и суть деградации: чем больше окно, тем
00:04:30труднее модели извлечь именно то, что нужно для текущего шага работы.
00:04:36Давайте вернемся к схеме, и я объясню конкретнее. Все эти стратегии
00:04:42отвечают на вопрос: как сохранить контекстное окно максимально чистым,
00:04:48при этом дав агенту всю необходимую информацию? Это и есть контекстная инженерия.
00:04:53Я разберу каждую стратегию. У меня есть
00:04:57пример для каждой из них, который я покажу вживую на сложном коде. Все
00:05:02команды, правила и документация, которые я использую, лежат в папке, ссылку на которую
00:05:06я оставлю в описании. Вы сможете использовать эти стратегии концептуально, опираясь
00:05:12на примеры команд из папки .claude. Итак, перейдем к
00:05:17конкретным стратегиям. W — Write (Записывай), I — Isolate (Изолируй), S — Select (Выбирай) и C — Compress (Сжимай).
00:05:24Начнем с W — записи, или экстернализации памяти нашего агента.
00:05:30Мы хотим максимально фиксировать ключевые решения и то, над чем работал агент,
00:05:34чтобы в будущих сессиях быстрее вводить его в курс дела и тратить меньше
00:05:40токенов на то, чтобы он понял задачу. И первая стратегия
00:05:46здесь — использовать git log как долговременную память. Мне это очень нравится, потому что
00:05:52многие любят переусложнять и придумывать невероятные фреймворки памяти для агентов,
00:05:56хотя все и так уже используют Git и GitHub для контроля версий. Мы можем
00:06:01использовать инструмент, который у нас уже есть, чтобы обеспечить агента памятью. Пойдем
00:06:07в код, и я покажу, что имею в виду. В качестве примера
00:06:12я буду использовать новый Archon. Я пахал над ним последние несколько месяцев
00:06:18за кулисами. Это ваш командный центр ИИ, где можно создавать, управлять и выполнять длительные
00:06:23рабочие процессы ИИ-кодинга. Мы даже работаем над конструктором воркфлоу — это будет как
00:06:28n8n, но для программирования с ИИ. Мы можем запускать процессы, просматривать логи и мониторить их
00:06:33в «центре управления». Можем смотреть историю запусков. Вот,
00:06:39например, очень длинный воркфлоу, который я использую для валидации пул-реквестов. Как видите,
00:06:44в Archon (который скоро выйдет, кстати) очень много движущихся частей.
00:06:47Это очень сложная кодовая база. Поэтому
00:06:51она отлично подходит для демонстрации всех стратегий, о которых я расскажу.
00:06:57Что касается git как памяти, покажу пример
00:07:03однострочного вывода всех моих последних коммит-сообщений. Обратите внимание,
00:07:09что у нас есть стандартный способ написания этих сообщений. Есть мержи,
00:07:13но также есть реализации фич и фиксы. У меня всё стандартизировано,
00:07:19потому что так я могу полагаться на сообщения коммитов, чтобы рассказать агенту, над чем я работал недавно,
00:07:24ведь зачастую это определяет наши следующие шаги. А стандартизировано всё
00:07:29потому, что я использую специальную команду commit. Сделать git commit легко,
00:07:36но если мы хотим унифицировать сообщения и чтобы агент нам в этом помогал,
00:07:40наличие специальной команды дает огромную силу. Вот полную реализацию
00:07:46этого я сделал в одном контекстном окне с агентом. Я закончил работу и готов
00:07:51закоммитить изменения. Я просто ввожу /commit — и всё. Запускается команда,
00:07:55которая содержит правила документирования работы. А также
00:08:01информацию о том, что было сделано для улучшения правил или команд ИИ. Это команда из двух частей: «Что мы построили» и «Как мы улучшили ИИ-слой».
00:08:06Сейчас будет создан коммит, и я покажу, как он выглядит.
00:08:10Итак, глядя на сообщение коммита, мы видим, что были внесены улучшения в тесты
00:08:14CLI. Отличный префикс, а затем детали. Также, чтобы кодинг-агент
00:08:19знал, как его собственные правила и команды меняются со временем, мы включаем это в сообщение,
00:08:23когда находим возможность что-то улучшить, например, команду plan. Конечно,
00:08:29эта команда commit есть в ресурсах репозитория, которые я вам подготовил. Можете
00:08:33использовать её как основу, но я советую настроить формат коммитов
00:08:37под себя. Главное — стандартизация и детальность,
00:08:41чтобы использовать это как долговременную память. Вторая стратегия записи:
00:08:47всегда открывайте новое контекстное окно, когда начинаете писать код. Над чем бы
00:08:53я ни работал, мой воркфлоу такой: один диалог для планирования с агентом. Я создаю
00:08:57Markdown-файл со структурированным планом. А затем отправляю его как единственный контекст
00:09:03в новую сессию для реализации. Очень важно, чтобы в этом ТЗ был
00:09:08весь контекст, нужный агенту для написания и валидации кода. Например, в этом диалоге
00:09:14я занимаюсь только планированием. Сначала запускаю prime (об этом позже),
00:09:18загружаю контекст и создаю план специальной командой. Она тоже есть
00:09:24в ресурсах. По сути, она объясняет агенту, какую именно структуру
00:09:28мы хотим видеть в итоговом Markdown-документе. Так мы переносим данные из кратковременной памяти
00:09:33в один документ. На этом сессия заканчивается. Мы идем в абсолютно новое
00:09:38окно для реализации. Там я использую команду execute и
00:09:42указываю путь к структурированному плану. Никакого другого контекста, так как там уже
00:09:48есть всё необходимое. Это критически важно, потому что агент остается предельно сфокусированным.
00:09:53Исследования и обсуждения могут засорить контекст, если писать код в том же окне.
00:09:57Последняя W-стратегия для внешней памяти агента — файлы прогресса и логи решений.
00:10:03Вы часто видите это в сложных ИИ-системах, где есть файлы типа handoff.md или todo.md
00:10:08для связи между субагентами или даже просто между разными сессиями.
00:10:13Когда контекст заканчивается, полезно создать резюме проделанной работы.
00:10:17Так вы сможете начать чистую сессию, если заметили, что агент начал галлюцинировать
00:10:22из-за слишком длинного диалога. Конечно, в идеале лучше избегать длинных
00:10:27переписок, но иногда они необходимы. Например, в Archon я часто
00:10:33использую CLI браузерного агента Vercel для проведения сквозных (end-to-end) тестов.
00:10:38Агент проходит через разные сценарии и проверяет граничные случаи. Это съедает
00:10:44уйму контекста. Посмотрите вниз: я ввел /context, и мы уже на отметке 200 000 из
00:10:49нового лимита в 1 миллион. Лимит тает на глазах. Как только в окне оказывается пара сотен
00:10:56тысяч токенов, производительность агента начинает падать. Поэтому
00:11:01я просто запускаю /handoff. Эта команда создает саммари, которое можно перенести
00:11:05в другую сессию, чтобы продолжить работу. Но теперь у агента в окне не будут
00:11:11висеть сотни тысяч токенов логов вызовов инструментов. Команда handoff
00:11:16просто прописывает процесс: что именно включить в документ, чтобы у следующего
00:11:21агента было всё необходимое. На этом мы заканчиваем с разделом W. Каждая из
00:11:25этих стратегий важна для фиксации решений для будущих сессий.
00:11:31Я иду довольно быстро, так что пишите в комментариях, если хотите,
00:11:36чтобы я сделал отдельное видео по любой из этих тем — они того стоят.
00:11:40Теперь перейдем к I — Isolate (Изолируй) с помощью субагентов.
00:11:45Я обожаю использовать субагентов для любых исследований и делаю это почти каждую сессию.
00:11:52Главная цель — держать основной контекст в чистоте. Мы можем поручить субагентам
00:11:56провести исследования на десятки или даже сотни тысяч токенов в коде или в сети,
00:12:03а затем передать в основное окно Claude Code только краткое резюме.
00:12:10Вместо того чтобы грузить в основной контекст гору данных, мы получаем,
00:12:16скажем, всего 500 токенов. Мы по-прежнему имеем суть информации, но,
00:12:21согласно исследованиям Anthropic, использование субагентов для подготовки контекста
00:12:28дает 90,2% прироста эффективности по сравнению с тем, когда основной агент делает всё сам.
00:12:33Покажу быстрый пример. Обычно это происходит в начале
00:12:38диалога или перед созданием того самого плана, о котором я говорил. В процессе планирования
00:12:43я использую субагентов на полную катушку. Смотрите: я хочу добавить конструктор воркфлоу в Archon.
00:12:50Я прошу создать двух субагентов: один должен изучить кодовую базу и понять,
00:12:55как интегрировать этот конструктор, а второй — провести исследование в вебе на тему лучших практик.
00:13:01Например, если я хочу использовать React, какую библиотеку выбрать,
00:13:06и как вообще устроены конструкторы типа Dify или n8n? Я просто использую инструмент
00:13:12преобразования текста в речь. Отправляю промпт. Готово.
00:13:16Помимо изоляции, мы получаем скорость, так как субагенты работают параллельно.
00:13:21Затем они возвращаются с отчетом, а основной агент всё синтезирует и выдает итог.
00:13:26Вот они, оба субагента запущены в фоновом режиме. Мы можем заглянуть
00:13:31в логи каждого из них. В конце они представят финальный отчет.
00:13:36Итак, субагенты закончили. Вместо того чтобы забивать основное окно сотнями тысяч токенов
00:13:41(а именно столько они перелопатили в ходе исследования),
00:13:46мы использовали всего 44 000 токенов — только 4% окна. В этом мощь субагентов.
00:13:53Я не советую их для самой реализации кода, так как там нужен весь контекст действий.
00:13:57Но для исследований это незаменимо. Изоляция и субагенты крайне важны
00:14:04для планирования. Еще один способ их использования — паттерн «разведчик» (scout pattern).
00:14:09Мы засылаем разведчиков до того, как загрузить что-то в основной контекст. В коде
00:14:14или документации могут быть части, которые субагент должен изучить на предмет
00:14:21релевантности для основной сессии Claude Code. Он может заранее решить:
00:14:25«Да, это нужно загрузить для планирования» или «Нет, это не относится к делу». К примеру,
00:14:30в Archon есть несколько Markdown-файлов с глубоким разбором определенных частей системы.
00:14:36Нам не нужен этот контекст в общих правилах постоянно. Но иногда
00:14:41он может понадобиться — представьте, что это данные из Confluence или Google Drive.
00:14:45Возвращаемся к основному диалогу, и я говорю:
00:14:48«Запусти субагента для изучения папки .claude/docs. Есть ли там документация,
00:14:54которую стоит загрузить в основной контекст для планирования?»
00:14:59Я отправляю запрос, он принимает решение и подгружает нужное. Вот здесь
00:15:04запустился агент-исследователь. Он нашел документацию и рекомендовал один файл.
00:15:09Я согласился. Это очень важно для текущего плана. Итак, субагенты нужны
00:15:13не только для внешнего поиска, но и для фильтрации внутренней документации,
00:15:18которая критична для основного окна. Это и есть паттерн разведчика.
00:15:23С изоляцией закончили. Помните: активно используйте субагентов для исследований
00:15:28и планирования. Теперь переходим к S — Select (Выбирай).
00:15:34Загружайте контекст «точно вовремя», а не «на всякий случай».
00:15:40Я имею в виду: если вы не уверены на 100%, что информация важна агенту
00:15:46прямо сейчас, не грузите её. Для этого у нас есть послойный подход. Начинаем
00:15:51с глобальных правил (global rules). Это ограничения и конвенции, о которых
00:15:57агент должен знать всегда. Этот файл должен быть лаконичным,
00:16:02обычно от 500 до 700 строк. Многие советуют еще меньше. Там описана
00:16:08архитектура, команды, стратегии тестирования и логгирования. Вот мой пример из Archon — это база,
00:16:12которая нужна агенту постоянно. Затем идет второй слой —
00:16:18контекст по требованию (on-demand context). Это правила для конкретных частей кода.
00:16:23Допустим, мы работаем над фронтендом (что бывает не всегда) — тогда мы подгружаем
00:16:28глобальные правила фронтенда или правила для создания API-эндпоинтов.
00:16:33Мы добавляем это к глобальным правилам только под конкретные задачи,
00:16:38потому что не всегда работаем, например, над интерфейсом. Как пример —
00:16:43справочник по YAML-воркфлоу, который я достал через разведчика чуть раньше.
00:16:48Когда мы работаем над процессами — это важно. Но в глобальных правилах этому не место,
00:16:52так как большую часть времени в Archon мы не касаемся этой специфики.
00:16:57Это контекст по требованию. Третий слой — это навыки (skills).
00:17:05Это сейчас очень популярно в Claude Code и других инструментах. Тут есть
00:17:10этапы: агент изучает инструкции и возможности навыка, только когда понимает,
00:17:15что он ему нужен. Всё начинается с описания — это минимум токенов,
00:17:20загруженных вместе с глобальными правилами. Если агент решает использовать навык, он подгружает
00:17:25полный skill.md, который может ссылаться на скрипты или документы для
00:17:29более глубокого погружения. Пример — мой навык «браузерного агента».
00:17:35Я использую его для автоматизации браузера и того самого тестирования, что показывал.
00:17:40Он нужен мне каждый день. При запуске тестов я подгружаю
00:17:46этот набор инструкций, чтобы агент понимал, как управлять браузером. И наконец,
00:17:52четвертый слой — команды инициализации (prime commands). Всё предыдущее — это статика,
00:17:57которую мы обновляем время от времени. Но иногда агенту нужно изучить
00:18:02живую кодовую базу. Нам нужно, чтобы информация была актуальной,
00:18:07и мы готовы потратить токены субагентов на это. Команда prime
00:18:11исследует код в самом начале планирования, чтобы агент
00:18:16понимал текущее состояние проекта перед началом стройки. В моей
00:18:22папке с командами много разных prime-команд для разных частей системы,
00:18:27которые агенту нужно понять в зависимости от задачи. Вот моя общая команда prime:
00:18:32я прошу её изучить Archon на высоком уровне. Там пошагово прописано,
00:18:36что прочитать, включая git log (это важно для использования истории как памяти).
00:18:41Есть и специализированная команда — prime workflows, когда я точно знаю,
00:18:47что буду работать над движком воркфлоу в Archon. Похожая структура,
00:18:53но более узкая цель. Я использую это в начале диалога, чтобы агент
00:18:58быстро всё загрузил. Подтверждаю, что он всё понял, и перехожу к
00:19:03планированию. Краткий итог: глобальные правила загружены всегда.
00:19:09Контекст по требованию — когда работаем в конкретной зоне с отдельной документацией.
00:19:13Навыки — когда нужны функции вроде браузера для тестов.
00:19:18И команды prime — запускаем на старте для «прогрева» агента
00:19:22перед планированием. С разделом Select закончили.
00:19:28Переходим к C — Compress (Сжимай). Это самый короткий раздел,
00:19:34потому что вам не придется часто сжимать контекст, если вы правильно используете Write, Isolate и Select.
00:19:39Если мы держим контекст чистым, мы избегаем этой необходимости,
00:19:46и это хорошо — сжатия лучше по возможности избегать. Но если прижало,
00:19:52есть две стратегии: передача (handoff) и
00:19:56целевое уплотнение (focus compaction). Давайте глянем в Claude Code. Handoff мы
00:20:02уже обсуждали в разделе Write. Мы суммируем всё сделанное,
00:20:06чтобы передать это другому агенту или тому же после очистки памяти. Также есть
00:20:12встроенная команда /compact. Она суммирует диалог,
00:20:18стирает историю и ставит саммари в начало контекстного окна. Handoff
00:20:23сильнее, потому что вы сами определяете воркфлоу памяти. Но
00:20:28/compact тоже полезен, особенно тем, что в нем можно задать инструкции по сжатию.
00:20:34Когда мне позарез нужно сжать данные, я использую это. Например:
00:20:41«сфокусируйся на граничных случаях, которые мы только что проверили». И теперь,
00:20:48создавая саммари, он уделит больше внимания этой части кратковременной памяти.
00:20:53Я опечатался, но это не страшно. Он выполнит сжатие. Handoff и /compact
00:20:58взаимозаменяемы, но иногда я использую оба. Handoff особенно хорош,
00:21:03когда вы делали сжатие больше двух раз — диалог становится слишком тяжелым, пора
00:21:09начинать с чистого листа. Но один раз запустить /compact вполне нормально.
00:21:14Правда, после него я обычно прошу агента пересказать, что он помнит,
00:21:19чтобы убедиться: суть не потеряна. «Что ты помнишь?» —
00:21:24что-то в этом роде. В общем, это не идеальный вариант. Избегайте сжатия.
00:21:30Лучшая стратегия сжатия — это когда оно не требуется. Вот он —
00:21:36фреймворк WISC. Информации много, надеюсь, это было полезно. Пишите,
00:21:41о какой стратегии рассказать подробнее — по любой из них можно снять
00:21:46целое видео. Это и есть WISC. Надеюсь, он поможет вам выйти на
00:21:52новый уровень в Claude Code или любом другом ИИ-помощнике. Если видео
00:21:59было полезным и вы ждете больше контента по ИИ-кодингу и применению
00:22:04подобных фреймворков на практике, я буду благодарен за лайк и подписку. Увидимся
00:22:09в следующем видео! Стойте, есть еще кое-что важное, что нельзя пропустить.
00:22:142 апреля я проведу бесплатный воркшор по ИИ-трансформации в прямом эфире на канале
00:22:20вместе с Лиором Вайнштейном, основателем CTOX. Это событие большого масштаба.
00:22:27Лиор расскажет, как перестроить всю организацию под ИИ, а я научу вас
00:22:32мастерству методологии кодинга с ИИ для создания надежных систем с помощью агентов.
00:22:38Ссылка на страницу мероприятия будет в описании. Всё пройдет на YouTube,
00:22:42так что жмите на колокольчик, чтобы не пропустить уведомление. Жду вас там!

Key Takeaway

Для эффективного программирования с ИИ необходимо рассматривать контекстное окно как самый ценный ресурс и управлять им через систему внешнего планирования, изоляции исследований и строгого отбора загружаемых данных.

Highlights

Автор провел более 2000 часов в Claude Code и разработал авторский фреймворк WISC для работы с ИИ-агентами.

Главной проблемой современных ИИ-ассистентов является «деградация контекста», приводящая к 80% ошибок в коде.

Фреймворк WISC состоит из четырех стратегий: Write (Запись), Isolate (Изоляция), Select (Выбор) и Compress (Сжатие).

Использование Git-логов как долговременной памяти позволяет агенту быстрее понимать контекст прошлых изменений.

Применение паттерна «разведчика» (scout pattern) с субагентами повышает эффективность подготовки контекста на 90%.

Многоуровневая структура правил (глобальные, по требованию, навыки и инициализация) минимизирует лишние токены.

Сжатие контекста через команды /compact или handoff следует использовать только в крайних случаях.

Timeline

Введение и проблема деградации контекста

Автор делится своим опытом использования Claude Code на протяжении более чем 2000 часов в реальных проектах. Он вводит понятие фреймворка WISC, который помогает превратиться из обычного пользователя в продвинутого «power user». Основной акцент делается на борьбе с деградацией контекста, которая считается главной причиной ошибок ИИ-агентов. Автор подчеркивает, что его стратегии применимы к любой сложной кодовой базе и корпоративным проектам. Этот раздел задает фундамент для понимания того, почему управление токенами критически важно даже при лимите в 1 миллион.

Научное обоснование и проблема «иголки в стоге сена»

Спикер объясняет технические причины снижения производительности LLM при переполнении контекстного окна, ссылаясь на отчеты компании Chroma. Рассматривается феномен «иголки в стоге сена», когда модель не может найти нужную деталь среди избыточной информации. Появляются так называемые «дистракторы» — похожие, но неверные фрагменты кода, которые вводят ИИ в заблуждение. Автор утверждает, что чистый контекст является залогом точности и надежности работы агента. В завершение раздела анонсируется разбор четырех составляющих фреймворка WISC на живых примерах.

Стратегия W: Write (Записывай) и Git как память

Первый этап фреймворка посвящен экстернализации памяти агента через документирование решений. Автор демонстрирует использование Git-логов в качестве долговременной памяти, что позволяет избежать переусложненных систем хранения данных. На примере проекта Archon показана работа кастомной команды /commit, которая стандартизирует описания фич и изменений в логике ИИ. Это помогает новому агенту в будущих сессиях мгновенно войти в курс дела, просто прочитав историю коммитов. Такая дисциплина в записях критически важна для работы над долгосрочными и сложными задачами.

Планирование и файлы прогресса

Автор описывает жесткий воркфлоу: всегда разделять планирование и реализацию в разных контекстных окнах. Сначала создается структурированный Markdown-план, который затем передается в новую сессию как единственный источник истины. Для предотвращения потери фокуса в длинных диалогах используются файлы handoff.md и todo.md, служащие мостом между сессиями. Спикер демонстрирует команду /handoff, которая создает резюме работы, когда объем контекста достигает критических отметок. Это позволяет начать «чистую» сессию без багажа лишних логов, сохраняя при этом вектор движения проекта.

Стратегия I: Isolate (Изолируй) через субагентов

Раздел посвящен изоляции исследований с помощью параллельного запуска субагентов для очистки основного контекста. Спикер приводит статистику Anthropic, согласно которой такая подготовка данных повышает эффективность работы на 90,2%. Показан пример, где один субагент изучает код, а другой ищет лучшие практики в вебе, возвращая лишь краткий синтезированный отчет. Вводится паттерн «разведчика» (scout pattern), при котором ИИ сначала фильтрует внутреннюю документацию на релевантность. Это гарантирует, что в основной чат попадет только 4% действительно необходимой информации из огромного массива данных.

Стратегия S: Select (Выбирай) и послойный контекст

Стратегия Select предполагает загрузку контекста «точно вовремя» (just-in-time) с использованием четырехуровневой системы. Первый уровень — это лаконичные глобальные правила (global rules), описывающие архитектуру и стандарты проекта. Второй и третий уровни включают контекст по требованию и специфические навыки (skills), такие как управление браузером для тестов. Четвертый уровень — команды инициализации (prime commands), которые заставляют агента активно изучать текущее состояние кода перед планированием. Такой подход позволяет держать рабочее окно максимально легким и сфокусированным на конкретной задаче.

Стратегия C: Compress (Сжимай) и заключение

Заключительная стратегия касается сжатия контекста, которое автор рекомендует использовать только в случае крайней необходимости. Рассматриваются инструменты /compact и ручной handoff для уплотнения истории диалога при сохранении ключевых граничных случаев. Автор советует всегда проверять память агента после сжатия вопросом «Что ты помнишь?», чтобы убедиться в отсутствии потерь. В финале видео подчеркивается, что лучшая стратегия сжатия — это правильное управление контекстом, при котором оно вовсе не требуется. Спикер также анонсирует предстоящий воркшоп по ИИ-трансформации и приглашает зрителей к дальнейшему обучению.

Community Posts

View all posts