Я использовал Claude Code более 2000 часов — вот как я создаю на нем что угодно

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português 中文

컴퓨터/소프트웨어자격증/평생교육AI/미래기술

Transcript

00:00:00Claude Code стал общедоступным 22 мая прошлого года вместе с релизом Claude 3.5 Sonnet.

00:00:06Но до этого была предварительная исследовательская версия, так что я пользуюсь этим инструментом

00:00:11уже чуть больше года, и я на самом деле подсчитал. Если сложить всё время,

00:00:15затраченное на промпты, проверку кода и мониторинг, то я использовал Claude Code уже более 2000

00:00:21часов. Так что да, мне есть чему вас научить. Именно этим я и хочу заняться в этом видео.

00:00:27Прямо сейчас я хочу поделиться с вами своими проверенными в боях стратегиями, которые превратят вас

00:00:31из обычного пользователя Claude Code в продвинутого «power user». Я объединил всё это в систему,

00:00:37которую называю фреймворком WISC. И вот в чём фишка: эти стратегии действительно работают. Я не один из тех

00:00:43создателей ИИ-контента, кто просто запрыгнул в хайп-поезд Claude Code пару месяцев назад. Как я уже сказал,

00:00:48я использую этот инструмент ежедневно больше года. Поэтому данные стратегии будут работать

00:00:54на любой кодовой базе, даже на огромных проектах с несколькими репозиториями. Я видел, как это

00:01:00применяется на корпоративном уровне, так что над чем бы вы ни работали — это для вас. Это также

00:01:05отлично подходит для любого ИИ-ассистента по кодингу. Я фокусируюсь на Claude Code просто потому, что сейчас он лучший.

00:01:10Я предполагаю, что у вас уже есть базовое понимание работы Claude Code, и теперь

00:01:15вы хотите выйти на новый уровень. Если вам нужны основы построения системы для ИИ-кодинга,

00:01:21я оставлю ссылку на соответствующее видео вот здесь. Все эти стратегии предназначены для случаев,

00:01:25когда мы работаем с реальными, запутанными кодовыми базами, потому что здесь важны стратегии

00:01:32управления контекстом. Это критично, так как «деградация контекста» — главная проблема ИИ-ассистентов

00:01:38на данный момент. Неважно, что у Claude Code теперь лимит в 1 миллион токенов, нам всё равно

00:01:43нужно относиться к контексту как к самому ценному ресурсу, который требует тщательной инженерии

00:01:49при работе с ИИ. Буквы W, I, S и C в названии фреймворка как раз обозначают стратегии,

00:01:56которые помогают в этом, и вы сможете сразу применить их в своих проектах.

00:02:00Сейчас я разложу всё по полочкам. Вы можете спросить:

00:02:05«Коул, почему мы так много внимания уделяем управлению контекстом? Ты использовал Claude Code 2000 часов,

00:02:11и это всё, на чём ты хочешь сосредоточиться?» И мой ответ — да. Я знаю, это звучит очень узко,

00:02:17но сейчас нам нужно сделать упор на борьбу с деградацией контекста. Я бы даже сказал,

00:02:23что в 80% случаев, когда ИИ-агент ошибается в вашем коде, это происходит из-за того, что вы

00:02:28плохо управляете контекстом. Поэтому я хочу начать именно с этой проблемы,

00:02:33а затем мы быстро перейдем к практике, разобрав каждую часть фреймворка WISC. Я начинаю с деградации контекста,

00:02:38чтобы вы поняли причину. Как только вы примените WISC,

00:02:45вы сразу увидите скачок надежности вашего ИИ-кодинга даже в самых запутанных

00:02:50проектах. Я постоянно подчеркиваю важность больших и сложных кодовых баз, потому что именно там

00:02:56деградация контекста становится серьезной проблемой. В индустрии уже проведено много исследований

00:03:02на эту тему, но моим любимым — самым практичным и популярным — является

00:03:07технический отчет Chroma о том, как увеличение входных токенов влияет на производительность LLM. Основная мысль

00:03:13заключается в следующем: то, что вы можете запихнуть определенное количество токенов в контекстное окно,

00:03:18еще не значит, что вы должны это делать. И да, к Claude Code с лимитом в 1 миллион токенов это тоже относится.

00:03:24Потому что большие языковые модели перегружаются информацией так же, как и люди. Это называется

00:03:30проблемой «иголки в стоге сена». Когда вам нужна конкретная деталь или,

00:03:35в случае с кодинг-агентами, конкретный файл, который он прочитал и должен вспомнить, он справится

00:03:41хорошо только в том случае, если контекстное окно не переполнено.

00:03:47Когда загружен огромный объем контекста, появляются так называемые

00:03:52«дистракторы» (отвлекающие факторы). Это фрагменты информации, которые похожи на то, что нужно

00:03:58вспомнить модели, но не совсем то. Мы часто видим это в ИИ-кодинге, особенно в больших

00:04:04проектах. Мы следуем одним и тем же паттернам во всем коде. У нас много

00:04:09сходств в реализации разных частей системы. И LLM может

00:04:14вытащить неверную информацию, будучи при этом абсолютно уверенной в своем исправлении. Уверен,

00:04:19вы постоянно с этим сталкиваетесь. Проблема «иголки в стоге сена» преследует

00:04:24ИИ-кодинг повсюду. В этом и суть деградации: чем больше окно, тем

00:04:30труднее модели извлечь именно то, что нужно для текущего шага работы.

00:04:36Давайте вернемся к схеме, и я объясню конкретнее. Все эти стратегии

00:04:42отвечают на вопрос: как сохранить контекстное окно максимально чистым,

00:04:48при этом дав агенту всю необходимую информацию? Это и есть контекстная инженерия.

00:04:53Я разберу каждую стратегию. У меня есть

00:04:57пример для каждой из них, который я покажу вживую на сложном коде. Все

00:05:02команды, правила и документация, которые я использую, лежат в папке, ссылку на которую

00:05:06я оставлю в описании. Вы сможете использовать эти стратегии концептуально, опираясь

00:05:12на примеры команд из папки .claude. Итак, перейдем к

00:05:17конкретным стратегиям. W — Write (Записывай), I — Isolate (Изолируй), S — Select (Выбирай) и C — Compress (Сжимай).

00:05:24Начнем с W — записи, или экстернализации памяти нашего агента.

00:05:30Мы хотим максимально фиксировать ключевые решения и то, над чем работал агент,

00:05:34чтобы в будущих сессиях быстрее вводить его в курс дела и тратить меньше

00:05:40токенов на то, чтобы он понял задачу. И первая стратегия

00:05:46здесь — использовать git log как долговременную память. Мне это очень нравится, потому что

00:05:52многие любят переусложнять и придумывать невероятные фреймворки памяти для агентов,

00:05:56хотя все и так уже используют Git и GitHub для контроля версий. Мы можем

00:06:01использовать инструмент, который у нас уже есть, чтобы обеспечить агента памятью. Пойдем

00:06:07в код, и я покажу, что имею в виду. В качестве примера

00:06:12я буду использовать новый Archon. Я пахал над ним последние несколько месяцев

00:06:18за кулисами. Это ваш командный центр ИИ, где можно создавать, управлять и выполнять длительные

00:06:23рабочие процессы ИИ-кодинга. Мы даже работаем над конструктором воркфлоу — это будет как

00:06:28n8n, но для программирования с ИИ. Мы можем запускать процессы, просматривать логи и мониторить их

00:06:33в «центре управления». Можем смотреть историю запусков. Вот,

00:06:39например, очень длинный воркфлоу, который я использую для валидации пул-реквестов. Как видите,

00:06:44в Archon (который скоро выйдет, кстати) очень много движущихся частей.

00:06:47Это очень сложная кодовая база. Поэтому

00:06:51она отлично подходит для демонстрации всех стратегий, о которых я расскажу.

00:06:57Что касается git как памяти, покажу пример

00:07:03однострочного вывода всех моих последних коммит-сообщений. Обратите внимание,

00:07:09что у нас есть стандартный способ написания этих сообщений. Есть мержи,

00:07:13но также есть реализации фич и фиксы. У меня всё стандартизировано,

00:07:19потому что так я могу полагаться на сообщения коммитов, чтобы рассказать агенту, над чем я работал недавно,

00:07:24ведь зачастую это определяет наши следующие шаги. А стандартизировано всё

00:07:29потому, что я использую специальную команду commit. Сделать git commit легко,

00:07:36но если мы хотим унифицировать сообщения и чтобы агент нам в этом помогал,

00:07:40наличие специальной команды дает огромную силу. Вот полную реализацию

00:07:46этого я сделал в одном контекстном окне с агентом. Я закончил работу и готов

00:07:51закоммитить изменения. Я просто ввожу /commit — и всё. Запускается команда,

00:07:55которая содержит правила документирования работы. А также

00:08:01информацию о том, что было сделано для улучшения правил или команд ИИ. Это команда из двух частей: «Что мы построили» и «Как мы улучшили ИИ-слой».

00:08:06Сейчас будет создан коммит, и я покажу, как он выглядит.

00:08:10Итак, глядя на сообщение коммита, мы видим, что были внесены улучшения в тесты

00:08:14CLI. Отличный префикс, а затем детали. Также, чтобы кодинг-агент

00:08:19знал, как его собственные правила и команды меняются со временем, мы включаем это в сообщение,

00:08:23когда находим возможность что-то улучшить, например, команду plan. Конечно,

00:08:29эта команда commit есть в ресурсах репозитория, которые я вам подготовил. Можете

00:08:33использовать её как основу, но я советую настроить формат коммитов

00:08:37под себя. Главное — стандартизация и детальность,

00:08:41чтобы использовать это как долговременную память. Вторая стратегия записи:

00:08:47всегда открывайте новое контекстное окно, когда начинаете писать код. Над чем бы

00:08:53я ни работал, мой воркфлоу такой: один диалог для планирования с агентом. Я создаю

00:08:57Markdown-файл со структурированным планом. А затем отправляю его как единственный контекст

00:09:03в новую сессию для реализации. Очень важно, чтобы в этом ТЗ был

00:09:08весь контекст, нужный агенту для написания и валидации кода. Например, в этом диалоге

00:09:14я занимаюсь только планированием. Сначала запускаю prime (об этом позже),

00:09:18загружаю контекст и создаю план специальной командой. Она тоже есть

00:09:24в ресурсах. По сути, она объясняет агенту, какую именно структуру

00:09:28мы хотим видеть в итоговом Markdown-документе. Так мы переносим данные из кратковременной памяти

00:09:33в один документ. На этом сессия заканчивается. Мы идем в абсолютно новое

00:09:38окно для реализации. Там я использую команду execute и

00:09:42указываю путь к структурированному плану. Никакого другого контекста, так как там уже

00:09:48есть всё необходимое. Это критически важно, потому что агент остается предельно сфокусированным.

00:09:53Исследования и обсуждения могут засорить контекст, если писать код в том же окне.

00:09:57Последняя W-стратегия для внешней памяти агента — файлы прогресса и логи решений.

00:10:03Вы часто видите это в сложных ИИ-системах, где есть файлы типа handoff.md или todo.md

00:10:08для связи между субагентами или даже просто между разными сессиями.

00:10:13Когда контекст заканчивается, полезно создать резюме проделанной работы.

00:10:17Так вы сможете начать чистую сессию, если заметили, что агент начал галлюцинировать

00:10:22из-за слишком длинного диалога. Конечно, в идеале лучше избегать длинных

00:10:27переписок, но иногда они необходимы. Например, в Archon я часто

00:10:33использую CLI браузерного агента Vercel для проведения сквозных (end-to-end) тестов.

00:10:38Агент проходит через разные сценарии и проверяет граничные случаи. Это съедает

00:10:44уйму контекста. Посмотрите вниз: я ввел /context, и мы уже на отметке 200 000 из

00:10:49нового лимита в 1 миллион. Лимит тает на глазах. Как только в окне оказывается пара сотен

00:10:56тысяч токенов, производительность агента начинает падать. Поэтому

00:11:01я просто запускаю /handoff. Эта команда создает саммари, которое можно перенести

00:11:05в другую сессию, чтобы продолжить работу. Но теперь у агента в окне не будут

00:11:11висеть сотни тысяч токенов логов вызовов инструментов. Команда handoff

00:11:16просто прописывает процесс: что именно включить в документ, чтобы у следующего

00:11:21агента было всё необходимое. На этом мы заканчиваем с разделом W. Каждая из

00:11:25этих стратегий важна для фиксации решений для будущих сессий.

00:11:31Я иду довольно быстро, так что пишите в комментариях, если хотите,

00:11:36чтобы я сделал отдельное видео по любой из этих тем — они того стоят.

00:11:40Теперь перейдем к I — Isolate (Изолируй) с помощью субагентов.

00:11:45Я обожаю использовать субагентов для любых исследований и делаю это почти каждую сессию.

00:11:52Главная цель — держать основной контекст в чистоте. Мы можем поручить субагентам

00:11:56провести исследования на десятки или даже сотни тысяч токенов в коде или в сети,

00:12:03а затем передать в основное окно Claude Code только краткое резюме.

00:12:10Вместо того чтобы грузить в основной контекст гору данных, мы получаем,

00:12:16скажем, всего 500 токенов. Мы по-прежнему имеем суть информации, но,

00:12:21согласно исследованиям Anthropic, использование субагентов для подготовки контекста

00:12:28дает 90,2% прироста эффективности по сравнению с тем, когда основной агент делает всё сам.

00:12:33Покажу быстрый пример. Обычно это происходит в начале

00:12:38диалога или перед созданием того самого плана, о котором я говорил. В процессе планирования

00:12:43я использую субагентов на полную катушку. Смотрите: я хочу добавить конструктор воркфлоу в Archon.

00:12:50Я прошу создать двух субагентов: один должен изучить кодовую базу и понять,

00:12:55как интегрировать этот конструктор, а второй — провести исследование в вебе на тему лучших практик.

00:13:01Например, если я хочу использовать React, какую библиотеку выбрать,

00:13:06и как вообще устроены конструкторы типа Dify или n8n? Я просто использую инструмент

00:13:12преобразования текста в речь. Отправляю промпт. Готово.

00:13:16Помимо изоляции, мы получаем скорость, так как субагенты работают параллельно.

00:13:21Затем они возвращаются с отчетом, а основной агент всё синтезирует и выдает итог.

00:13:26Вот они, оба субагента запущены в фоновом режиме. Мы можем заглянуть

00:13:31в логи каждого из них. В конце они представят финальный отчет.

00:13:36Итак, субагенты закончили. Вместо того чтобы забивать основное окно сотнями тысяч токенов

00:13:41(а именно столько они перелопатили в ходе исследования),

00:13:46мы использовали всего 44 000 токенов — только 4% окна. В этом мощь субагентов.

00:13:53Я не советую их для самой реализации кода, так как там нужен весь контекст действий.

00:13:57Но для исследований это незаменимо. Изоляция и субагенты крайне важны

00:14:04для планирования. Еще один способ их использования — паттерн «разведчик» (scout pattern).

00:14:09Мы засылаем разведчиков до того, как загрузить что-то в основной контекст. В коде

00:14:14или документации могут быть части, которые субагент должен изучить на предмет

00:14:21релевантности для основной сессии Claude Code. Он может заранее решить:

00:14:25«Да, это нужно загрузить для планирования» или «Нет, это не относится к делу». К примеру,

00:14:30в Archon есть несколько Markdown-файлов с глубоким разбором определенных частей системы.

00:14:36Нам не нужен этот контекст в общих правилах постоянно. Но иногда

00:14:41он может понадобиться — представьте, что это данные из Confluence или Google Drive.

00:14:45Возвращаемся к основному диалогу, и я говорю:

00:14:48«Запусти субагента для изучения папки .claude/docs. Есть ли там документация,

00:14:54которую стоит загрузить в основной контекст для планирования?»

00:14:59Я отправляю запрос, он принимает решение и подгружает нужное. Вот здесь

00:15:04запустился агент-исследователь. Он нашел документацию и рекомендовал один файл.

00:15:09Я согласился. Это очень важно для текущего плана. Итак, субагенты нужны

00:15:13не только для внешнего поиска, но и для фильтрации внутренней документации,

00:15:18которая критична для основного окна. Это и есть паттерн разведчика.

00:15:23С изоляцией закончили. Помните: активно используйте субагентов для исследований

00:15:28и планирования. Теперь переходим к S — Select (Выбирай).

00:15:34Загружайте контекст «точно вовремя», а не «на всякий случай».

00:15:40Я имею в виду: если вы не уверены на 100%, что информация важна агенту

00:15:46прямо сейчас, не грузите её. Для этого у нас есть послойный подход. Начинаем

00:15:51с глобальных правил (global rules). Это ограничения и конвенции, о которых

00:15:57агент должен знать всегда. Этот файл должен быть лаконичным,

00:16:02обычно от 500 до 700 строк. Многие советуют еще меньше. Там описана

00:16:08архитектура, команды, стратегии тестирования и логгирования. Вот мой пример из Archon — это база,

00:16:12которая нужна агенту постоянно. Затем идет второй слой —

00:16:18контекст по требованию (on-demand context). Это правила для конкретных частей кода.

00:16:23Допустим, мы работаем над фронтендом (что бывает не всегда) — тогда мы подгружаем

00:16:28глобальные правила фронтенда или правила для создания API-эндпоинтов.

00:16:33Мы добавляем это к глобальным правилам только под конкретные задачи,

00:16:38потому что не всегда работаем, например, над интерфейсом. Как пример —

00:16:43справочник по YAML-воркфлоу, который я достал через разведчика чуть раньше.

00:16:48Когда мы работаем над процессами — это важно. Но в глобальных правилах этому не место,

00:16:52так как большую часть времени в Archon мы не касаемся этой специфики.

00:16:57Это контекст по требованию. Третий слой — это навыки (skills).

00:17:05Это сейчас очень популярно в Claude Code и других инструментах. Тут есть

00:17:10этапы: агент изучает инструкции и возможности навыка, только когда понимает,

00:17:15что он ему нужен. Всё начинается с описания — это минимум токенов,

00:17:20загруженных вместе с глобальными правилами. Если агент решает использовать навык, он подгружает

00:17:25полный skill.md, который может ссылаться на скрипты или документы для

00:17:29более глубокого погружения. Пример — мой навык «браузерного агента».

00:17:35Я использую его для автоматизации браузера и того самого тестирования, что показывал.

00:17:40Он нужен мне каждый день. При запуске тестов я подгружаю

00:17:46этот набор инструкций, чтобы агент понимал, как управлять браузером. И наконец,

00:17:52четвертый слой — команды инициализации (prime commands). Всё предыдущее — это статика,

00:17:57которую мы обновляем время от времени. Но иногда агенту нужно изучить

00:18:02живую кодовую базу. Нам нужно, чтобы информация была актуальной,

00:18:07и мы готовы потратить токены субагентов на это. Команда prime

00:18:11исследует код в самом начале планирования, чтобы агент

00:18:16понимал текущее состояние проекта перед началом стройки. В моей

00:18:22папке с командами много разных prime-команд для разных частей системы,

00:18:27которые агенту нужно понять в зависимости от задачи. Вот моя общая команда prime:

00:18:32я прошу её изучить Archon на высоком уровне. Там пошагово прописано,

00:18:36что прочитать, включая git log (это важно для использования истории как памяти).

00:18:41Есть и специализированная команда — prime workflows, когда я точно знаю,

00:18:47что буду работать над движком воркфлоу в Archon. Похожая структура,

00:18:53но более узкая цель. Я использую это в начале диалога, чтобы агент

00:18:58быстро всё загрузил. Подтверждаю, что он всё понял, и перехожу к

00:19:03планированию. Краткий итог: глобальные правила загружены всегда.

00:19:09Контекст по требованию — когда работаем в конкретной зоне с отдельной документацией.

00:19:13Навыки — когда нужны функции вроде браузера для тестов.

00:19:18И команды prime — запускаем на старте для «прогрева» агента

00:19:22перед планированием. С разделом Select закончили.

00:19:28Переходим к C — Compress (Сжимай). Это самый короткий раздел,

00:19:34потому что вам не придется часто сжимать контекст, если вы правильно используете Write, Isolate и Select.

00:19:39Если мы держим контекст чистым, мы избегаем этой необходимости,

00:19:46и это хорошо — сжатия лучше по возможности избегать. Но если прижало,

00:19:52есть две стратегии: передача (handoff) и

00:19:56целевое уплотнение (focus compaction). Давайте глянем в Claude Code. Handoff мы

00:20:02уже обсуждали в разделе Write. Мы суммируем всё сделанное,

00:20:06чтобы передать это другому агенту или тому же после очистки памяти. Также есть

00:20:12встроенная команда /compact. Она суммирует диалог,

00:20:18стирает историю и ставит саммари в начало контекстного окна. Handoff

00:20:23сильнее, потому что вы сами определяете воркфлоу памяти. Но

00:20:28/compact тоже полезен, особенно тем, что в нем можно задать инструкции по сжатию.

00:20:34Когда мне позарез нужно сжать данные, я использую это. Например:

00:20:41«сфокусируйся на граничных случаях, которые мы только что проверили». И теперь,

00:20:48создавая саммари, он уделит больше внимания этой части кратковременной памяти.

00:20:53Я опечатался, но это не страшно. Он выполнит сжатие. Handoff и /compact

00:20:58взаимозаменяемы, но иногда я использую оба. Handoff особенно хорош,

00:21:03когда вы делали сжатие больше двух раз — диалог становится слишком тяжелым, пора

00:21:09начинать с чистого листа. Но один раз запустить /compact вполне нормально.

00:21:14Правда, после него я обычно прошу агента пересказать, что он помнит,

00:21:19чтобы убедиться: суть не потеряна. «Что ты помнишь?» —

00:21:24что-то в этом роде. В общем, это не идеальный вариант. Избегайте сжатия.

00:21:30Лучшая стратегия сжатия — это когда оно не требуется. Вот он —

00:21:36фреймворк WISC. Информации много, надеюсь, это было полезно. Пишите,

00:21:41о какой стратегии рассказать подробнее — по любой из них можно снять

00:21:46целое видео. Это и есть WISC. Надеюсь, он поможет вам выйти на

00:21:52новый уровень в Claude Code или любом другом ИИ-помощнике. Если видео

00:21:59было полезным и вы ждете больше контента по ИИ-кодингу и применению

00:22:04подобных фреймворков на практике, я буду благодарен за лайк и подписку. Увидимся

00:22:09в следующем видео! Стойте, есть еще кое-что важное, что нельзя пропустить.

00:22:142 апреля я проведу бесплатный воркшор по ИИ-трансформации в прямом эфире на канале

00:22:20вместе с Лиором Вайнштейном, основателем CTOX. Это событие большого масштаба.

00:22:27Лиор расскажет, как перестроить всю организацию под ИИ, а я научу вас

00:22:32мастерству методологии кодинга с ИИ для создания надежных систем с помощью агентов.

00:22:38Ссылка на страницу мероприятия будет в описании. Всё пройдет на YouTube,

00:22:42так что жмите на колокольчик, чтобы не пропустить уведомление. Жду вас там!

Key Takeaway

Для эффективного программирования с ИИ необходимо рассматривать контекстное окно как самый ценный ресурс и управлять им через систему внешнего планирования, изоляции исследований и строгого отбора загружаемых данных.

Highlights

Автор провел более 2000 часов в Claude Code и разработал авторский фреймворк WISC для работы с ИИ-агентами.

Главной проблемой современных ИИ-ассистентов является «деградация контекста», приводящая к 80% ошибок в коде.

Фреймворк WISC состоит из четырех стратегий: Write (Запись), Isolate (Изоляция), Select (Выбор) и Compress (Сжатие).

Использование Git-логов как долговременной памяти позволяет агенту быстрее понимать контекст прошлых изменений.

Применение паттерна «разведчика» (scout pattern) с субагентами повышает эффективность подготовки контекста на 90%.

Многоуровневая структура правил (глобальные, по требованию, навыки и инициализация) минимизирует лишние токены.

Сжатие контекста через команды /compact или handoff следует использовать только в крайних случаях.

Timeline

Введение и проблема деградации контекста

Автор делится своим опытом использования Claude Code на протяжении более чем 2000 часов в реальных проектах. Он вводит понятие фреймворка WISC, который помогает превратиться из обычного пользователя в продвинутого «power user». Основной акцент делается на борьбе с деградацией контекста, которая считается главной причиной ошибок ИИ-агентов. Автор подчеркивает, что его стратегии применимы к любой сложной кодовой базе и корпоративным проектам. Этот раздел задает фундамент для понимания того, почему управление токенами критически важно даже при лимите в 1 миллион.

Научное обоснование и проблема «иголки в стоге сена»

Спикер объясняет технические причины снижения производительности LLM при переполнении контекстного окна, ссылаясь на отчеты компании Chroma. Рассматривается феномен «иголки в стоге сена», когда модель не может найти нужную деталь среди избыточной информации. Появляются так называемые «дистракторы» — похожие, но неверные фрагменты кода, которые вводят ИИ в заблуждение. Автор утверждает, что чистый контекст является залогом точности и надежности работы агента. В завершение раздела анонсируется разбор четырех составляющих фреймворка WISC на живых примерах.

Стратегия W: Write (Записывай) и Git как память

Первый этап фреймворка посвящен экстернализации памяти агента через документирование решений. Автор демонстрирует использование Git-логов в качестве долговременной памяти, что позволяет избежать переусложненных систем хранения данных. На примере проекта Archon показана работа кастомной команды /commit, которая стандартизирует описания фич и изменений в логике ИИ. Это помогает новому агенту в будущих сессиях мгновенно войти в курс дела, просто прочитав историю коммитов. Такая дисциплина в записях критически важна для работы над долгосрочными и сложными задачами.

Планирование и файлы прогресса

Автор описывает жесткий воркфлоу: всегда разделять планирование и реализацию в разных контекстных окнах. Сначала создается структурированный Markdown-план, который затем передается в новую сессию как единственный источник истины. Для предотвращения потери фокуса в длинных диалогах используются файлы handoff.md и todo.md, служащие мостом между сессиями. Спикер демонстрирует команду /handoff, которая создает резюме работы, когда объем контекста достигает критических отметок. Это позволяет начать «чистую» сессию без багажа лишних логов, сохраняя при этом вектор движения проекта.

Стратегия I: Isolate (Изолируй) через субагентов

Раздел посвящен изоляции исследований с помощью параллельного запуска субагентов для очистки основного контекста. Спикер приводит статистику Anthropic, согласно которой такая подготовка данных повышает эффективность работы на 90,2%. Показан пример, где один субагент изучает код, а другой ищет лучшие практики в вебе, возвращая лишь краткий синтезированный отчет. Вводится паттерн «разведчика» (scout pattern), при котором ИИ сначала фильтрует внутреннюю документацию на релевантность. Это гарантирует, что в основной чат попадет только 4% действительно необходимой информации из огромного массива данных.

Стратегия S: Select (Выбирай) и послойный контекст

Стратегия Select предполагает загрузку контекста «точно вовремя» (just-in-time) с использованием четырехуровневой системы. Первый уровень — это лаконичные глобальные правила (global rules), описывающие архитектуру и стандарты проекта. Второй и третий уровни включают контекст по требованию и специфические навыки (skills), такие как управление браузером для тестов. Четвертый уровень — команды инициализации (prime commands), которые заставляют агента активно изучать текущее состояние кода перед планированием. Такой подход позволяет держать рабочее окно максимально легким и сфокусированным на конкретной задаче.

Стратегия C: Compress (Сжимай) и заключение

Заключительная стратегия касается сжатия контекста, которое автор рекомендует использовать только в случае крайней необходимости. Рассматриваются инструменты /compact и ручной handoff для уплотнения истории диалога при сохранении ключевых граничных случаев. Автор советует всегда проверять память агента после сжатия вопросом «Что ты помнишь?», чтобы убедиться в отсутствии потерь. В финале видео подчеркивается, что лучшая стратегия сжатия — это правильное управление контекстом, при котором оно вовсе не требуется. Спикер также анонсирует предстоящий воркшоп по ИИ-трансформации и приглашает зрителей к дальнейшему обучению.

Community Posts

Практическое руководство по Claude Code: стратегия WISC для поддержания интеллекта ИИ-агента в «legacy-аду»

makedream26일 전6160

Write about this video