Log in to leave a comment
No posts yet
Самое пугающее в начале работы с агентным программированием — это не производительность, а выписка по кредитной карте в следующем месяце. Двойные агенты, которых мы видим в роликах, выглядят фантастически, но бездумное использование API быстро приведет к финансовому взрыву. В 2026 году стоимость входных токенов Claude 4.6 Opus составляет 3.00). Стоимость вывода и вовсе взлетает до $25.00. В легаси-проектах объемом более 100 тысяч токенов каждый цикл цикла обходится в цену чашки кофе.
Чтобы контролировать расходы, не стоит зацикливаться только на Opus — используйте метод распределения слотов. Назначайте Opus только на проектирование и принятие архитектурных решений (это около 20% всей работы), а остальные 80% простой реализации доверяйте Sonnet.
--model opus только в сессиях со сложной запутанной логикой. Заведите привычку каждое утро понедельника проверять отчеты API, чтобы убедиться, что расходы соответствуют прогнозу.70% токенов, используемых агентом, фактически тратятся на поиск ненужных файлов и навигацию по директориям. Когда контекст превышает 100 тысяч токенов, у LLM наблюдается эффект "обрыва производительности" — резкая потеря концентрации. Загружать весь исходный код целиком — это кратчайший путь к потере денег и ухудшению результата. Внутренние тесты Anthropic показывают, что при передаче сжатого контекста качество рассуждений сохраняется, а затраты на ввод сокращаются более чем на 50%.
Создайте ARCH.md — специальную спецификацию для ИИ, которая послужит картой для агента.
tree -L 3 -I 'node_modules|dist|.git' > tree.md. Затем используйте инструменты вроде Repomix, чтобы создать карту сигнатур, оставив только определения функций и интерфейсов без реализации самой логики. Наконец, четко пропишите ассеты, такие как .svg и .json, в файле .claudeignore, чтобы убрать их из поля зрения агента.Суть системы с двумя агентами заключается в создании предохранителя путем разделения ролей на проектировщика (Advisor) и исполнителя (Executor). Если просто попросить "проверь код", вы получите формальный ответ вроде "выглядит чисто". Как старший инженер, вы должны принудительно заставить Advisor играть роль вредного критика. Правильное выполнение этого этапа позволяет значительно сократить время на исправление багов, которое раньше занимало более 5 часов в неделю.
Прежде чем исполнительная модель прикоснется к коду, создайте механизм критического обзора со стороны Opus.
Если выстроить Advisor и Executor в одну очередь, при каждой проверке будет возникать время ожидания. Для масштабного рефакторинга, затрагивающего сотни файлов, этот метод слишком медленный. При миграции библиотек объемом более 50 тысяч строк требуется оркестровка — разделение задач на части и их параллельный запуск.
Параллельный процесс для ускорения работы строится следующим образом:
git worktree add. В каждом рабочем дереве (worktree) запустите отдельную сессию Claude Code для одновременного рефакторинга разных модулей. В конце объедините их в основную ветку, используя инструменты вроде Clash для разрешения конфликтов между рабочими деревьями.По мере накопления кода, написанного ИИ, может возникнуть момент, когда общая структура превращается в хаос — так называемый технический долг. Агент может блестяще исправить один файл, но он не несет ответственности за направление развития всей системы. В 2026 году настоящая работа старшего инженера — это не написание кода вручную, а управление согласованностью результатов, созданных агентами.
Каждую пятницу перед уходом с работы проводите ритуал "аудита архитектуры".