Легион из 16 агентов Claude за 20 000 долларов: реальность автономной разработки C-компилятора

Парадигма программной инженерии меняется. Проект, реализованный исследователем Anthropic Николасом Карлини (Nicholas Carlini), — это не просто уровень «попросить ИИ написать код». Мобилизовав 16 экземпляров Claude Opus 4.6, он с нуля создал C-компилятор на базе Rust при минимальном участии человека.

Результат состоит из 100 000 строк кода, успешно собирает ядро Linux 6.9 и запускает классическую игру Doom. Однако важнее внешнего блеска — это пределы и возможности агентных рабочих процессов (agentic workflows), обнаруженные в процессе вложения 20 000 долларов (около 27 млн вон) в затраты на API. Мы проанализируем инженерную сущность того, как системно управлять ИИ и организовывать их совместную работу, выходя за рамки простого написания промптов.

Цикл RALF: архитектура, блокирующая загрязнение памяти ИИ

В сложном системном программировании одиночный агент быстро упирается в лимиты контекстного окна. Это происходит потому, что со временем записи прошлых диалогов начинают искажать текущие суждения, вызывая галлюцинации. Для решения этой проблемы Карлини внедрил цикл RALF (Refresh, Act, Learn, Feedback) вместе с 16 независимыми Docker-контейнерами.

Refresh: В начале сессии очищаются ненужные прошлые воспоминания. Вместо этого вводится только «брифинг-пакет», содержащий текущие вехи (milestones) и записи об ошибках, чтобы поддерживать концентрацию.
Act: Без команд человека агент самостоятельно определяет приоритеты и запускает редакторы или инструменты сборки.
Learn: Агент самообучается на ошибках через удобные для парсинга (Grep-friendly) логи тестов.
Feedback: Результаты работы и инструкции для следующего исполнителя записываются в README.md и пушатся в Git для синхронизации знаний.

Протокол текстовой блокировки для предотвращения дублирования задач

Самый большой риск при одновременном участии 16 агентов — растрата ресурсов. Если два агента попытаются исправить один и тот же баг, это приведет не только к конфликтам кода, но и к двойным счетам за API. Вместо сложной отдельной базы данных Карлини реализовал легковесный механизм блокировки (Locking) с использованием текстовых флагов внутри Git-репозитория.

Перед началом конкретной задачи агент создает в директории current_tasks/ файл с названием, идентичным названию задачи. Благодаря атомарности коммитов в Git, попытка другого агента запушить файл с тем же именем отклоняется. Эта простая система в корне пресекла состояние гонки (Race Condition) между агентами.

Стратегия Оракула: проверяйте, а не гадайте

Изюминкой проекта стало использование существующего инструмента GCC в качестве Оракула (Oracle). Это стратегия принудительного получения правильного ответа системным путем, а не гадание ИИ. Когда возникала ошибка при сборке огромного ядра Linux, Карлини автоматизировал алгоритм бинарного поиска (Binary Search).

Половина файлов ядра собирается с помощью GCC, другая половина — с помощью Claude.
Сужая область возникновения ошибки наполовину, система находит одну-единственную проблемную строку среди тысяч файлов.
Этот метод повысил эффективность отладки примерно на 50% и физически заблокировал возможность галлюцинаций ИИ.

Технические ограничения: стена оптимизации, которую ИИ не смог преодолеть

Несмотря на впечатляющие достижения, производительность созданного компилятора не достигла даже самого низкого уровня оптимизации GCC (-O0). Легион агентов Claude проявил слабость в следующих высокоуровневых инженерных областях:

Дефекты управления памятью: Вместо оптимизации модели владения (ownership) был выбран неэффективный метод копирования всех данных в отдельные буферы.
Недостаток понимания аппаратного обеспечения: Агенты не смогли преодолеть строгие ограничения памяти (32 КБ) в 16-битном реальном режиме x86, поэтому в этот участок пришлось вмешиваться человеку или заимствовать код из GCC.
Отсутствие реализации алгоритмов: ИИ не смог самостоятельно провести математический анализ для распределения регистров, ограничившись лишь буквальным переводом инструкций.

Чек-лист для принятия решений о внедрении корпоративных агентов

С точки зрения инженерного менеджера, 20 000 долларов — это совсем не дорого. Задача, на которую команде из 5 профессионалов потребовалось бы более 3 месяцев, была завершена всего за 2 недели. Это доказывает рентабельность более чем в 10 раз по сравнению с традиционными затратами на персонал. Компании, желающие внедрить эту модель, должны следовать следующему дереву принятия решений.

Критерии оценки внедрения агентного рабочего процесса

Вопрос	Да	Нет
Можно ли объективно проверить результат с помощью тестов?	Перейти к следующему шагу	Не подходит для внедрения (риск галлюцинаций)
Существует ли сопоставимый существующий инструмент (Оракул)?	Принять стратегию Оракула	Требуется постоянный мониторинг человеком
Можно ли разделить задачу на 100 и более единиц?	Использовать параллельных агентов	Рекомендуется одиночный агент

Необходимые элементы для построения

Grep-friendly обвязка: Спроектируйте структуру логов так, чтобы агент мог за 1 секунду определить успех или неудачу.
Автоматизация записи состояния: Перед завершением работы агента обязательно заставляйте его фиксировать прогресс в progress.json или аналогичном файле.
Человеческие «гардрайлы» (Guardrails): Изолируйте чувствительный код, связанный с безопасностью или аутентификацией, и обязательно подвергайте его проверке человеком.

От кодера к архитектору: трансформация роли инженера

Эксперимент Anthropic означает, что роль инженера сместилась от автора кода к проектировщику и аудитору систем. Теперь критически важным навыком является не умение самостоятельно писать алгоритмы, а способность проектировать логические ограничения и проверочные обвязки, чтобы легион ИИ-агентов не сошел с дистанции.

Затраты в 20 000 долларов — это не просто расходы, а веха, показывающая верхний предел автоматизации, которого может достичь ИИ при поддержке тонкого человеческого проектирования. Теперь компаниям следует сосредоточиться не только на автономности ИИ, но и на системном подходе к стратегическому управлению со стороны человека.

Легион из 16 агентов Claude за 20 000 долларов: реальность автономной разработки C-компилятора

Цикл RALF: архитектура, блокирующая загрязнение памяти ИИ

Refresh: В начале сессии очищаются ненужные прошлые воспоминания. Вместо этого вводится только «брифинг-пакет», содержащий текущие вехи (milestones) и записи об ошибках, чтобы поддерживать концентрацию.
Act: Без команд человека агент самостоятельно определяет приоритеты и запускает редакторы или инструменты сборки.
Learn: Агент самообучается на ошибках через удобные для парсинга (Grep-friendly) логи тестов.
Feedback: Результаты работы и инструкции для следующего исполнителя записываются в README.md и пушатся в Git для синхронизации знаний.

Протокол текстовой блокировки для предотвращения дублирования задач

Стратегия Оракула: проверяйте, а не гадайте

Половина файлов ядра собирается с помощью GCC, другая половина — с помощью Claude.
Сужая область возникновения ошибки наполовину, система находит одну-единственную проблемную строку среди тысяч файлов.
Этот метод повысил эффективность отладки примерно на 50% и физически заблокировал возможность галлюцинаций ИИ.

Технические ограничения: стена оптимизации, которую ИИ не смог преодолеть

Дефекты управления памятью: Вместо оптимизации модели владения (ownership) был выбран неэффективный метод копирования всех данных в отдельные буферы.
Недостаток понимания аппаратного обеспечения: Агенты не смогли преодолеть строгие ограничения памяти (32 КБ) в 16-битном реальном режиме x86, поэтому в этот участок пришлось вмешиваться человеку или заимствовать код из GCC.
Отсутствие реализации алгоритмов: ИИ не смог самостоятельно провести математический анализ для распределения регистров, ограничившись лишь буквальным переводом инструкций.

Чек-лист для принятия решений о внедрении корпоративных агентов

Критерии оценки внедрения агентного рабочего процесса

Вопрос	Да	Нет
Можно ли объективно проверить результат с помощью тестов?	Перейти к следующему шагу	Не подходит для внедрения (риск галлюцинаций)
Существует ли сопоставимый существующий инструмент (Оракул)?	Принять стратегию Оракула	Требуется постоянный мониторинг человеком
Можно ли разделить задачу на 100 и более единиц?	Использовать параллельных агентов	Рекомендуется одиночный агент

Необходимые элементы для построения

Grep-friendly обвязка: Спроектируйте структуру логов так, чтобы агент мог за 1 секунду определить успех или неудачу.
Автоматизация записи состояния: Перед завершением работы агента обязательно заставляйте его фиксировать прогресс в progress.json или аналогичном файле.
Человеческие «гардрайлы» (Guardrails): Изолируйте чувствительный код, связанный с безопасностью или аутентификацией, и обязательно подвергайте его проверке человеком.

Легион из 16 агентов Claude за 20 000 долларов: реальность автономной разработки C-компилятора

Related Video

$20 000. 2 недели. 16 агентов Claude. Первый C-компилятор от Anthropic, созданный ИИ

Легион из 16 агентов Claude за 20 000 долларов: реальность автономной разработки C-компилятора

Цикл RALF: архитектура, блокирующая загрязнение памяти ИИ

Протокол текстовой блокировки для предотвращения дублирования задач

Стратегия Оракула: проверяйте, а не гадайте

Технические ограничения: стена оптимизации, которую ИИ не смог преодолеть

Чек-лист для принятия решений о внедрении корпоративных агентов

Критерии оценки внедрения агентного рабочего процесса

Необходимые элементы для построения

От кодера к архитектору: трансформация роли инженера

Comments (0)

Легион из 16 агентов Claude за 20 000 долларов: реальность автономной разработки C-компилятора

Цикл RALF: архитектура, блокирующая загрязнение памяти ИИ

Протокол текстовой блокировки для предотвращения дублирования задач

Стратегия Оракула: проверяйте, а не гадайте

Технические ограничения: стена оптимизации, которую ИИ не смог преодолеть

Чек-лист для принятия решений о внедрении корпоративных агентов

Критерии оценки внедрения агентного рабочего процесса

Необходимые элементы для построения

От кодера к архитектору: трансформация роли инженера