Log in to leave a comment
No posts yet
Парадигма программной инженерии меняется. Проект, реализованный исследователем Anthropic Николасом Карлини (Nicholas Carlini), — это не просто уровень «попросить ИИ написать код». Мобилизовав 16 экземпляров Claude Opus 4.6, он с нуля создал C-компилятор на базе Rust при минимальном участии человека.
Результат состоит из 100 000 строк кода, успешно собирает ядро Linux 6.9 и запускает классическую игру Doom. Однако важнее внешнего блеска — это пределы и возможности агентных рабочих процессов (agentic workflows), обнаруженные в процессе вложения 20 000 долларов (около 27 млн вон) в затраты на API. Мы проанализируем инженерную сущность того, как системно управлять ИИ и организовывать их совместную работу, выходя за рамки простого написания промптов.
В сложном системном программировании одиночный агент быстро упирается в лимиты контекстного окна. Это происходит потому, что со временем записи прошлых диалогов начинают искажать текущие суждения, вызывая галлюцинации. Для решения этой проблемы Карлини внедрил цикл RALF (Refresh, Act, Learn, Feedback) вместе с 16 независимыми Docker-контейнерами.
README.md и пушатся в Git для синхронизации знаний.Самый большой риск при одновременном участии 16 агентов — растрата ресурсов. Если два агента попытаются исправить один и тот же баг, это приведет не только к конфликтам кода, но и к двойным счетам за API. Вместо сложной отдельной базы данных Карлини реализовал легковесный механизм блокировки (Locking) с использованием текстовых флагов внутри Git-репозитория.
Перед началом конкретной задачи агент создает в директории current_tasks/ файл с названием, идентичным названию задачи. Благодаря атомарности коммитов в Git, попытка другого агента запушить файл с тем же именем отклоняется. Эта простая система в корне пресекла состояние гонки (Race Condition) между агентами.
Изюминкой проекта стало использование существующего инструмента GCC в качестве Оракула (Oracle). Это стратегия принудительного получения правильного ответа системным путем, а не гадание ИИ. Когда возникала ошибка при сборке огромного ядра Linux, Карлини автоматизировал алгоритм бинарного поиска (Binary Search).
Несмотря на впечатляющие достижения, производительность созданного компилятора не достигла даже самого низкого уровня оптимизации GCC (-O0). Легион агентов Claude проявил слабость в следующих высокоуровневых инженерных областях:
С точки зрения инженерного менеджера, 20 000 долларов — это совсем не дорого. Задача, на которую команде из 5 профессионалов потребовалось бы более 3 месяцев, была завершена всего за 2 недели. Это доказывает рентабельность более чем в 10 раз по сравнению с традиционными затратами на персонал. Компании, желающие внедрить эту модель, должны следовать следующему дереву принятия решений.
| Вопрос | Да | Нет |
|---|---|---|
| Можно ли объективно проверить результат с помощью тестов? | Перейти к следующему шагу | Не подходит для внедрения (риск галлюцинаций) |
| Существует ли сопоставимый существующий инструмент (Оракул)? | Принять стратегию Оракула | Требуется постоянный мониторинг человеком |
| Можно ли разделить задачу на 100 и более единиц? | Использовать параллельных агентов | Рекомендуется одиночный агент |
progress.json или аналогичном файле.Эксперимент Anthropic означает, что роль инженера сместилась от автора кода к проектировщику и аудитору систем. Теперь критически важным навыком является не умение самостоятельно писать алгоритмы, а способность проектировать логические ограничения и проверочные обвязки, чтобы легион ИИ-агентов не сошел с дистанции.
Затраты в 20 000 долларов — это не просто расходы, а веха, показывающая верхний предел автоматизации, которого может достичь ИИ при поддержке тонкого человеческого проектирования. Теперь компаниям следует сосредоточиться не только на автономности ИИ, но и на системном подходе к стратегическому управлению со стороны человека.