ИИ-агенты непредсказуемы... Это решение делает их детерминированными (Archon)

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português 中文

Computing/SoftwareSmall Business/StartupsConsumer ElectronicsInternet Technology

Transcript

00:00:00ИИ-агенты становятся невероятно мощными, но они всё ещё хаотичны.

00:00:04Мы даем им одну и ту же задачу, а получаем совершенно разный код, разное качество и

00:00:09даже разные решения каждый раз.

00:00:12Такова реальность работы с агентами.

00:00:15Оказывается, это необязательно.

00:00:17Это Archon, и теперь он может запускать несколько агентов параллельно без конфликтов слияния

00:00:22и с согласованными результатами.

00:00:24В ближайшие пару минут я покажу вам, как именно его настроить и как он работает.

00:00:30Мы знаем, что при использовании Claude code, Cursor или Codex первый запуск выглядит отлично.

00:00:39Второй запуск может предложить совершенно другой план.

00:00:42Контекст может искажаться.

00:00:44Агент меняет направление на полпути.

00:00:47Затем вы пытаетесь это масштабировать.

00:00:49Два агента, может быть три, четыре агента.

00:00:51Теперь ваш репозиторий — это полная неразбериха.

00:00:54И вот в чем настоящая проблема.

00:00:55Вы больше не экономите время.

00:00:57Вы заново запускаете промпты.

00:00:58Вы исправляете сломанный код, надеясь, что этот запуск ничего не испортит.

00:01:02И если вы что-то создаете, это просто убивает нашу скорость.

00:01:06Archon исправляет это с помощью так называемой «инженерии обвязки» (harness engineering).

00:01:10Вместо того чтобы надеяться на поведение агента, вы сами определяете процесс.

00:01:14Планирование, кодинг, тестирование, ревью — все в YAML.

00:01:18Навыки агента — это многоразовые пакеты инструкций, которые агент загружает автоматически.

00:01:23Так что вместо догадок о том, что делать, ваш агент следует системе.

00:01:28Если вам нравятся инструменты для кодинга, ускоряющие работу, обязательно подпишитесь.

00:01:32У нас постоянно выходят новые видео.

00:01:34Хорошо, теперь позвольте мне показать.

00:01:36Это работает локально на моем M4 Pro, без облака.

00:01:40Я могу ввести «archonserv».

00:01:43Это открывает вот такой графический интерфейс.

00:01:45Я установлю навык Archon в этот репозиторий с помощью Claude.

00:01:49Теперь я запускаю простой рабочий процесс, чтобы исправить эту проблему.

00:01:54Смотрите внимательно.

00:01:55Агент сам находит навык, загружает рабочий процесс и выполняет его шаг за шагом.

00:02:02Вы можете наблюдать за этим здесь, в терминале, или тут, в интерфейсе.

00:02:04Так выглядит гораздо лучше.

00:02:05Никакой подгонки промптов.

00:02:07Даже когда происходит сбой, вы получаете полную прозрачность в интерфейсе.

00:02:11Вы видите, какой именно шаг не сработал, и можете исправить рабочий процесс.

00:02:15Это намного лучше чистого Claude code, где остается лишь запутанная история чата.

00:02:20Это ключевой момент.

00:02:21Он также работает в собственном Git work tree, поэтому никогда не трогает ветку main.

00:02:26Идет обработка промптов, и вот, вы видите результат.

00:02:29Готово: чистый PR, та же структура, тот же результат.

00:02:33Мы видим логи, процесс прохождения промптов и весь вывод.

00:02:38Вот что значит согласованность.

00:02:40Так что же на самом деле изменилось?

00:02:42С Archon изменились три вещи.

00:02:45Во-первых, рабочие процессы.

00:02:47Archon использует YAML DAG (направленные ациклические графы).

00:02:50Представьте это как контрольный список, которому должен следовать агент.

00:02:53В некоторых шагах используется ИИ, конечно.

00:02:56Некоторые шаги фиксированы.

00:02:58Это сочетание делает работу более надежной.

00:03:00Затем у нас есть изоляция.

00:03:01Каждый запуск происходит в отдельном Git work tree, поэтому агенты не перезаписывают друг друга.

00:03:06Вот почему нет конфликтов слияния.

00:03:08В навыках агент загружает контекст автоматически, а не пичкает им промпты каждый раз.

00:03:14По сравнению с обычными агентами, вы убираете всю эту случайность.

00:03:19Если сравнивать, скажем, с LangChain.

00:03:22LangChain хорош, но Archon создан специально для кода, а не для общих ботов.

00:03:27И в отличие от скриптов, это решение многоразовое.

00:03:30Оно версионное.

00:03:31Оно доступно для обнаружения.

00:03:32Агент больше не действует наугад.

00:03:34У нас есть весь этот рабочий процесс, через который он проходит.

00:03:36Он следует реальной системе.

00:03:38Теперь мы можем запускать несколько агентов одновременно и не бояться сломать репозиторий.

00:03:42Можно создавать PR, которые каждый раз выглядят одинаково.

00:03:45И самое главное — вы перестаете терять знания в истории чатов.

00:03:49Ваш процесс теперь живет в рабочих процессах, а значит, каждый запуск становится стабильнее.

00:03:55Используя это,

00:03:56вы получаете чистые PR и более предсказуемые результаты.

00:03:58Тот же вход — тот же выход.

00:04:00Это именно то, чего не хватало агентам.

00:04:02Конечно, это не идеально.

00:04:04Но что в нем хорошего?

00:04:05Это открытый исходный код, он отлично работает локально, особенно на чипах серии M.

00:04:10Для некоторых есть конфигурация VPS.

00:04:13Здесь мне это не нужно.

00:04:14YAML делает всё наглядным.

00:04:16Это большая победа для нас, а Git work tree решают реальную проблему.

00:04:19Но, опять же, это накладывает определенные условия.

00:04:21Нужно думать наперед.

00:04:23Проектирование рабочих процессов потребует усилий, и всё это еще развивается.

00:04:28Всё будет меняться.

00:04:29Всё будет эволюционировать, но проект растет.

00:04:31Если вам нужны просто быстрые ответы, возможно, вам это и не нужно.

00:04:34Честно говоря, это было бы пустой тратой времени.

00:04:36Кроме того, модель всё еще имеет значение.

00:04:38Очевидно, что лучшая модель выдаст лучший результат.

00:04:42Если вы устали исправлять ошибки агентов, это определенно стоит попробовать.

00:04:46Если вам нужно что-то надежное, в чем не придется сомневаться, это тоже того стоит.

00:04:50Для простых экспериментов — да, я сам экспериментировал.

00:04:52Я не стал ничего усложнять.

00:04:55Всё работает отлично.

00:04:56Мне нужно было понять суть.

00:04:57Но если вы серьезно настроены на разработку с помощью агентов,

00:04:58то это один из самых эффективных инструментов, которые я встречал.

00:05:02Это превращает агентов из просто демонстрашек,

00:05:04в нечто, что мы действительно можем надежно выпускать в продакшн.

00:05:08Внедрить это в свой рабочий процесс довольно просто.

00:05:13Раньше вы надеялись, что агент поступит правильно.

00:05:14Это ведь агент.

00:05:16Теперь же мы сами определяем, как он работает.

00:05:17Именно это они заявляют, и в этом суть «инженерии обвязки».

00:05:20Если вам нравятся подобные инструменты и советы по кодингу,

00:05:23обязательно подпишитесь на канал Better Stack.

00:05:27Увидимся в следующем видео.

Key Takeaway

Archon превращает непредсказуемых ИИ-агентов в надежные производственные инструменты за счет использования YAML-сценариев и изолированных Git work tree, обеспечивая стабильный результат «одинаковый вход — одинаковый выход».

Highlights

Инструмент Archon делает ИИ-агентов детерминированными, устраняя хаотичную генерацию кода при повторных запусках одного и того же промпта.
Технология инженерии обвязки (harness engineering) заменяет подгонку промптов четкими рабочими процессами в формате YAML.
Использование направленных ациклических графов (YAML DAG) позволяет комбинировать фиксированные шаги алгоритма с этапами, где применяется ИИ.
Изоляция каждого запуска в отдельном Git work tree полностью исключает конфликты слияния и порчу основной ветки репозитория.
Система работает локально на процессорах Apple серии M, обеспечивая прозрачность каждого шага выполнения через графический интерфейс или терминал.

Timeline

Проблема хаотичности современных ИИ-агентов

Повторные запуски Claude code или Cursor часто приводят к изменению планов и потере контекста.
Масштабирование работы на нескольких агентов одновременно превращает репозиторий в неструктурированную массу кода.
Разработчики тратят время на исправление сломанного кода и перезапуск промптов вместо продуктивной работы.

Традиционные агенты страдают от отсутствия согласованности, выдавая разные решения для одной и той же задачи. Это убивает скорость разработки, так как результат становится непредсказуемым. Проблема усугубляется при попытке параллельной работы нескольких агентов, что ведет к хаосу в истории чатов и структуре проекта.

Инженерия обвязки как метод контроля

Archon заменяет надежду на поведение агента жестким определением процессов планирования, кодинга и тестирования.
Навыки агентов упаковываются в многоразовые пакеты инструкций, которые загружаются автоматически.
Графический интерфейс archonserv обеспечивает полную видимость каждого шага и причин возможных сбоев.

Вместо бесконечной подгонки промптов система следует заданному алгоритму. Агент сам находит нужный навык и выполняет его шаг за шагом. Процесс отображается в реальном времени, что дает преимущество перед обычными чат-интерфейсами, где логика принятия решений скрыта в истории переписки.

Архитектура детерминированного ИИ: DAG и Git work tree

Рабочие процессы строятся на базе YAML DAG для создания строгих контрольных списков.
Автоматическое создание Git work tree гарантирует, что агенты не перезаписывают данные друг друга.
Автоматическая загрузка контекста через навыки заменяет избыточное наполнение промптов данными.

Стабильность достигается через три ключевых изменения: структурированные графы задач, техническую изоляцию среды исполнения и автоматизацию контекста. Это позволяет получать чистые Pull Requests с идентичной структурой при каждом запуске. В отличие от общих фреймворков вроде LangChain, данное решение узко специализировано для работы с кодом.

Практическое применение и ограничения системы

Archon является проектом с открытым исходным кодом, оптимизированным для локальной работы на чипах M4 Pro.
Создание качественных рабочих процессов в YAML требует предварительного проектирования и усилий со стороны разработчика.
Инструмент предназначен для серьезной разработки, а не для получения быстрых разовых ответов.

Эффективность системы напрямую зависит от выбранной модели ИИ и готовности пользователя инвестировать время в проектирование процессов. Технология Git work tree решает реальные проблемы совместной работы ИИ-агентов, но требует дисциплины в описании алгоритмов. Это переводит работу с агентами из стадии простых демонстраций в стадию надежного продакшн-инструментария.

Community Posts

Write about this video