ИИ-агенты непредсказуемы... Это решение делает их детерминированными (Archon)
BBetter Stack
Computing/SoftwareSmall Business/StartupsConsumer ElectronicsInternet Technology
Transcript
00:00:00ИИ-агенты становятся невероятно мощными, но они всё ещё хаотичны.
00:00:04Мы даем им одну и ту же задачу, а получаем совершенно разный код, разное качество и
00:00:09даже разные решения каждый раз.
00:00:12Такова реальность работы с агентами.
00:00:15Оказывается, это необязательно.
00:00:17Это Archon, и теперь он может запускать несколько агентов параллельно без конфликтов слияния
00:00:22и с согласованными результатами.
00:00:24В ближайшие пару минут я покажу вам, как именно его настроить и как он работает.
00:00:30Мы знаем, что при использовании Claude code, Cursor или Codex первый запуск выглядит отлично.
00:00:39Второй запуск может предложить совершенно другой план.
00:00:42Контекст может искажаться.
00:00:44Агент меняет направление на полпути.
00:00:47Затем вы пытаетесь это масштабировать.
00:00:49Два агента, может быть три, четыре агента.
00:00:51Теперь ваш репозиторий — это полная неразбериха.
00:00:54И вот в чем настоящая проблема.
00:00:55Вы больше не экономите время.
00:00:57Вы заново запускаете промпты.
00:00:58Вы исправляете сломанный код, надеясь, что этот запуск ничего не испортит.
00:01:02И если вы что-то создаете, это просто убивает нашу скорость.
00:01:06Archon исправляет это с помощью так называемой «инженерии обвязки» (harness engineering).
00:01:10Вместо того чтобы надеяться на поведение агента, вы сами определяете процесс.
00:01:14Планирование, кодинг, тестирование, ревью — все в YAML.
00:01:18Навыки агента — это многоразовые пакеты инструкций, которые агент загружает автоматически.
00:01:23Так что вместо догадок о том, что делать, ваш агент следует системе.
00:01:28Если вам нравятся инструменты для кодинга, ускоряющие работу, обязательно подпишитесь.
00:01:32У нас постоянно выходят новые видео.
00:01:34Хорошо, теперь позвольте мне показать.
00:01:36Это работает локально на моем M4 Pro, без облака.
00:01:40Я могу ввести «archonserv».
00:01:43Это открывает вот такой графический интерфейс.
00:01:45Я установлю навык Archon в этот репозиторий с помощью Claude.
00:01:49Теперь я запускаю простой рабочий процесс, чтобы исправить эту проблему.
00:01:54Смотрите внимательно.
00:01:55Агент сам находит навык, загружает рабочий процесс и выполняет его шаг за шагом.
00:02:02Вы можете наблюдать за этим здесь, в терминале, или тут, в интерфейсе.
00:02:04Так выглядит гораздо лучше.
00:02:05Никакой подгонки промптов.
00:02:07Даже когда происходит сбой, вы получаете полную прозрачность в интерфейсе.
00:02:11Вы видите, какой именно шаг не сработал, и можете исправить рабочий процесс.
00:02:15Это намного лучше чистого Claude code, где остается лишь запутанная история чата.
00:02:20Это ключевой момент.
00:02:21Он также работает в собственном Git work tree, поэтому никогда не трогает ветку main.
00:02:26Идет обработка промптов, и вот, вы видите результат.
00:02:29Готово: чистый PR, та же структура, тот же результат.
00:02:33Мы видим логи, процесс прохождения промптов и весь вывод.
00:02:38Вот что значит согласованность.
00:02:40Так что же на самом деле изменилось?
00:02:42С Archon изменились три вещи.
00:02:45Во-первых, рабочие процессы.
00:02:47Archon использует YAML DAG (направленные ациклические графы).
00:02:50Представьте это как контрольный список, которому должен следовать агент.
00:02:53В некоторых шагах используется ИИ, конечно.
00:02:56Некоторые шаги фиксированы.
00:02:58Это сочетание делает работу более надежной.
00:03:00Затем у нас есть изоляция.
00:03:01Каждый запуск происходит в отдельном Git work tree, поэтому агенты не перезаписывают друг друга.
00:03:06Вот почему нет конфликтов слияния.
00:03:08В навыках агент загружает контекст автоматически, а не пичкает им промпты каждый раз.
00:03:14По сравнению с обычными агентами, вы убираете всю эту случайность.
00:03:19Если сравнивать, скажем, с LangChain.
00:03:22LangChain хорош, но Archon создан специально для кода, а не для общих ботов.
00:03:27И в отличие от скриптов, это решение многоразовое.
00:03:30Оно версионное.
00:03:31Оно доступно для обнаружения.
00:03:32Агент больше не действует наугад.
00:03:34У нас есть весь этот рабочий процесс, через который он проходит.
00:03:36Он следует реальной системе.
00:03:38Теперь мы можем запускать несколько агентов одновременно и не бояться сломать репозиторий.
00:03:42Можно создавать PR, которые каждый раз выглядят одинаково.
00:03:45И самое главное — вы перестаете терять знания в истории чатов.
00:03:49Ваш процесс теперь живет в рабочих процессах, а значит, каждый запуск становится стабильнее.
00:03:55Используя это,
00:03:56вы получаете чистые PR и более предсказуемые результаты.
00:03:58Тот же вход — тот же выход.
00:04:00Это именно то, чего не хватало агентам.
00:04:02Конечно, это не идеально.
00:04:04Но что в нем хорошего?
00:04:05Это открытый исходный код, он отлично работает локально, особенно на чипах серии M.
00:04:10Для некоторых есть конфигурация VPS.
00:04:13Здесь мне это не нужно.
00:04:14YAML делает всё наглядным.
00:04:16Это большая победа для нас, а Git work tree решают реальную проблему.
00:04:19Но, опять же, это накладывает определенные условия.
00:04:21Нужно думать наперед.
00:04:23Проектирование рабочих процессов потребует усилий, и всё это еще развивается.
00:04:28Всё будет меняться.
00:04:29Всё будет эволюционировать, но проект растет.
00:04:31Если вам нужны просто быстрые ответы, возможно, вам это и не нужно.
00:04:34Честно говоря, это было бы пустой тратой времени.
00:04:36Кроме того, модель всё еще имеет значение.
00:04:38Очевидно, что лучшая модель выдаст лучший результат.
00:04:42Если вы устали исправлять ошибки агентов, это определенно стоит попробовать.
00:04:46Если вам нужно что-то надежное, в чем не придется сомневаться, это тоже того стоит.
00:04:50Для простых экспериментов — да, я сам экспериментировал.
00:04:52Я не стал ничего усложнять.
00:04:55Всё работает отлично.
00:04:56Мне нужно было понять суть.
00:04:57Но если вы серьезно настроены на разработку с помощью агентов,
00:04:58то это один из самых эффективных инструментов, которые я встречал.
00:05:02Это превращает агентов из просто демонстрашек,
00:05:04в нечто, что мы действительно можем надежно выпускать в продакшн.
00:05:08Внедрить это в свой рабочий процесс довольно просто.
00:05:13Раньше вы надеялись, что агент поступит правильно.
00:05:14Это ведь агент.
00:05:16Теперь же мы сами определяем, как он работает.
00:05:17Именно это они заявляют, и в этом суть «инженерии обвязки».
00:05:20Если вам нравятся подобные инструменты и советы по кодингу,
00:05:23обязательно подпишитесь на канал Better Stack.
00:05:27Увидимся в следующем видео.