Codex только что стал ЛУЧШЕЙ платформой для длительных агентных задач

CChase AI
Computing/SoftwareVideo & Computer GamesInternet Technology

Transcript

00:00:00Codex может превзойти Claude Code с выходом новой экспериментальной функции Goals.
00:00:05Теперь Codex — это самый простой способ выполнять длительные автономные задачи по кодингу
00:00:10без необходимости подключать какие-либо дополнительные уровни оркестрации. Goals работает как более
00:00:15сложный интегрированный цикл RALPH. Вы задаете цель, и он будет работать
00:00:19часами напролет, чтобы решить проблему, не требуя от вас никакого вмешательства.
00:00:25И сегодня я покажу, как это устроено, как всё настроить, и мы проведем реальную
00:00:29демонстрацию, чтобы вы увидели это в действии. Мы создадим Rift Salvage — нашу 2D-боевую
00:00:35видеоигру, использующую полностью оригинальные ассеты, которую мы построим строго через Goals. Функция Goals
00:00:42— одно из главных отличий Codex на данный момент, и пользоваться ею до смешного просто.
00:00:47Речь идет об одной команде через слэш, так что здесь скрыта огромная ценность. Поэтому,
00:00:51используете ли вы настольное приложение Codex или CLI, вам нужно включить Goals, так как это
00:00:56экспериментальная функция. Вы можете попросить Codex сделать это или сделать это сами очень быстро.
00:01:01В приложении Codex я просто перейду в настройки, а затем выберу раздел конфигурации.
00:01:07Здесь, где написано “open config.toml”, я нажму на это и открою файл в VS Code.
00:01:15И внизу нужно добавить две строки, если их там еще нет: features и затем goals = true.
00:01:22Вот и всё. Это должно занять пару секунд. Если это слишком сложно, вы можете просто сказать Codex:
00:01:27“Слушай, включи мне Goals”. То есть features goals = true. И всё. Теперь, чтобы реально использовать Goals
00:01:35в приложении или CLI, вы просто вводите /goal. По какой-то причине,
00:01:40думаю, из-за того, что она экспериментальная, при вводе /goal вы не получите
00:01:43никакого уведомления, что она работает, но вы увидите, когда мы дадим правильный промпт,
00:01:48что появится маленький значок, подтверждающий работу Goals. Если вы включили её, обязательно
00:01:53перезапустите Claude Code, чтобы изменения вступили в силу. Но когда вы вводите /goal,
00:01:58вы не увидите ничего привычного, как если бы вы вызывали навык или что-то еще,
00:02:02где есть нормальная обратная связь. Но это нормально. Однако,
00:02:08прежде чем демонстрировать Goals в приложении, позвольте объяснить, как это работает изнутри.
00:02:13Но сначала пара слов от сегодняшнего спонсора — меня. Как вы знаете, в Chase AI Plus
00:02:18у меня есть мастер-класс по Claude Code, а также я только что выпустил мастер-класс по Codex.
00:02:24Теперь у вас есть два инструмента, которые помогут стать ИИ-разработчиком с нуля.
00:02:29Это лучшее место для обучения, так как я предполагаю, что у вас нет технических знаний,
00:02:34и мы фокусируемся на реальных кейсах. Ссылка будет в закрепленном комментарии,
00:02:40также там ссылка на мой бесплатный вебинар через пару дней. Жду вас там. Итак,
00:02:46Codex Goals — это по сути более сложный интегрированный цикл RALPH. Что это такое?
00:02:51Давайте кратко освежим в памяти для тех, кто забыл. По своей сути цикл RALPH,
00:02:57если бы мы использовали его в Claude Code, это всего лишь одна строка кода. Обычный bash-цикл.
00:03:03Вы видите его прямо здесь. Идея в том, что я запускаю эту строку кода,
00:03:09и в результате запускается Claude Code, Codex или любая система ИИ, которая смотрит в файл prompt.md.
00:03:16В этом промпте сказано: “Вот что мы пытаемся сделать, вот как я хочу это сделать,
00:03:21и вот критерии, по которым работа будет считаться завершенной”. В данном примере мы хотим
00:03:28повысить покрытие тестами файлов аутентификации и остановимся,
00:03:33составит 75%. Это конечная цель. И работать это будет так: вы запускаете цикл, а затем
00:03:41внедряет его в сессию ИИ, сессия делает один шаг, читает промпт,
00:03:48а также читает файл state.md. Файл состояния — это файл, на который он ориентируется,
00:03:56проверяя: если у нас есть задачи 1, 2 и 3, что уже сделано и всё ли работает?
00:04:03Допустим, за первые несколько ходов он выполняет задачу 1. На следующем ходу
00:04:10он посмотрит в файл состояния и увидит: “Ага, задача 2 не выполнена”. И угадайте,
00:04:14что мы будем делать в этой сессии? Мы займемся ею. Возможно, за один ход не получится,
00:04:18он запишет: “Вот что я попробовал”. Следующий шаг продолжит, пока все задачи не будут готовы.
00:04:25После своего хода агент обновляет файл, ход заканчивается, и цикл продолжается.
00:04:30Получается своего рода непрерывная петля, где он постоянно сверяется с парой файлов:
00:04:35что сделано, что нужно сделать, какое конечное состояние. В итоге, когда критерии достигнуты,
00:04:41он сообщает: “Готово”. Всё автономно. В этом суть циклов RALPH. Теперь,
00:04:48если вы хотите, чтобы циклы RALPH умели больше, требуется дополнительная надстройка,
00:04:53например, для контроля счетов или умного использования токенов. Не факт, что это есть.
00:04:58Что если агент упадет или вы нажмете Ctrl+C? Как он узнает, что реально всё закончил?
00:05:02Есть ли встроенный верификатор? Не совсем, ведь в основе это просто одна строка кода.
00:05:08А теперь сравните это с Goals. В общих чертах Goals работает так же: мы говорим ему,
00:05:15что делать, у него есть план, и он постоянно обновляет внутренние файлы с пометками:
00:05:19“Вот что я сделал, вот что еще нужно”. Он пытается достичь финиша. Идея та же,
00:05:23но есть отличия. Во-первых, есть два Markdown-файла, которые для вас невидимы:
00:05:29continuation (продолжение) и budget limit (лимит бюджета). Что они делают?
00:05:35Они позволяют Codex действовать иначе, если вы приближаетесь к лимитам использования,
00:05:40что очень важно. Это обеспечивает “грациозное” завершение того, как система
00:05:46обработает задачу в цикле Goals по сравнению с RALPH. В RALPH кончился бюджет — и всё.
00:05:52Codex же придумает, как оставить работу в таком состоянии, чтобы вы могли продолжить позже.
00:05:57На практике Codex делает свой ход в цикле, и когда тот подходит к концу,
00:06:03у него есть четыре пути. Первый: если работа осталась и бюджет в норме —
00:06:08просто продолжаем. Второй: если мы близки к лимиту токенов, он
00:06:13внедрит файл budget limit.md и аккуратно завершит ход, предоставив
00:06:19финальный отчет о сделанном и о том, что нужно сделать дальше при обновлении лимита.
00:06:25Третий: если проект закончен, он вызовет инструмент обновления цели,
00:06:29изменит статус, проверит все результаты, и если всё ок — цель достигнута.
00:06:34И наконец, есть способы приостановить цель, редактировать её или справиться сбоями.
00:06:39Так что если в процессе цикла что-то пойдет не так, мы не окажемся в тупике,
00:06:45как в обычном RALPH. Это гораздо сложнее, хотя концептуально похоже,
00:06:49и нам не нужна дополнительная оркестрация. Всё это может звучать знакомо,
00:06:54если вы работали с такими инструментами, как GSD или Superpowers.
00:06:59Это уровни оркестрации над Claude Code для того, что в Codex делается одной командой.
00:07:05Поскольку это всего лишь один слэш, выполнять задачи супер просто.
00:07:11Не нужно смотреть 40-минутное демо по всем тонкостям GSD. Просто пишете /goal,
00:07:18и Codex идет покорять вершины. С учетом этого, давайте проверим его в деле.
00:07:24Сначала переведем его в режим планирования (plan mode), так как из него легко перейти в Goals.
00:07:30Мы попросим его создать аркадную игру на выживание с видом сверху и
00:07:35пусть он сам создаст все ассеты. Крутая фишка Codex по сравнению с Claude Code
00:07:39в том, что это продукт OpenAI, и у нас есть доступ к генерации изображений DALL-E.
00:07:44Так что он сам создаст графику: спрайт дрона игрока, трех врагов,
00:07:49босса, ядро энергии, мины, фон, значки интерфейса... В общем, работы много.
00:07:56Промпт довольно сложный, потому что процесс может затянуться надолго.
00:08:01Я уже должен был показать скриншот парня, у которого процесс шел 50 часов кряду.
00:08:07Не знаю, лучший ли это способ, но идея в том, что сначала у нас есть смутная задумка,
00:08:15мы идем в режим плана, прорабатываем всё четко. И что крайне важно —
00:08:18нужно предельно точно описать конечный результат. Если цель не будет конкретной,
00:08:23с измеримыми параметрами, которые он должен выполнить для завершения цикла,
00:08:31то результат может оказаться посредственным или недоделанным.
00:08:36Поэтому очень советую уделить время проработке плана в режиме планирования,
00:08:43а не просто писать: “/goal сделай мне SaaS-продукт на миллиард долларов”.
00:08:50Вот план для нашей игры. Что касается верификации — именно на это
00:08:55он будет ориентироваться при проверке перед тем, как сказать “готово”.
00:09:02Конечно, ему нужно запустить сборку, исправить ошибки, поднять сервер разработки,
00:09:07запустить автоматический скрипт Playwright, который откроет приложение,
00:09:12подтвердит загрузку, проверит отрисовку на холсте, симулирует движения,
00:09:17сбор предметов, получение урона, изменение здоровья и так далее. Если вас
00:09:24устраивает такой список проверок, можно двигаться дальше. Когда он предложит
00:09:29реализовать план, вы просто пишете: /goal реализуй этот план.
00:09:34Отправляем... И вот вверху вы видите этот маленький значок Goal.
00:09:39Теперь я знаю, что процесс идет. Как я и говорил, после /goal команд не будет,
00:09:44но всё работает. Думаю, это просто баг интерфейса экспериментальной функции.
00:09:49Он пишет, что всё еще в режиме плана... отменим это. Попробуем еще раз:
00:09:54“/goal используй цель для реализации этого плана”. Да, пока немного сыровато,
00:10:02но посмотрим, что он сделает. Идея в том, что теперь я вообще не вмешиваюсь.
00:10:09Он выполнит свой цикл, и на выходе у нас будет готовый продукт. Прошло
00:10:12около 12 минут, и видно, что он уже создает все ассеты с помощью модели Image Gen 2.
00:10:17Это очень круто. И опять же, плюс настольного приложения в том, что всё
00:10:28отображается прямо в чате, а не просто летит текстом в терминале.
00:10:34Меня лично приложение Codex очень впечатлило. Не то чтобы я разлюбил Claude Code,
00:10:39я использую их оба. Можете глянуть моё прошлое видео на эту тему.
00:10:43Думаю, идея, что нужно выбирать что-то одно — глупость. Почему бы не юзать оба,
00:10:49зачастую в тандеме? Claude Code для меня — это чистый терминал,
00:10:54а в Codex мне реально нравится десктоп-версия. Возможно, это просто
00:11:00приятная смена обстановки после постоянного сидения в консоли.
00:11:06В общем, пока мне очень нравится. Примерно через 30 минут он закончил.
00:11:11Даже быстрее, чем я ожидал. Давайте посмотрим на первый прогон.
00:11:15Раз он справился так быстро, я, наверное, попрошу его что-то добавить в конце.
00:11:20Он пишет, что реализовал Rift Salvage, сервер запущен. Это игра на Canvas
00:11:26с управлением клавиатурой/тачем, врагами, минами, очками, боссом, паузой...
00:11:3211 ассетов с прозрачностью, авто-проверка Playwright... и список всего созданного.
00:11:38Это круто. Проверим, работает ли, и что можно улучшить, чтобы поднапрячь его.
00:11:44Давайте откроем в браузере... О, есть экран загрузки. Контраст низковат,
00:11:49плохо видно, вам тоже может быть плохо видно, но вот мой кораблик.
00:11:56Это мина, кажется, я должен собирать эти штуки, пока враги преследуют меня.
00:12:03Всё работает, выглядит неплохо. Здорово, что всё это — уникальные изображения.
00:12:10Я думаю, мы могли бы поработать над графикой и, во-первых,
00:12:17глянуть на битву с боссом, если её ускорить, а также добавить какую-то
00:12:27систему стрельбы, лазеры или что-то в этом роде. Давайте попросим его
00:12:32сделать это прямо сейчас. Перехожу в режим планирования,
00:12:39чтобы он попотел. Окей, для первого раза неплохо, всё работает,
00:12:49но хочется чего-то посложнее. Добавим боевую систему — лазеры, стрельбу по
00:12:56врагам, и чтобы они стреляли в ответ. Еще пусть фаза босса наступает быстрее
00:13:00или будет кнопка для её запуска. И подправь контраст, а то всё сливается.
00:13:04Если есть другие идеи, как усложнить задачу и выжать из тебя максимум —
00:13:11предлагай. Вот такой план он выдал. Заметьте: при использовании системы Goals
00:13:15каждый запуск привязан к конкретной ветке или сессии. Мы были в одном чате,
00:13:19значит, это та же ветка цели. Если я хочу сделать второй прогон по тому же проекту,
00:13:24нужно открыть вторую ветку или чат, как в новом терминале. Я просто копирую
00:13:31этот план, открываю новый чат, пишу /goal и вставляю его туда.
00:13:37Через 15 минут второй этап завершен. Он добавил боевой апгрейд,
00:13:42глянем, что получилось. Снова экран загрузки, похож на первый,
00:13:49но вверху добавились виджеты: цель комбо и сигнал босса. Теперь при запуске
00:13:53корабль стреляет, у врагов есть жизни, и они отстреливаются. Вызываю босса...
00:13:58А вот и он, выглядит реально круто. Самое классное в том, что
00:14:07все ассеты уникальные и созданы через Image Gen 2. Это впечатляет.
00:14:12Я знаю, что на два прогона ушло всего 45 минут, хотя кто-то гоняет их по три дня.
00:14:18Но прелесть в том, как просто это запускается. Вы даете цель,
00:14:24и он пашет. Не знаю, выиграли мы или умерли, но суть в том,
00:14:33что при наличии четкого ориентира и критериев успеха вы получаете
00:14:40колоссальную отдачу. И это может работать бесконечно. Вместо того чтобы
00:14:44настраивать свой RALPH-цикл или использовать внешние инструменты вроде GSD,
00:14:50всё это уже встроено. Можно добавить много фишек, которые сложно
00:14:56внедрить в Claude Code напрямую — пришлось бы подключать Higgsfield MCP
00:15:01для генерации картинок, а тут всё в одной системе. Надеюсь,
00:15:09видео было полезным. Советую потестить Codex, ребята, десктопное приложение — огонь.
00:15:13И помните: их можно юзать в связке с Claude Code. Составить план в Claude,
00:15:19а потом закинуть его в Goals в Codex. Пусть один проверяет работу другого,
00:15:24именно в таком взаимодействии рождается истинная ценность. Как говорится,
00:15:30целое больше суммы его частей. Пишите, что думаете.
00:15:36Заглядывайте в Chase AI Plus, ссылка в закрепе. Там же инфа про вебинар,
00:15:43который пройдет через пару дней. Надеюсь вас там увидеть.
00:15:48На этом всё, до встречи!
00:15:54из этого можно извлечь массу пользы, и это может работать практически вечно, так что вместо того, чтобы настраивать
00:15:59свой собственный цикл RALPH и свою структуру или использовать что-то стороннее в качестве уровня
00:16:05оркестрации, вроде GSD или Superpowers, здесь всё уже встроено для вас, и, как мы убедились,
00:16:10вы можете добавлять много крутых штук, которые сложно реализовать напрямую, но можно сделать в Claude Code,
00:16:15например, если бы мы использовали для этого Claude Code, мы бы определенно справились, просто нам бы пришлось
00:16:18внедрить что-то вроде Higgsfield CLI или Higgsfield MCP, чтобы выполнить всю эту генерацию изображений
00:16:24за нас, вместо того чтобы иметь одну единую интегрированную систему. Так что, надеюсь, вы смогли почерпнуть
00:16:31что-то полезное из этого видео, и я настоятельно рекомендую вам попробовать Codex, ребята, мне очень понравилось
00:16:35настольное приложение, как я и говорил ранее, я считаю, что эта функция Goals — это очень круто, и опять же,
00:16:40мы могли бы делать это в тандеме с Claude Code, мы могли бы составить план в
00:16:44Claude Code, а затем закинуть его в Codex для Goals, чтобы Claude Code проверил выполненную работу,
00:16:49и поддерживать такой двусторонний процесс, в котором, я считаю, и заключается наибольшая ценность, это вроде как
00:16:53когда целое больше суммы его частей. В общем, как всегда, дайте мне знать,
00:17:02что вы думаете, обязательно загляните в Chase AI Plus, ссылка на него в закрепленном
00:17:07комментарии, также через несколько дней я провожу вебинар, ссылка тоже будет там, так что надеюсь вас там увидеть,
00:17:12ну а в остальном — еще увидимся!

Key Takeaway

Экспериментальная функция Goals в Codex автоматизирует длительные циклы разработки через продвинутый цикл RALPH с интегрированным управлением бюджетом и генерацией медиа-контента.

Highlights

  • Функция Goals превращает Codex в автономную систему, способную выполнять сложные задачи по кодингу часами без вмешательства пользователя.

  • Интеграция с DALL-E (Image Gen 2) позволяет Codex автоматически генерировать уникальные графические ассеты для игровых проектов прямо в процессе разработки.

  • В отличие от простых циклов RALPH, Goals использует невидимые файлы для контроля бюджета и токенов, обеспечивая безопасное завершение сессии при достижении лимитов.

  • Активация Goals требует добавления строк features и goals = true в файл config.toml или прямого запроса к ИИ внутри приложения.

  • Комбинирование Claude Code для планирования и Codex Goals для реализации позволяет верифицировать код силами двух разных ИИ-моделей.

  • Создание полноценной 2D-игры Rift Salvage с боевой системой и уникальной графикой занимает около 45 минут в режиме автономной работы Goals.

Timeline

Автономный кодинг через функцию Goals

  • Codex заменяет внешние уровни оркестрации встроенным циклом автономного выполнения задач.
  • Функция Goals работает как усложненная версия цикла RALPH для решения длительных проблем кодинга.
  • Команда /goal запускает процесс, который не требует участия человека до завершения цели.

Система нацелена на упрощение процесса написания кода за счет устранения необходимости в дополнительных инструментах управления агентами. Goals позволяет ИИ работать над проектом непрерывно, самостоятельно принимая решения в рамках заданного промпта. Это делает платформу эффективнее Claude Code для задач, требующих длительного автономного присутствия.

Настройка и активация экспериментальных функций

  • Активация режима Goals происходит через редактирование файла конфигурации config.toml.
  • Команда /goal в CLI или приложении активирует автономный цикл без явного уведомления в интерфейсе.
  • Перезапуск приложения после изменения настроек обязателен для вступления изменений в силу.

Для включения функции пользователю необходимо добавить параметры в раздел features конфигурационного файла или попросить об этом сам Codex. Интерфейс экспериментальной версии может не давать мгновенной обратной связи при вводе команды, но статус работы подтверждается появлением специального значка цели при запуске промпта. Настройка занимает несколько секунд и открывает доступ к глубокой автоматизации.

Механика работы цикла RALPH и архитектура Goals

  • Цикл RALPH базируется на постоянной синхронизации между файлами промпта и текущего состояния проекта.
  • Агент проверяет список задач в файле state.md и выполняет их поочередно до достижения критериев успеха.
  • Стандартные циклы RALPH ограничены отсутствием встроенных механизмов контроля затрат и верификации.

Классический автономный цикл представляет собой bash-скрипт, который заставляет ИИ читать инструкции из одного файла и записывать прогресс в другой. Процесс продолжается до тех пор, пока зафиксированные в промпте условия завершения не будут выполнены. Однако такие системы уязвимы к сбоям и не умеют грамотно распоряжаться лимитами API без внешней надстройки.

Преимущества Goals в управлении ресурсами

  • Codex использует скрытые файлы continuation.md и budget_limit.md для интеллектуального завершения задач.
  • Система предусматривает четыре сценария поведения в зависимости от остатка бюджета и прогресса задачи.
  • При исчерпании лимитов Codex формирует отчет для плавного возобновления работы позже.

В отличие от простых скриптов, Goals анализирует потребление токенов в реальном времени. Если бюджет подходит к концу, ИИ не просто прерывает выполнение, а подготавливает проект к консервации, фиксируя текущий статус. Это избавляет от необходимости использовать тяжеловесные системы оркестрации вроде GSD или Superpowers.

Разработка игры Rift Salvage в режиме Goals

  • Режим планирования (plan mode) служит фундаментом для постановки измеримых целей перед запуском /goal.
  • Доступ к DALL-E позволяет ИИ самостоятельно создавать все визуальные элементы игры.
  • Интеграция скриптов Playwright обеспечивает автоматическую проверку работоспособности готового продукта.

Для успешной автономной работы требуется предельно конкретное описание финала с измеримыми параметрами. В примере создания 2D-шутера ИИ поручается генерация спрайтов игрока, врагов и боссов, а также настройка логики столкновений и интерфейса. Codex самостоятельно запускает сервер разработки и тестирует игру, имитируя действия пользователя через автоматизацию браузера.

Результаты тестирования и итерационное улучшение

  • Первая рабочая версия игры с уникальными ассетами создается примерно за 30 минут.
  • Вторая итерация в новой ветке цели позволяет добавить сложные системы, такие как стрельба и комбо-удары.
  • Синергия Codex и Claude Code дает максимальный результат при перекрестной проверке кода.

Тестирование показало полную функциональность созданной игры, включая экраны загрузки и уникальную графику. Для усложнения проекта используется повторный цикл Goals, куда передается уточненный план из режима планирования. Использование десктопного приложения Codex делает процесс нагляднее, так как все сгенерированные изображения и отчеты отображаются в чате, а не только в консоли.

Community Posts

View all posts