Codex только что стал ЛУЧШЕЙ платформой для длительных агентных задач
CChase AI
컴퓨터/소프트웨어게임/e스포츠AI/미래기술
Transcript
00:00:00Codex может превзойти Claude Code с выходом новой экспериментальной функции Goals.
00:00:05Теперь Codex — это самый простой способ выполнять длительные автономные задачи по кодингу
00:00:10без необходимости подключать какие-либо дополнительные уровни оркестрации. Goals работает как более
00:00:15сложный интегрированный цикл RALPH. Вы задаете цель, и он будет работать
00:00:19часами напролет, чтобы решить проблему, не требуя от вас никакого вмешательства.
00:00:25И сегодня я покажу, как это устроено, как всё настроить, и мы проведем реальную
00:00:29демонстрацию, чтобы вы увидели это в действии. Мы создадим Rift Salvage — нашу 2D-боевую
00:00:35видеоигру, использующую полностью оригинальные ассеты, которую мы построим строго через Goals. Функция Goals
00:00:42— одно из главных отличий Codex на данный момент, и пользоваться ею до смешного просто.
00:00:47Речь идет об одной команде через слэш, так что здесь скрыта огромная ценность. Поэтому,
00:00:51используете ли вы настольное приложение Codex или CLI, вам нужно включить Goals, так как это
00:00:56экспериментальная функция. Вы можете попросить Codex сделать это или сделать это сами очень быстро.
00:01:01В приложении Codex я просто перейду в настройки, а затем выберу раздел конфигурации.
00:01:07Здесь, где написано “open config.toml”, я нажму на это и открою файл в VS Code.
00:01:15И внизу нужно добавить две строки, если их там еще нет: features и затем goals = true.
00:01:22Вот и всё. Это должно занять пару секунд. Если это слишком сложно, вы можете просто сказать Codex:
00:01:27“Слушай, включи мне Goals”. То есть features goals = true. И всё. Теперь, чтобы реально использовать Goals
00:01:35в приложении или CLI, вы просто вводите /goal. По какой-то причине,
00:01:40думаю, из-за того, что она экспериментальная, при вводе /goal вы не получите
00:01:43никакого уведомления, что она работает, но вы увидите, когда мы дадим правильный промпт,
00:01:48что появится маленький значок, подтверждающий работу Goals. Если вы включили её, обязательно
00:01:53перезапустите Claude Code, чтобы изменения вступили в силу. Но когда вы вводите /goal,
00:01:58вы не увидите ничего привычного, как если бы вы вызывали навык или что-то еще,
00:02:02где есть нормальная обратная связь. Но это нормально. Однако,
00:02:08прежде чем демонстрировать Goals в приложении, позвольте объяснить, как это работает изнутри.
00:02:13Но сначала пара слов от сегодняшнего спонсора — меня. Как вы знаете, в Chase AI Plus
00:02:18у меня есть мастер-класс по Claude Code, а также я только что выпустил мастер-класс по Codex.
00:02:24Теперь у вас есть два инструмента, которые помогут стать ИИ-разработчиком с нуля.
00:02:29Это лучшее место для обучения, так как я предполагаю, что у вас нет технических знаний,
00:02:34и мы фокусируемся на реальных кейсах. Ссылка будет в закрепленном комментарии,
00:02:40также там ссылка на мой бесплатный вебинар через пару дней. Жду вас там. Итак,
00:02:46Codex Goals — это по сути более сложный интегрированный цикл RALPH. Что это такое?
00:02:51Давайте кратко освежим в памяти для тех, кто забыл. По своей сути цикл RALPH,
00:02:57если бы мы использовали его в Claude Code, это всего лишь одна строка кода. Обычный bash-цикл.
00:03:03Вы видите его прямо здесь. Идея в том, что я запускаю эту строку кода,
00:03:09и в результате запускается Claude Code, Codex или любая система ИИ, которая смотрит в файл prompt.md.
00:03:16В этом промпте сказано: “Вот что мы пытаемся сделать, вот как я хочу это сделать,
00:03:21и вот критерии, по которым работа будет считаться завершенной”. В данном примере мы хотим
00:03:28повысить покрытие тестами файлов аутентификации и остановимся,
00:03:33составит 75%. Это конечная цель. И работать это будет так: вы запускаете цикл, а затем
00:03:41внедряет его в сессию ИИ, сессия делает один шаг, читает промпт,
00:03:48а также читает файл state.md. Файл состояния — это файл, на который он ориентируется,
00:03:56проверяя: если у нас есть задачи 1, 2 и 3, что уже сделано и всё ли работает?
00:04:03Допустим, за первые несколько ходов он выполняет задачу 1. На следующем ходу
00:04:10он посмотрит в файл состояния и увидит: “Ага, задача 2 не выполнена”. И угадайте,
00:04:14что мы будем делать в этой сессии? Мы займемся ею. Возможно, за один ход не получится,
00:04:18он запишет: “Вот что я попробовал”. Следующий шаг продолжит, пока все задачи не будут готовы.
00:04:25После своего хода агент обновляет файл, ход заканчивается, и цикл продолжается.
00:04:30Получается своего рода непрерывная петля, где он постоянно сверяется с парой файлов:
00:04:35что сделано, что нужно сделать, какое конечное состояние. В итоге, когда критерии достигнуты,
00:04:41он сообщает: “Готово”. Всё автономно. В этом суть циклов RALPH. Теперь,
00:04:48если вы хотите, чтобы циклы RALPH умели больше, требуется дополнительная надстройка,
00:04:53например, для контроля счетов или умного использования токенов. Не факт, что это есть.
00:04:58Что если агент упадет или вы нажмете Ctrl+C? Как он узнает, что реально всё закончил?
00:05:02Есть ли встроенный верификатор? Не совсем, ведь в основе это просто одна строка кода.
00:05:08А теперь сравните это с Goals. В общих чертах Goals работает так же: мы говорим ему,
00:05:15что делать, у него есть план, и он постоянно обновляет внутренние файлы с пометками:
00:05:19“Вот что я сделал, вот что еще нужно”. Он пытается достичь финиша. Идея та же,
00:05:23но есть отличия. Во-первых, есть два Markdown-файла, которые для вас невидимы:
00:05:29continuation (продолжение) и budget limit (лимит бюджета). Что они делают?
00:05:35Они позволяют Codex действовать иначе, если вы приближаетесь к лимитам использования,
00:05:40что очень важно. Это обеспечивает “грациозное” завершение того, как система
00:05:46обработает задачу в цикле Goals по сравнению с RALPH. В RALPH кончился бюджет — и всё.
00:05:52Codex же придумает, как оставить работу в таком состоянии, чтобы вы могли продолжить позже.
00:05:57На практике Codex делает свой ход в цикле, и когда тот подходит к концу,
00:06:03у него есть четыре пути. Первый: если работа осталась и бюджет в норме —
00:06:08просто продолжаем. Второй: если мы близки к лимиту токенов, он
00:06:13внедрит файл budget limit.md и аккуратно завершит ход, предоставив
00:06:19финальный отчет о сделанном и о том, что нужно сделать дальше при обновлении лимита.
00:06:25Третий: если проект закончен, он вызовет инструмент обновления цели,
00:06:29изменит статус, проверит все результаты, и если всё ок — цель достигнута.
00:06:34И наконец, есть способы приостановить цель, редактировать её или справиться сбоями.
00:06:39Так что если в процессе цикла что-то пойдет не так, мы не окажемся в тупике,
00:06:45как в обычном RALPH. Это гораздо сложнее, хотя концептуально похоже,
00:06:49и нам не нужна дополнительная оркестрация. Всё это может звучать знакомо,
00:06:54если вы работали с такими инструментами, как GSD или Superpowers.
00:06:59Это уровни оркестрации над Claude Code для того, что в Codex делается одной командой.
00:07:05Поскольку это всего лишь один слэш, выполнять задачи супер просто.
00:07:11Не нужно смотреть 40-минутное демо по всем тонкостям GSD. Просто пишете /goal,
00:07:18и Codex идет покорять вершины. С учетом этого, давайте проверим его в деле.
00:07:24Сначала переведем его в режим планирования (plan mode), так как из него легко перейти в Goals.
00:07:30Мы попросим его создать аркадную игру на выживание с видом сверху и
00:07:35пусть он сам создаст все ассеты. Крутая фишка Codex по сравнению с Claude Code
00:07:39в том, что это продукт OpenAI, и у нас есть доступ к генерации изображений DALL-E.
00:07:44Так что он сам создаст графику: спрайт дрона игрока, трех врагов,
00:07:49босса, ядро энергии, мины, фон, значки интерфейса... В общем, работы много.
00:07:56Промпт довольно сложный, потому что процесс может затянуться надолго.
00:08:01Я уже должен был показать скриншот парня, у которого процесс шел 50 часов кряду.
00:08:07Не знаю, лучший ли это способ, но идея в том, что сначала у нас есть смутная задумка,
00:08:15мы идем в режим плана, прорабатываем всё четко. И что крайне важно —
00:08:18нужно предельно точно описать конечный результат. Если цель не будет конкретной,
00:08:23с измеримыми параметрами, которые он должен выполнить для завершения цикла,
00:08:31то результат может оказаться посредственным или недоделанным.
00:08:36Поэтому очень советую уделить время проработке плана в режиме планирования,
00:08:43а не просто писать: “/goal сделай мне SaaS-продукт на миллиард долларов”.
00:08:50Вот план для нашей игры. Что касается верификации — именно на это
00:08:55он будет ориентироваться при проверке перед тем, как сказать “готово”.
00:09:02Конечно, ему нужно запустить сборку, исправить ошибки, поднять сервер разработки,
00:09:07запустить автоматический скрипт Playwright, который откроет приложение,
00:09:12подтвердит загрузку, проверит отрисовку на холсте, симулирует движения,
00:09:17сбор предметов, получение урона, изменение здоровья и так далее. Если вас
00:09:24устраивает такой список проверок, можно двигаться дальше. Когда он предложит
00:09:29реализовать план, вы просто пишете: /goal реализуй этот план.
00:09:34Отправляем... И вот вверху вы видите этот маленький значок Goal.
00:09:39Теперь я знаю, что процесс идет. Как я и говорил, после /goal команд не будет,
00:09:44но всё работает. Думаю, это просто баг интерфейса экспериментальной функции.
00:09:49Он пишет, что всё еще в режиме плана... отменим это. Попробуем еще раз:
00:09:54“/goal используй цель для реализации этого плана”. Да, пока немного сыровато,
00:10:02но посмотрим, что он сделает. Идея в том, что теперь я вообще не вмешиваюсь.
00:10:09Он выполнит свой цикл, и на выходе у нас будет готовый продукт. Прошло
00:10:12около 12 минут, и видно, что он уже создает все ассеты с помощью модели Image Gen 2.
00:10:17Это очень круто. И опять же, плюс настольного приложения в том, что всё
00:10:28отображается прямо в чате, а не просто летит текстом в терминале.
00:10:34Меня лично приложение Codex очень впечатлило. Не то чтобы я разлюбил Claude Code,
00:10:39я использую их оба. Можете глянуть моё прошлое видео на эту тему.
00:10:43Думаю, идея, что нужно выбирать что-то одно — глупость. Почему бы не юзать оба,
00:10:49зачастую в тандеме? Claude Code для меня — это чистый терминал,
00:10:54а в Codex мне реально нравится десктоп-версия. Возможно, это просто
00:11:00приятная смена обстановки после постоянного сидения в консоли.
00:11:06В общем, пока мне очень нравится. Примерно через 30 минут он закончил.
00:11:11Даже быстрее, чем я ожидал. Давайте посмотрим на первый прогон.
00:11:15Раз он справился так быстро, я, наверное, попрошу его что-то добавить в конце.
00:11:20Он пишет, что реализовал Rift Salvage, сервер запущен. Это игра на Canvas
00:11:26с управлением клавиатурой/тачем, врагами, минами, очками, боссом, паузой...
00:11:3211 ассетов с прозрачностью, авто-проверка Playwright... и список всего созданного.
00:11:38Это круто. Проверим, работает ли, и что можно улучшить, чтобы поднапрячь его.
00:11:44Давайте откроем в браузере... О, есть экран загрузки. Контраст низковат,
00:11:49плохо видно, вам тоже может быть плохо видно, но вот мой кораблик.
00:11:56Это мина, кажется, я должен собирать эти штуки, пока враги преследуют меня.
00:12:03Всё работает, выглядит неплохо. Здорово, что всё это — уникальные изображения.
00:12:10Я думаю, мы могли бы поработать над графикой и, во-первых,
00:12:17глянуть на битву с боссом, если её ускорить, а также добавить какую-то
00:12:27систему стрельбы, лазеры или что-то в этом роде. Давайте попросим его
00:12:32сделать это прямо сейчас. Перехожу в режим планирования,
00:12:39чтобы он попотел. Окей, для первого раза неплохо, всё работает,
00:12:49но хочется чего-то посложнее. Добавим боевую систему — лазеры, стрельбу по
00:12:56врагам, и чтобы они стреляли в ответ. Еще пусть фаза босса наступает быстрее
00:13:00или будет кнопка для её запуска. И подправь контраст, а то всё сливается.
00:13:04Если есть другие идеи, как усложнить задачу и выжать из тебя максимум —
00:13:11предлагай. Вот такой план он выдал. Заметьте: при использовании системы Goals
00:13:15каждый запуск привязан к конкретной ветке или сессии. Мы были в одном чате,
00:13:19значит, это та же ветка цели. Если я хочу сделать второй прогон по тому же проекту,
00:13:24нужно открыть вторую ветку или чат, как в новом терминале. Я просто копирую
00:13:31этот план, открываю новый чат, пишу /goal и вставляю его туда.
00:13:37Через 15 минут второй этап завершен. Он добавил боевой апгрейд,
00:13:42глянем, что получилось. Снова экран загрузки, похож на первый,
00:13:49но вверху добавились виджеты: цель комбо и сигнал босса. Теперь при запуске
00:13:53корабль стреляет, у врагов есть жизни, и они отстреливаются. Вызываю босса...
00:13:58А вот и он, выглядит реально круто. Самое классное в том, что
00:14:07все ассеты уникальные и созданы через Image Gen 2. Это впечатляет.
00:14:12Я знаю, что на два прогона ушло всего 45 минут, хотя кто-то гоняет их по три дня.
00:14:18Но прелесть в том, как просто это запускается. Вы даете цель,
00:14:24и он пашет. Не знаю, выиграли мы или умерли, но суть в том,
00:14:33что при наличии четкого ориентира и критериев успеха вы получаете
00:14:40колоссальную отдачу. И это может работать бесконечно. Вместо того чтобы
00:14:44настраивать свой RALPH-цикл или использовать внешние инструменты вроде GSD,
00:14:50всё это уже встроено. Можно добавить много фишек, которые сложно
00:14:56внедрить в Claude Code напрямую — пришлось бы подключать Higgsfield MCP
00:15:01для генерации картинок, а тут всё в одной системе. Надеюсь,
00:15:09видео было полезным. Советую потестить Codex, ребята, десктопное приложение — огонь.
00:15:13И помните: их можно юзать в связке с Claude Code. Составить план в Claude,
00:15:19а потом закинуть его в Goals в Codex. Пусть один проверяет работу другого,
00:15:24именно в таком взаимодействии рождается истинная ценность. Как говорится,
00:15:30целое больше суммы его частей. Пишите, что думаете.
00:15:36Заглядывайте в Chase AI Plus, ссылка в закрепе. Там же инфа про вебинар,
00:15:43который пройдет через пару дней. Надеюсь вас там увидеть.
00:15:48На этом всё, до встречи!
00:15:54из этого можно извлечь массу пользы, и это может работать практически вечно, так что вместо того, чтобы настраивать
00:15:59свой собственный цикл RALPH и свою структуру или использовать что-то стороннее в качестве уровня
00:16:05оркестрации, вроде GSD или Superpowers, здесь всё уже встроено для вас, и, как мы убедились,
00:16:10вы можете добавлять много крутых штук, которые сложно реализовать напрямую, но можно сделать в Claude Code,
00:16:15например, если бы мы использовали для этого Claude Code, мы бы определенно справились, просто нам бы пришлось
00:16:18внедрить что-то вроде Higgsfield CLI или Higgsfield MCP, чтобы выполнить всю эту генерацию изображений
00:16:24за нас, вместо того чтобы иметь одну единую интегрированную систему. Так что, надеюсь, вы смогли почерпнуть
00:16:31что-то полезное из этого видео, и я настоятельно рекомендую вам попробовать Codex, ребята, мне очень понравилось
00:16:35настольное приложение, как я и говорил ранее, я считаю, что эта функция Goals — это очень круто, и опять же,
00:16:40мы могли бы делать это в тандеме с Claude Code, мы могли бы составить план в
00:16:44Claude Code, а затем закинуть его в Codex для Goals, чтобы Claude Code проверил выполненную работу,
00:16:49и поддерживать такой двусторонний процесс, в котором, я считаю, и заключается наибольшая ценность, это вроде как
00:16:53когда целое больше суммы его частей. В общем, как всегда, дайте мне знать,
00:17:02что вы думаете, обязательно загляните в Chase AI Plus, ссылка на него в закрепленном
00:17:07комментарии, также через несколько дней я провожу вебинар, ссылка тоже будет там, так что надеюсь вас там увидеть,
00:17:12ну а в остальном — еще увидимся!