00:00:00Теперь мы можем использовать Codex внутри Claude Code.
00:00:03OpenAI сделала это возможным.
00:00:04Так что конкурент номер один для Opus 4.6
00:00:08теперь доступен как инструмент,
00:00:09который можно использовать в экосистеме Anthropic.
00:00:11И это отличная новость для всех любителей Claude Code,
00:00:15особенно если вы из тех, кто сталкивался
00:00:18с ограничениями по лимитам, потому что, честно говоря,
00:00:20Codex дает гораздо больше за те же деньги
00:00:23в плане соотношения доллара к кредитам или токенам.
00:00:26В этом видео я покажу вам, как его настроить,
00:00:28и мы разберем, на что на самом деле способен Codex
00:00:31в связке с оболочкой Claude Code.
00:00:33И что более важно, что мы можем сделать в Claude Code,
00:00:38используя Opus 4.6 и Codex вместе, верно?
00:00:40Как заставить эти две модели работать сообща,
00:00:43чтобы результат превзошел сумму их отдельных частей?
00:00:46Прежде чем перейти к установке, давайте кратко разберем,
00:00:48что именно дает нам плагин Claude Code,
00:00:50потому что там есть несколько важных моментов.
00:00:51Я бы сказал, что две самые важные вещи —
00:00:54это проверка кода, верно?
00:00:56Возможность дать модели взглянуть
00:00:58на то, что написал Opus.
00:00:59И это происходит в несколько этапов.
00:01:01Во-первых, есть стандартная проверка Codex,
00:01:03которая носит, ну, скажем так, нейтральный характер.
00:01:06Она просто изучает код в режиме чтения.
00:01:08Второй вариант — состязательная проверка, и она мне очень нравится.
00:01:12По сути, мы говорим Codex:
00:01:13"Эй, взгляни на то, что создал Opus
00:01:15или любой другой кодинг-агент,
00:01:17но смотри на это максимально критично.
00:01:20Предположим, что они где-то напортачили,
00:01:22и выясни, что мы можем улучшить".
00:01:25Это потрясающий способ реально повысить качество кода,
00:01:28потому что одна из проблем Opus
00:01:31и многих ИИ-моделей в целом заключается в том,
00:01:33что они плохо справляются с оценкой собственного кода.
00:01:36Anthropic как раз упоминали об этом
00:01:38в своем инженерном блоге на прошлой неделе.
00:01:40Так что такая вещь, как состязательная проверка — это идеально.
00:01:44Кроме того, мы можем использовать Codex Rescue,
00:01:46что позволяет Codex создавать что-то самостоятельно,
00:01:49точно так же, как вы делаете это с Opus в Claude Code.
00:01:52Ну и помимо этого — разные статусные функции,
00:01:54вроде отслеживания прогресса выполнения задачи.
00:01:58Давайте углубимся в это и перейдем к установке.
00:02:01Установка выполняется довольно просто.
00:02:02Вам нужно просто запустить вот эту команду,
00:02:04чтобы добавить плагин в маркетплейс.
00:02:06Все эти команды я оставлю в описании.
00:02:08Затем выполните команду установки плагина:
00:02:11codex@openai-codex.
00:02:13Как обычно, появится запрос, куда именно установить.
00:02:14Я выберу пользовательскую область (user scope).
00:02:16После этого нужно просто перезагрузить плагины,
00:02:17чтобы все заработало.
00:02:18И наконец, нужно запустить codex colon setup.
00:02:21Если вы вдруг не знали, для этого также есть GitHub-репозиторий,
00:02:24где подробно описаны все команды для установки.
00:02:27Ссылку на него я тоже добавлю в описание.
00:02:29Тарифы использования привязаны к вашему аккаунту ChatGPT,
00:02:32даже если вы на бесплатном плане, судя по всему.
00:02:34Так что имейте в виду, что ресурсы будут списываться
00:02:36из вашего лимита Codex.
00:02:37Вас спросят, хотите ли вы установить Codex, жмем "да".
00:02:39Для этого нужно войти в систему, вас перенаправит в браузер,
00:02:42где пройдет процесс аутентификации.
00:02:44Теперь о двух очевидных сценариях использования
00:02:47этого инструмента Codex внутри Claude Code.
00:02:49Первый — это решение проблемы с лимитами
00:02:52внутри самого Claude Code.
00:02:53Обычно, если вы на Pro-плане Anthropic
00:02:55или даже на максимальном, лимиты исчерпываются быстро,
00:02:58особенно с учетом багов в CLI,
00:03:00которые мы наблюдали на прошлой неделе.
00:03:02В таком случае можно попробовать схему:
00:03:03Opus 4.6 планирует, а Codex исполняет.
00:03:07Сделать это, опять же, очень просто.
00:03:09Вы просто используете команду codex rescue.
00:03:11Затем вводите свой запрос (промпт).
00:03:14Также можно указать дополнительные параметры.
00:03:16Здесь видны все доступные флаги,
00:03:18включая уровень усилий и прочее.
00:03:20И помните, Codex — это очень надежная модель.
00:03:24И опять же, стоимость использования даже близко
00:03:26не стоит того, что запрашивает Anthropic.
00:03:27Но я думаю, что более интересный вариант использования —
00:03:28это то, о чем я говорил ранее,
00:03:29а именно — состязательная проверка.
00:03:30Давайте проверим это в деле.
00:03:32Я попрошу его проанализировать
00:03:33моего бота для аналитики и вовлеченности в Twitter.
00:03:37Это веб-приложение, которое я собрал с помощью Claude Code.
00:03:39По сути, оно сканирует твиты в сфере ИИ
00:03:43каждые 30-45 минут.
00:03:45В нем есть фильтр качества.
00:03:47Есть система оценки сигналов
00:03:48на основе множества различных параметров.
00:03:50Он подключен к Supabase,
00:03:51чтобы твиты не повторялись.
00:03:53В нем есть система оценки, интеграция softmax и PIX.
00:03:56Все данные отправляются в Telegram.
00:03:58Также я встроил ИИ, который помогает с ответами.
00:04:00Так что там происходит довольно много процессов.
00:04:02И вдобавок к этому,
00:04:03он отслеживает все мои ответы,
00:04:06чтобы у нас была своего рода обратная связь.
00:04:07Это относительно... не суперсложно,
00:04:10но это и не просто одностраничный сайт.
00:04:13Посмотрим, что выдаст Codex,
00:04:16когда мы проведем состязательный аудит этого кода.
00:04:20Давайте проверим его в деле.
00:04:22Оставим запрос максимально открытым.
00:04:23Мы говорим Codex:
00:04:24«Изучи кодовую базу и поделись своим мнением».
00:04:27Первое, что он делает, — сообщает:
00:04:28«Мы оценим объем проверки,
00:04:30чтобы выбрать оптимальный режим».
00:04:32Затем он спрашивает:
00:04:33«Хотите запустить процесс в фоновом режиме
00:04:34или просто подождете результатов?»
00:04:35Мы просто подождем результатов.
00:04:37Он сообщает, что область проверки включает весь код,
00:04:39девять изменений в рабочем дереве, один измененный файл
00:04:42и восемь неотслеживаемых файлов.
00:04:43То есть он понимает, что объем работы
00:04:44предстоит немалый.
00:04:46И пока он работает,
00:04:47давайте обсудим, как устроен состязательный аудит.
00:04:49Мы только что видели первые четыре этапа.
00:04:52Он проанализировал аргументы.
00:04:54Мы не передавали никаких флагов,
00:04:55поэтому он использует настройки по умолчанию.
00:04:57Затем он оценил объем проверки,
00:04:59определил цель и собрал контекст.
00:05:01Это и был тот текст о том,
00:05:03что есть неотслеживаемые изменения
00:05:04 и проверка займет какое-то время.
00:05:05После этих первых четырех шагов
00:05:06он составит состязательный промпт,
00:05:09выделив семь векторов атаки,
00:05:11которым уделит особое внимание.
00:05:13Это аутентификация, потеря данных, откаты,
00:05:17состояние гонки, деградация зависимостей,
00:05:20несоответствие версий и пробелы в мониторинге.
00:05:23Семь скрытых угроз,
00:05:26которые могут все испортить,
00:05:27если мы выкатим это в продакшн,
00:05:29не держа ситуацию под контролем.
00:05:30Затем он отправит всю информацию
00:05:31на сервер OpenAI, чтобы Codex ее изучил.
00:05:34В итоге мы получим структурированный JSON-отчет,
00:05:37который должен выглядеть примерно так.
00:05:41Там будет указана степень критичности находок:
00:05:43критическая, высокая, средняя или низкая,
00:05:46а также рекомендации и следующие шаги.
00:05:48Вам остается только сидеть в Claude Code
00:05:51и ждать ответа.
00:05:52Codex нашел четыре проблемы в нашем коде,
00:05:54и у всех них была высокая степень критичности.
00:05:57Я перенес это в Excalidraw,
00:05:58чтобы нам было удобнее разбираться.
00:06:00Для каждой находки указана критичность,
00:06:02область, суть проблемы, файлы,
00:06:06а также конкретные строки кода,
00:06:08на которые нужно обратить внимание.
00:06:09И что важно — в чем именно заключается влияние
00:06:12и как это исправить.
00:06:13Во-первых, он указал на проблему
00:06:15с логикой дедупликации данных.
00:06:16Во-вторых — на то, как мы обрабатываем поллинг Telegram.
00:06:19В-третьих — на дрейф схемы данных.
00:06:21И наконец — на саму сборку панели управления.
00:06:24Все это действительно важные вещи,
00:06:27и, к счастью, исправления
00:06:29кажутся не слишком сложными.
00:06:31Но мне интересно другое:
00:06:33хорошо, это то, что выдал Codex.
00:06:35А что выдаст Claude, если попросить его
00:06:40провести такой же аудит своего же кода?
00:06:43Думаю, будет познавательно
00:06:45сравнить их напрямую
00:06:46и понять, чем Codex отличается от других.
00:06:48Ведь, возможно, они работают одинаково,
00:06:50и все это видео было бессмысленным.
00:06:52Итак, я запускаю через Opus такой же
00:06:55состязательный аудит кода.
00:06:56Я попросил Codex составить специальный промпт.
00:06:59По сути, он гласит:
00:07:00«Я хочу, чтобы ты подверг сомнению реализацию
00:07:02и архитектурные решения.
00:07:04Вот список того, что нужно оценить,
00:07:05а вот желаемый формат вывода».
00:07:07Посмотрим, что он ответит.
00:07:09Вот подробные результаты.
00:07:11Во-первых, у них было одно общее совпадение.
00:07:13Оба сошлись на том, что проблема с Telegram существует.
00:07:17Это единственная ошибка, которую нашли оба,
00:07:20и которые, по их словам, были либо высокого, либо критического уровня.
00:07:23Codex оценил проблему как просто «высокую»,
00:07:24а Opus — как «критическую».
00:07:26Сам Opus нашел семь других дополнительных проблем
00:07:30высокого или критического ранга, которые Codex пропустил.
00:07:32Мы не утверждаем, что просто из-за того,
00:07:36что Opus нашел больше проблем,
00:07:37он обязательно лучше, чем Codex.
00:07:39Просто отмечаем: он нашел семь вещей,
00:07:41на которые стоит взглянуть и которые Codex не заметил.
00:07:43Затем, очевидно, с другой стороны,
00:07:45мы нашли три проблемы в Codex, которые Opus упустил.
00:07:48Так что же это значит,
00:07:49 если рассматривать это в совокупности?
00:07:50Значит ли это, что Opus лучше Codex,
00:07:51потому что нашел больше, или Codex лучше Opus,
00:07:54потому что он сосредоточился на четырех
00:07:56и не увел нас по ложному следу?
00:07:58Я думаю, каждый сделает из этого
00:07:59те выводы, которые сам захочет.
00:08:01И, вероятно, вывод в том, что есть ценность
00:08:04в наличии обеих этих систем.
00:08:05Посмотрите на это сами, верно?
00:08:06Второй взгляд против того, чтобы Opus постоянно оценивал Opus.
00:08:09Постоянно.
00:08:10Я думаю, есть некий фундаментальный изъян в том,
00:08:13чтобы одна и та же ИИ-система занималась планированием,
00:08:16генерацией и оценкой.
00:08:17И если мы можем очень легко подключить Codex,
00:08:20особенно учитывая его стоимость,
00:08:22даже просто для таких вещей,
00:08:24как состязательный аудит,
00:08:25опять же, это один из отличных приемов
00:08:28в ИИ-кодинге «на полях», так почему бы и нет?
00:08:30Если вы уже платите за ChatGPT,
00:08:34если вы уже отдаете 20 долларов в месяц,
00:08:35и теперь я могу подключить это и дать Codex
00:08:37просто взглянуть на что угодно,
00:08:38так просто — в чем тут на самом деле минус?
00:08:43Я не думаю, что подобные быстрые тесты
00:08:47дадут нам какие-то окончательные ответы вроде:
00:08:48«О, Codex лучше Opus».
00:08:50И мне кажется, что весь этот разговор
00:08:51немного упускает суть.
00:08:52Это просто еще один инструмент в нашем арсенале,
00:08:54и теперь мы можем им пользоваться.
00:08:55Так что, я считаю, это здорово.
00:08:56Теперь мы можем проводить
00:08:58куда более специфичный состязательный аудит,
00:09:00потому что наш запрос был довольно общим и открытым,
00:09:03и его можно было интерпретировать по-разному,
00:09:06но, судя по примерам из GitHub, верно?
00:09:08Вы можете очень конкретно указать,
00:09:09на что именно Codex должен обратить внимание.
00:09:11В целом, я считаю это отличным дополнением
00:09:13к экосистеме Cloud Code.
00:09:14Чем больше инструментов, тем лучше,
00:09:15особенно если вы тот, кто либо А —
00:09:17уже платит за ChatGPT,
00:09:19либо Б — на плане Anthropic Pro,
00:09:22и, возможно, вы при этом платите за ChatGPT,
00:09:23и сто долларов в месяц может быть многовато,
00:09:25а двести долларов — уж точно перебор.
00:09:28Это как бы дает нам золотую середину
00:09:30между подпиской за 20$ и за 100$,
00:09:33потому что Codex — это действительно выгодное решение.
00:09:36Так что обязательно попробуйте, настройка суперпростая.
00:09:39Дайте знать, что вы об этом думаете,
00:09:41и, как всегда, увидимся.