Claude Code + Codex = AI GOD

Русскийالعربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 中文

Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Теперь мы можем использовать Codex внутри Claude Code.

00:00:03OpenAI сделала это возможным.

00:00:04Так что конкурент номер один для Opus 4.6

00:00:08теперь доступен как инструмент,

00:00:09который можно использовать в экосистеме Anthropic.

00:00:11И это отличная новость для всех любителей Claude Code,

00:00:15особенно если вы из тех, кто сталкивался

00:00:18с ограничениями по лимитам, потому что, честно говоря,

00:00:20Codex дает гораздо больше за те же деньги

00:00:23в плане соотношения доллара к кредитам или токенам.

00:00:26В этом видео я покажу вам, как его настроить,

00:00:28и мы разберем, на что на самом деле способен Codex

00:00:31в связке с оболочкой Claude Code.

00:00:33И что более важно, что мы можем сделать в Claude Code,

00:00:38используя Opus 4.6 и Codex вместе, верно?

00:00:40Как заставить эти две модели работать сообща,

00:00:43чтобы результат превзошел сумму их отдельных частей?

00:00:46Прежде чем перейти к установке, давайте кратко разберем,

00:00:48что именно дает нам плагин Claude Code,

00:00:50потому что там есть несколько важных моментов.

00:00:51Я бы сказал, что две самые важные вещи —

00:00:54это проверка кода, верно?

00:00:56Возможность дать модели взглянуть

00:00:58на то, что написал Opus.

00:00:59И это происходит в несколько этапов.

00:01:01Во-первых, есть стандартная проверка Codex,

00:01:03которая носит, ну, скажем так, нейтральный характер.

00:01:06Она просто изучает код в режиме чтения.

00:01:08Второй вариант — состязательная проверка, и она мне очень нравится.

00:01:12По сути, мы говорим Codex:

00:01:13"Эй, взгляни на то, что создал Opus

00:01:15или любой другой кодинг-агент,

00:01:17но смотри на это максимально критично.

00:01:20Предположим, что они где-то напортачили,

00:01:22и выясни, что мы можем улучшить".

00:01:25Это потрясающий способ реально повысить качество кода,

00:01:28потому что одна из проблем Opus

00:01:31и многих ИИ-моделей в целом заключается в том,

00:01:33что они плохо справляются с оценкой собственного кода.

00:01:36Anthropic как раз упоминали об этом

00:01:38в своем инженерном блоге на прошлой неделе.

00:01:40Так что такая вещь, как состязательная проверка — это идеально.

00:01:44Кроме того, мы можем использовать Codex Rescue,

00:01:46что позволяет Codex создавать что-то самостоятельно,

00:01:49точно так же, как вы делаете это с Opus в Claude Code.

00:01:52Ну и помимо этого — разные статусные функции,

00:01:54вроде отслеживания прогресса выполнения задачи.

00:01:58Давайте углубимся в это и перейдем к установке.

00:02:01Установка выполняется довольно просто.

00:02:02Вам нужно просто запустить вот эту команду,

00:02:04чтобы добавить плагин в маркетплейс.

00:02:06Все эти команды я оставлю в описании.

00:02:08Затем выполните команду установки плагина:

00:02:11codex@openai-codex.

00:02:13Как обычно, появится запрос, куда именно установить.

00:02:14Я выберу пользовательскую область (user scope).

00:02:16После этого нужно просто перезагрузить плагины,

00:02:17чтобы все заработало.

00:02:18И наконец, нужно запустить codex colon setup.

00:02:21Если вы вдруг не знали, для этого также есть GitHub-репозиторий,

00:02:24где подробно описаны все команды для установки.

00:02:27Ссылку на него я тоже добавлю в описание.

00:02:29Тарифы использования привязаны к вашему аккаунту ChatGPT,

00:02:32даже если вы на бесплатном плане, судя по всему.

00:02:34Так что имейте в виду, что ресурсы будут списываться

00:02:36из вашего лимита Codex.

00:02:37Вас спросят, хотите ли вы установить Codex, жмем "да".

00:02:39Для этого нужно войти в систему, вас перенаправит в браузер,

00:02:42где пройдет процесс аутентификации.

00:02:44Теперь о двух очевидных сценариях использования

00:02:47этого инструмента Codex внутри Claude Code.

00:02:49Первый — это решение проблемы с лимитами

00:02:52внутри самого Claude Code.

00:02:53Обычно, если вы на Pro-плане Anthropic

00:02:55или даже на максимальном, лимиты исчерпываются быстро,

00:02:58особенно с учетом багов в CLI,

00:03:00которые мы наблюдали на прошлой неделе.

00:03:02В таком случае можно попробовать схему:

00:03:03Opus 4.6 планирует, а Codex исполняет.

00:03:07Сделать это, опять же, очень просто.

00:03:09Вы просто используете команду codex rescue.

00:03:11Затем вводите свой запрос (промпт).

00:03:14Также можно указать дополнительные параметры.

00:03:16Здесь видны все доступные флаги,

00:03:18включая уровень усилий и прочее.

00:03:20И помните, Codex — это очень надежная модель.

00:03:24И опять же, стоимость использования даже близко

00:03:26не стоит того, что запрашивает Anthropic.

00:03:27Но я думаю, что более интересный вариант использования —

00:03:28это то, о чем я говорил ранее,

00:03:29а именно — состязательная проверка.

00:03:30Давайте проверим это в деле.

00:03:32Я попрошу его проанализировать

00:03:33моего бота для аналитики и вовлеченности в Twitter.

00:03:37Это веб-приложение, которое я собрал с помощью Claude Code.

00:03:39По сути, оно сканирует твиты в сфере ИИ

00:03:43каждые 30-45 минут.

00:03:45В нем есть фильтр качества.

00:03:47Есть система оценки сигналов

00:03:48на основе множества различных параметров.

00:03:50Он подключен к Supabase,

00:03:51чтобы твиты не повторялись.

00:03:53В нем есть система оценки, интеграция softmax и PIX.

00:03:56Все данные отправляются в Telegram.

00:03:58Также я встроил ИИ, который помогает с ответами.

00:04:00Так что там происходит довольно много процессов.

00:04:02И вдобавок к этому,

00:04:03он отслеживает все мои ответы,

00:04:06чтобы у нас была своего рода обратная связь.

00:04:07Это относительно... не суперсложно,

00:04:10но это и не просто одностраничный сайт.

00:04:13Посмотрим, что выдаст Codex,

00:04:16когда мы проведем состязательный аудит этого кода.

00:04:20Давайте проверим его в деле.

00:04:22Оставим запрос максимально открытым.

00:04:23Мы говорим Codex:

00:04:24«Изучи кодовую базу и поделись своим мнением».

00:04:27Первое, что он делает, — сообщает:

00:04:28«Мы оценим объем проверки,

00:04:30чтобы выбрать оптимальный режим».

00:04:32Затем он спрашивает:

00:04:33«Хотите запустить процесс в фоновом режиме

00:04:34или просто подождете результатов?»

00:04:35Мы просто подождем результатов.

00:04:37Он сообщает, что область проверки включает весь код,

00:04:39девять изменений в рабочем дереве, один измененный файл

00:04:42и восемь неотслеживаемых файлов.

00:04:43То есть он понимает, что объем работы

00:04:44предстоит немалый.

00:04:46И пока он работает,

00:04:47давайте обсудим, как устроен состязательный аудит.

00:04:49Мы только что видели первые четыре этапа.

00:04:52Он проанализировал аргументы.

00:04:54Мы не передавали никаких флагов,

00:04:55поэтому он использует настройки по умолчанию.

00:04:57Затем он оценил объем проверки,

00:04:59определил цель и собрал контекст.

00:05:01Это и был тот текст о том,

00:05:03что есть неотслеживаемые изменения

00:05:04 и проверка займет какое-то время.

00:05:05После этих первых четырех шагов

00:05:06он составит состязательный промпт,

00:05:09выделив семь векторов атаки,

00:05:11которым уделит особое внимание.

00:05:13Это аутентификация, потеря данных, откаты,

00:05:17состояние гонки, деградация зависимостей,

00:05:20несоответствие версий и пробелы в мониторинге.

00:05:23Семь скрытых угроз,

00:05:26которые могут все испортить,

00:05:27если мы выкатим это в продакшн,

00:05:29не держа ситуацию под контролем.

00:05:30Затем он отправит всю информацию

00:05:31на сервер OpenAI, чтобы Codex ее изучил.

00:05:34В итоге мы получим структурированный JSON-отчет,

00:05:37который должен выглядеть примерно так.

00:05:41Там будет указана степень критичности находок:

00:05:43критическая, высокая, средняя или низкая,

00:05:46а также рекомендации и следующие шаги.

00:05:48Вам остается только сидеть в Claude Code

00:05:51и ждать ответа.

00:05:52Codex нашел четыре проблемы в нашем коде,

00:05:54и у всех них была высокая степень критичности.

00:05:57Я перенес это в Excalidraw,

00:05:58чтобы нам было удобнее разбираться.

00:06:00Для каждой находки указана критичность,

00:06:02область, суть проблемы, файлы,

00:06:06а также конкретные строки кода,

00:06:08на которые нужно обратить внимание.

00:06:09И что важно — в чем именно заключается влияние

00:06:12и как это исправить.

00:06:13Во-первых, он указал на проблему

00:06:15с логикой дедупликации данных.

00:06:16Во-вторых — на то, как мы обрабатываем поллинг Telegram.

00:06:19В-третьих — на дрейф схемы данных.

00:06:21И наконец — на саму сборку панели управления.

00:06:24Все это действительно важные вещи,

00:06:27и, к счастью, исправления

00:06:29кажутся не слишком сложными.

00:06:31Но мне интересно другое:

00:06:33хорошо, это то, что выдал Codex.

00:06:35А что выдаст Claude, если попросить его

00:06:40провести такой же аудит своего же кода?

00:06:43Думаю, будет познавательно

00:06:45сравнить их напрямую

00:06:46и понять, чем Codex отличается от других.

00:06:48Ведь, возможно, они работают одинаково,

00:06:50и все это видео было бессмысленным.

00:06:52Итак, я запускаю через Opus такой же

00:06:55состязательный аудит кода.

00:06:56Я попросил Codex составить специальный промпт.

00:06:59По сути, он гласит:

00:07:00«Я хочу, чтобы ты подверг сомнению реализацию

00:07:02и архитектурные решения.

00:07:04Вот список того, что нужно оценить,

00:07:05а вот желаемый формат вывода».

00:07:07Посмотрим, что он ответит.

00:07:09Вот подробные результаты.

00:07:11Во-первых, у них было одно общее совпадение.

00:07:13Оба сошлись на том, что проблема с Telegram существует.

00:07:17Это единственная ошибка, которую нашли оба,

00:07:20и которые, по их словам, были либо высокого, либо критического уровня.

00:07:23Codex оценил проблему как просто «высокую»,

00:07:24а Opus — как «критическую».

00:07:26Сам Opus нашел семь других дополнительных проблем

00:07:30высокого или критического ранга, которые Codex пропустил.

00:07:32Мы не утверждаем, что просто из-за того,

00:07:36что Opus нашел больше проблем,

00:07:37он обязательно лучше, чем Codex.

00:07:39Просто отмечаем: он нашел семь вещей,

00:07:41на которые стоит взглянуть и которые Codex не заметил.

00:07:43Затем, очевидно, с другой стороны,

00:07:45мы нашли три проблемы в Codex, которые Opus упустил.

00:07:48Так что же это значит,

00:07:49 если рассматривать это в совокупности?

00:07:50Значит ли это, что Opus лучше Codex,

00:07:51потому что нашел больше, или Codex лучше Opus,

00:07:54потому что он сосредоточился на четырех

00:07:56и не увел нас по ложному следу?

00:07:58Я думаю, каждый сделает из этого

00:07:59те выводы, которые сам захочет.

00:08:01И, вероятно, вывод в том, что есть ценность

00:08:04в наличии обеих этих систем.

00:08:05Посмотрите на это сами, верно?

00:08:06Второй взгляд против того, чтобы Opus постоянно оценивал Opus.

00:08:09Постоянно.

00:08:10Я думаю, есть некий фундаментальный изъян в том,

00:08:13чтобы одна и та же ИИ-система занималась планированием,

00:08:16генерацией и оценкой.

00:08:17И если мы можем очень легко подключить Codex,

00:08:20особенно учитывая его стоимость,

00:08:22даже просто для таких вещей,

00:08:24как состязательный аудит,

00:08:25опять же, это один из отличных приемов

00:08:28в ИИ-кодинге «на полях», так почему бы и нет?

00:08:30Если вы уже платите за ChatGPT,

00:08:34если вы уже отдаете 20 долларов в месяц,

00:08:35и теперь я могу подключить это и дать Codex

00:08:37просто взглянуть на что угодно,

00:08:38так просто — в чем тут на самом деле минус?

00:08:43Я не думаю, что подобные быстрые тесты

00:08:47дадут нам какие-то окончательные ответы вроде:

00:08:48«О, Codex лучше Opus».

00:08:50И мне кажется, что весь этот разговор

00:08:51немного упускает суть.

00:08:52Это просто еще один инструмент в нашем арсенале,

00:08:54и теперь мы можем им пользоваться.

00:08:55Так что, я считаю, это здорово.

00:08:56Теперь мы можем проводить

00:08:58куда более специфичный состязательный аудит,

00:09:00потому что наш запрос был довольно общим и открытым,

00:09:03и его можно было интерпретировать по-разному,

00:09:06но, судя по примерам из GitHub, верно?

00:09:08Вы можете очень конкретно указать,

00:09:09на что именно Codex должен обратить внимание.

00:09:11В целом, я считаю это отличным дополнением

00:09:13к экосистеме Cloud Code.

00:09:14Чем больше инструментов, тем лучше,

00:09:15особенно если вы тот, кто либо А —

00:09:17уже платит за ChatGPT,

00:09:19либо Б — на плане Anthropic Pro,

00:09:22и, возможно, вы при этом платите за ChatGPT,

00:09:23и сто долларов в месяц может быть многовато,

00:09:25а двести долларов — уж точно перебор.

00:09:28Это как бы дает нам золотую середину

00:09:30между подпиской за 20$ и за 100$,

00:09:33потому что Codex — это действительно выгодное решение.

00:09:36Так что обязательно попробуйте, настройка суперпростая.

00:09:39Дайте знать, что вы об этом думаете,

00:09:41и, как всегда, увидимся.

Key Takeaway

Использование Codex в качестве независимого аудитора внутри Claude Code устраняет архитектурный изъян самопроверки Opus и снижает затраты на токены за счет перераспределения задач исполнения на более дешевую модель OpenAI.

Highlights

Интеграция Codex в Claude Code позволяет использовать модель OpenAI как плагин для состязательной проверки кода и выполнения задач.
Состязательный аудит Codex фокусируется на семи векторах атак, включая состояние гонки, деградацию зависимостей и пробелы в мониторинге.
Схема «Opus 4.6 планирует, а Codex исполняет» помогает обходить лимиты токенов Anthropic при сохранении высокого качества разработки.
В прямом сравнении Opus и Codex обнаружили лишь одну общую критическую ошибку в логике Telegram-бота, при этом каждая модель выявила уникальные уникальные уязвимости.
Установка плагина выполняется через терминал командами добавления в маркетплейс и авторизации через учетную запись ChatGPT.

Timeline

Преимущества объединения моделей в одной экосистеме

Codex обеспечивает лучшее соотношение стоимости к количеству доступных токенов по сравнению с Claude Opus.
Состязательная проверка сторонней моделью решает проблему плохой оценки собственного кода ИИ-агентами.

Модели ИИ часто демонстрируют слепоту к собственным ошибкам, о чем сообщали инженеры Anthropic. Внедрение Codex в Claude Code создает систему сдержек и противовесов. Стандартный режим чтения дополняется критическим анализом, где Codex ищет изъяны в логике, созданной Opus.

Процесс установки и настройки плагина

Добавление функционала требует выполнения последовательных команд в терминале и аутентификации через браузер.
Лимиты использования ресурсов привязаны к текущему тарифному плану пользователя в ChatGPT.

Установка начинается с добавления плагина в маркетплейс и выбора области действия (user scope). Команда codex:setup инициирует процесс входа в систему OpenAI. Вся документация и спецификации команд доступны в официальном GitHub-репозитории проекта.

Сценарии использования и состязательный аудит

Команда codex rescue позволяет передать выполнение готового плана модели Codex для экономии лимитов Opus.
Алгоритм аудита включает анализ контекста, сбор данных о неотслеживаемых файлах и формирование JSON-отчета с уровнем критичности находок.

При аудите кодовой базы Twitter-бота Codex проанализировал девять изменений в рабочем дереве и восемь неотслеживаемых файлов. Система выделяет конкретные векторы атак, такие как аутентификация и потеря данных. Результатом становится структурированный отчет с указанием точных строк кода и рекомендаций по исправлению.

Сравнение эффективности Opus и Codex

Codex выявил четыре критические проблемы в логике дедупликации и дрейфе схемы данных, которые пропустил Opus.
Совместное использование двух систем выгоднее перехода на более дорогие тарифные планы за 100-200 долларов.

Тестирование на реальном приложении показало, что Opus нашел семь уникальных ошибок, в то время как Codex обнаружил три специфических изъяна, не замеченных основной моделью. Единственным общим совпадением стала ошибка в обработке поллинга Telegram. Наличие двух разных «мнений» повышает общую надежность кода без кратного роста затрат на подписки.

Community Posts

Write about this video