别再只用 Claude Code 或 Codex 了

中文العربية Deutsch English Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский

컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00如果你试图在 Clod Code 或

00:00:03Codex 之间做出选择，那你就是在束缚自己。

00:00:05现在，Clod Code 已经主导了 AI 讨论好几个月了，

00:00:08这是因为 Clod Code 曾经

00:00:10与第二名之间的差距非常巨大。

00:00:14但 Codex 已经在悄无声息中缩小了这一差距。

00:00:17GPT 5.5 是一个非常惊人的模型，

00:00:20甚至可以说比 Opus 4.7 更好。

00:00:23OpenAI Pro 计划的额度限制

00:00:26比 Anthrovic 的 Max 计划要慷慨得多。

00:00:29是的，情况依然如此，

00:00:31即便他们把五小时限制翻倍了也是一样。

00:00:34顺便说一下，他们肯定没有把每周限制翻倍。

00:00:36而且 Codex 桌面应用程序确实是一个非常棒的产品。

00:00:41现在，这并不是说 Codex 比 Clod Code 更好，

00:00:44而是说你现在有了更多选择。

00:00:47最好的策略并不是坐在这里

00:00:48试图对比这两个优秀的选项中哪个更好，

00:00:51最好的策略是两者都用。

00:00:54对我们来说幸运的是，想兼顾两者的优势

00:00:57其实非常简单。

00:00:58只需几秒钟就能设置好 Codex 桌面版，

00:01:02并在其内部运行 Clod Code 终端。

00:01:05精通这两个工具也非常容易，

00:01:07因为 Codex 和 Clod Code 的交集

00:01:11基本上就是一个圆圈。

00:01:12它们有大约 99% 的重叠。

00:01:14所以如果你学会了其中一个，

00:01:16你就能很轻松地学会另一个。

00:01:18所以今天我会告诉大家

00:01:20如果你是一个打算尝试 Codex 的

00:01:21Clod Code 用户，

00:01:22你应该考虑些什么。

00:01:25我们将进行一个快速演示，

00:01:27我会展示如何协同使用这两个工具，

00:01:30然后我们会深入讨论

00:01:31为什么我认为你应该成为工具不可知论者，

00:01:34为什么我们不应该把自己限制在某一个编程智能体

00:01:38或某一家公司的生态系统中。

00:01:40因为老实说，

00:01:42你对这些公司不需要任何忠诚度。

00:01:45所以今天我们将重点关注 Codex 桌面版应用。

00:01:47虽然也有 Codex CLI，但在我的经验中，

00:01:51我发现想要兼顾两者的长处，

00:01:53最简单的办法是在 Codex 桌面应用中

00:01:56打开终端并运行 Clod Code，

00:01:59因为你可以在这个应用里打开终端。

00:02:02而且桌面版应用老实说

00:02:04有一些非常棒的生活品质提升功能，

00:02:05我会展示给你们看，比如内置浏览器

00:02:07之类的小功能。

00:02:08要使用它，你只需前往 [openai.com/codex](https://openai.com/codex)，

00:02:12安装程序只需要两秒钟就能搞定。

00:02:14现在我们来快速聊聊价格。

00:02:16总的来说，如果把这与 Anthropic 的产品对比，

00:02:18你会发现每一分钱都花得更有价值。

00:02:21很难进行某种一对一的精确对比，

00:02:24因为 Token 的成本不同。

00:02:26如果我们按每百万 Token 的成本来谈论 GPT 5.5，

00:02:29它实际上和 Opus 差不多，甚至稍微贵一点，

00:02:32但它消耗的 Token 更少。

00:02:34此外，用量限制取决于一天中的时段，

00:02:37有很多影响因素。

00:02:38所以这不像是一项那种一对一的

00:02:41详细对比，但从大局来看，

00:02:44你在 OpenAI 那里能得到更多。

00:02:46现在，有哪些需要注意的事项呢。

00:02:50有 GPT 5.5，也有 GPT 5.5 Pro。

00:02:54GPT 5.5 Pro 只有在你订阅了

00:02:57100 美元或 200 美元的 Pro 计划时才能使用。

00:03:00如果你订阅的是 20 美元及以下的计划，

00:03:02你只能直接使用 5.5。

00:03:05普通版 5.5 已经很出色了。

00:03:07GPT 5.5 Pro 显然又上了一个台阶，

00:03:09这个模型在某些基准测试中

00:03:12实际上已经击败了 Mythos。

00:03:14但如果你是一个从 Clod Code 转过来的人，

00:03:16你可能会想：我已经每月花 200 美元

00:03:18在 Clod Code 上了，我真的需要再花 100 美元订阅 Pro

00:03:21来获得完整的能力吗？

00:03:22我建议先从每月 20 美元的计划开始，

00:03:25先试个水，看看你喜不喜欢它。

00:03:27这并不冲突，如果你真的喜欢，

00:03:28随时可以升级到 100 美元的计划。

00:03:30就我个人而言，我目前订阅了 100 美元的 Pro，

00:03:33同时也订阅了 Anthropic 的 Max 计划。

00:03:36安装好 Codex 之后，打开它，

00:03:37你就会看到类似这样的界面。

00:03:39现在，在我们开始快速介绍

00:03:41你需要考虑的内容之前，

00:03:43先听听今天赞助商——也就是我本人的简短介绍。

00:03:46如你所知，我最近发布了一个 Clod Code 大师课，

00:03:48这是从零开始成为 AI 开发者的最快途径，

00:03:51特别是如果你没有技术背景的话。

00:03:54但就在昨天，我也同步发布了

00:03:56Codex 大师课。

00:03:59它适用于两类人群。

00:04:01一类是完全的新手，

00:04:02从未接触过任何编程相关的东西，

00:04:04但想要学习 Codex。

00:04:05另一类是针对你们中那些

00:04:07更有经验的人，

00:04:09你们一直在使用 Clod Code 编程，

00:04:10想弄清楚该如何转型，

00:04:12以及如何协同使用这两个工具。

00:04:15基本上，它涵盖了我们今天谈论的所有内容，且深度是 10 倍以上。

00:04:19所以如果你想获取该课程，

00:04:20以及我的智能体 OS 系统之类的内容，

00:04:23你可以在 Chase AI Plus 中找到它们，

00:04:27置顶评论中有相关链接。

00:04:29接下来我们将用五分钟时间

00:04:30快速浏览一遍 Codex，

00:04:32谈谈你需要考虑的事情

00:04:33以及一些主要的差异点。

00:04:35在 UI 方面，老实说它非常直观。

00:04:37非常有 ChatGPT 的风格，对吧？

00:04:40我们有提示词窗口。

00:04:42我可以添加照片和文件。

00:04:43我可以直接在这里切换“计划模式”。

00:04:46这里有权限设置，

00:04:47和 Clod Code 里的权限设置非常相似，

00:04:50我们可以选择“绕过权限”、“自动”

00:04:52等选项。

00:04:53我可以选择智能水平，也就是投入程度，

00:04:55以及在这里选择模型。

00:04:57我也可以非常快地看到

00:04:59我当前正在操作哪些文件夹。

00:05:01他们把这些称为“项目”。

00:05:02我可以在本地或云端工作。

00:05:05我可以处理不同的工作树，诸如此类。

00:05:07所以导航起来非常容易。

00:05:09现在让我们快速浏览一下设置选项卡。

00:05:11有常规选项和工作模式。

00:05:13你会想要开启“针对编程”模式。

00:05:15这会为你提供更多的技术细节。

00:05:17权限设置再次出现。

00:05:19这其实是在问：“你是否希望这些选项

00:05:20显示在你的面前？”

00:05:22答案是肯定的，

00:05:23因为你会想要一直开启“完全访问”。

00:05:25接着在常规选项中，

00:05:26大部分内容都只是

00:05:27关于环境设置本身的。

00:05:30你可能会注意到这里，

00:05:31“后续行为”：队列 vs. 引导。

00:05:34我们稍后会详细讨论这个。

00:05:36现在先保持在“队列”模式。

00:05:38外观设置正如你所预料的那样，

00:05:40但在下面你可以看到“宠物”，

00:05:42这听起来可能有点傻，

00:05:44但老实说非常实用，

00:05:46因为它们就像是一个视觉钩子，

00:05:48让你知道 Codex 是在后台运行

00:05:51还是已经准备好接收下一个指令了。

00:05:53就像这个小东西，对吧？

00:05:56它可以放在你电脑上的任何地方。

00:05:58它会置于你正在使用的任何程序之上。

00:06:00所以即使我关掉 Codex，

00:06:03我依然能看到我的小家伙。

00:06:06等下我们实际操作任务时你就会看到它。

00:06:08它会显示一串小文本，

00:06:09让你看到它正在忙什么。

00:06:10当它完成工作后，

00:06:12它就会像这样趴下。

00:06:13说实话，我非常喜欢这样的通知机制。

00:06:17比如用 Claude code 时，我设置了

00:06:19每次完成任务都会播放一段音频，

00:06:23因为在进行智能体编程时，我浪费的

00:06:27大部分时间其实都是因为

00:06:29在下达指令之后，

00:06:30我就切到别的窗口或走开了，没有及时回来。

00:06:32所以，随你用不用吧，这并不重要。

00:06:35接着是配置选项。

00:06:37他们有一些关于钩子的功能。

00:06:38看来我需要更新一下。

00:06:39这边是审批政策

00:06:41和沙盒设置。

00:06:42这和权限设置很像，只是属于全局层面的。

00:06:45然后在工作区依赖项这里，

00:06:48你会想要开启“Codex 依赖项”，

00:06:51默认应该是开启的。

00:06:52接着是个性化。

00:06:53你可以选择你的个性风格。

00:06:54注意，这不是 agents.md，也不是 claud.md。

00:06:59Codex 有它自己版本的 claud.md。

00:07:02它叫做 agents.md。

00:07:03同样，我们稍后会详细谈论这个。

00:07:06个性化功能有点类似，但并不完全一样。

00:07:09它更像是：“嘿，我希望你一直

00:07:11称呼我这个名字”之类的。

00:07:13还有记忆功能。

00:07:14这类似于 claud code 里的记忆功能，

00:07:17默认也是开启的。

00:07:18我通常会关掉这些。

00:07:19比如，如果我告诉 Codex：

00:07:22“嘿，我每周二都会去健身房”，

00:07:24到了周二我随口说一句：

00:07:26“我今天不知道该干什么。”

00:07:27它就会说：“哦对，你周二要去健身房。”

00:07:30老实说，我并不太在乎这些东西，

00:07:33但这取决于你。

00:07:34剩下的部分就是像 MCP 服务器、

00:07:37Git、环境、工作树之类的。

00:07:39这在某种程度上取决于，

00:07:40取决于你的技术水平，

00:07:42以及你想深入研究到什么程度。

00:07:43然后还有像浏览器使用和计算机使用之类的功能。

00:07:46关于计算机使用，你需要使用 Mac，

00:07:50而浏览器使用就正如其名。

00:07:54然后我们还有归档聊天和使用情况。

00:07:56所以这里没有太多需要摆弄的地方。

00:07:59你主要会使用“常规”选项，

00:08:01以及“外观”和“配置”。

00:08:03在顶部，我们有插件。

00:08:04Codex 拥有类似于 Claude code 的插件和技能。

00:08:08这两者之间的界限非常模糊。

00:08:11总的来说，插件几乎就像是技能包，

00:08:14或者是来自供应商本身、可以轻松安装的 MCP。

00:08:16比如安装 Supabase 就会安装一个 Supabase MCP

00:08:17和必需的技能。

00:08:21所以如果我现在打开一个聊天并说，

00:08:22“嘿，帮我在 Supabase 里打开或创建一个数据库”，

00:08:24它就能直接完成。

00:08:27所有这些插件都是如此，它还包括

00:08:28Chrome、电子表格和演示文稿等功能。

00:08:31而且它是点击即可安装的。

00:08:33然后我们的技能功能，运作方式几乎和 Claude code 一样。

00:08:35如果你刚打开 Codex，

00:08:38你可能会看到一个弹出窗口，写着类似这样的话：

00:08:40“嘿，我们注意到你拥有来自

00:08:42另一个编程智能体的所有这些技能。”

00:08:45“你想导入它们吗？”

00:08:46所以只需点击一下按钮，它就会导入

00:08:48来自 Claude code 或像 open code

00:08:51这类工具中的几乎所有内容。

00:08:53它能够识别你电脑上的这些内容。

00:08:55所以这也是让在这些工具之间

00:08:56切换变得非常容易的另一个原因。

00:08:59所以我会想，“天哪，”

00:09:00“我在 Claude code 上建立了一支技能大军。”

00:09:01“我不能离开它。”

00:09:03其实并非如此，你完全可以离开。

00:09:04它会自动把这些技能都投射到这里。

00:09:06要使用这些技能，你只需点击它们。

00:09:08你可以卸载它们。

00:09:11你可以开启或关闭它们。

00:09:12再次强调，这非常直观。

00:09:13你也可以在上面管理它们，

00:09:15非常容易地创建一个技能。

00:09:17它甚至还有自己的“技能创建者”技能。

00:09:19还有“自动化”标签页，

00:09:22类似于 Claude code 中的“常规任务” (routines)。

00:09:23它们这里有一些默认的选项。

00:09:25我们可以去这里自动创建一个新的自动化。

00:09:27你可以把它设置在工作树或本地。

00:09:30你可以把它放在特定的项目时间，诸如此类。

00:09:32你还拥有这样的能力，

00:09:36就像你在 Claude code 的终端里所做的一样，

00:09:37直接说，“嘿，让我们用 X、Y 和 Z 创建一个自动化。”

00:09:39它就会自动放进去，非常简单，

00:09:42在这里通过视觉点击进行操作非常直观。

00:09:45现在，关于浏览文件结构

00:09:47和你电脑上的空间，

00:09:50它的划分方式是“项目”和“聊天”。

00:09:52现在我可以进入一个叫 audit flow 的项目，

00:09:54这是我今天早些时候在处理的，

00:09:58或者我可以添加一个新项目，或者直接说，

00:10:00点击这里，我就进入了一个新聊天。

00:10:02新聊天并不真的在任何特定文件夹里。

00:10:04这就像是身处 Claude code 桌面版

00:10:07的聊天窗口里一样。

00:10:09就像我正把它当成 ChatGPT 在聊天。

00:10:11如果我想在特定文件夹中工作，

00:10:14或者我想启动一个新项目，

00:10:16我们要去“项目”选项。

00:10:17操作非常简单，你可以点击这里。

00:10:19你可以从零开始，它会在你设置的

00:10:22默认位置创建一个新文件夹。

00:10:24我通常只选择“使用现有文件夹”，

00:10:26这样我可以更具体地确定

00:10:28我想去哪里。

00:10:31在这里，我们新建文件夹，

00:10:33我们把它命名为 YouTube demo codex 之类的。

00:10:36然后，是的，“你想导入一些设置吗？”

00:10:40当然，就这么办吧。

00:10:43正在导入我最近在 Claude code 中所做的设置更改。

00:10:44现在你可以看到，我已经在 YouTube demo codex 目录下了。

00:10:47我们正在本地的主分支 (main branch) 上工作。

00:10:52你也可以在“项目”这边看到这些。

00:10:54我可以打个招呼，“嘿，最近怎么样？”

00:10:56然后你现在就能在下面看到那个聊天了。

00:10:59现在的这个聊天窗口几乎

00:11:05等同于打开了一个终端窗口，

00:11:07因为我可以留在同一个项目里。

00:11:08如果我点击顶部的“开始新聊天”，说声“你好”，

00:11:10我现在就打开了两个聊天窗口，

00:11:15这在实质上

00:11:18和我打开两个终端是一模一样的，对吧？

00:11:20同样的过程，在同一个文件夹中打开，

00:11:24各忙各的，

00:11:27但仍然在处理同一个项目。

00:11:28它们之间可以看到彼此的所有内容，

00:11:29但在这种 UI 界面下，

00:11:31非常容易追踪进度。

00:11:34我还可以点击任何一个聊天。

00:11:35我可以复制它们，复刻 (fork) 到本地，

00:11:36复刻到新的工作树，重命名，置顶，

00:11:38随心所欲。我也可以非常容易地点击项目

00:11:40右边的三个点，在资源管理器中打开它。

00:11:41所以，实际上导航聊天、

00:11:43导航你的文件系统，并在脑海中构建出

00:11:46文件在机器上的位置模型，

00:11:49这都非常容易实现。

00:11:51说实话，这就是 Codex 桌面应用的大致情况。

00:11:53这里还有很多其他酷炫的功能，对吧？

00:11:54你可以看到分支详情，

00:11:58很容易执行 Git 操作，

00:12:00不过刚才说的这些基本上就是核心部分了，对吧？

00:12:01我刚才告诉你的这些，你已经可以使用了。

00:12:03你可以构建任何你想构建的东西。

00:12:05我们早些时候谈到过，

00:12:08嘿，你可以在这里面使用终端，

00:12:09就在右上方，对吧？

00:12:11切换终端，砰，终端就出来了。

00:12:13它就在我的 YT demo codex 项目里。

00:12:14然后我们就可以运行 Claude，砰。

00:12:17我现在在同一个项目中同时开启了 Claude code 和 Codex。

00:12:20现在，关于让它们互相配合，

00:12:25有几种方法可以实现。

00:12:28第一，我们可以，也就是我们现在要做的事，

00:12:30是让它为我们创建某种小型 Web 应用。

00:12:31我可以先在 Codex 里做一个规划，然后把规划

00:12:33复制到 Claude code，看看它怎么说，

00:12:36就像这样来回复制粘贴。

00:12:38或者我可以让 Codex 构建一些东西，

00:12:40然后让 Claude code 实际去查看代码，

00:12:43因为它们在同一个目录下，

00:12:44弄清楚代码说的是什么。

00:12:46我确信实际上有比这更高级

00:12:48且简单的方法，

00:12:50你可以自动设置一些联动。

00:12:51我还没怎么尝试过那个。

00:12:53关键在于基础设施已经准备就绪，非常容易操作。

00:12:55我们拥有了两个世界中最好的部分。

00:12:56那么让我们做一个简单的演示，

00:13:01来测试一下它的性能。

00:13:03我们将让它创建一个

00:13:05内容/研究、构思类型的 Web 应用。

00:13:07第一部分需要能够从一堆来源中提取信息，

00:13:12并给我们一些可能的点子。

00:13:16第二部分，我希望它能合成

00:13:18它抓取到的所有信息，并想出内容创意。

00:13:21然后第三部分，

00:13:24让我们在底部创建一个类似小型进度表的工具，

00:13:27可能像一个微型看板，来跟踪我们的点子。

00:13:29所以它需要能够研究、构思，

00:13:30然后实际组织所有这些数据。

00:13:32让我们看看它表现如何。

00:13:34我们将从 Codex 开始。

00:13:36首先把它调到规划模式。

00:13:38此外，在调用技能和类似操作方面，

00:13:39也几乎是一样的。

00:13:40你可以输入正斜杠，

00:13:42然后调用某个特定技能。

00:13:47如果我说“前端设计技能”，

00:13:48砰，就在那里。

00:13:50或者我也可以用 @ 符号。

00:13:53比如输入 @ 电子表格。

00:13:55所以现在它就在使用电子表格插件。

00:13:56我也可以直接使用自然语言。

00:13:58就像 Claude code 一样，它应该能领会，

00:14:00但使用斜杠命令和 @ 命令，

00:14:03就是你指向不同功能的方式。

00:14:05指向特定的文件或文件夹，

00:14:07也是同样的操作方式。

00:14:10还有一件事，关于上下文，需要注意，

00:14:115.5 Pro 拥有 258K 的上下文窗口，

00:14:15而 Claude code 是一百万。

00:14:17我的看法是，这并不完全是件坏事。

00:14:20因为大多数人根本不知道

00:14:25如何管理他们自己的上下文。

00:14:28他们生活在原始上下文的地狱里。

00:14:31而 258K 几乎让你不可能

00:14:33长时间处于那种混乱状态。

00:14:35当你达到 258K 时它会有自动压缩功能，

00:14:37而自动压缩本身也有一系列问题，

00:14:40尤其是当我们开始一遍又一遍地压缩同一段对话时。

00:14:41但正如我刚才展示给你的，

00:14:44执行等同于正斜杠 clear 的操作

00:14:47其实就是开始一个新聊天，对吧？

00:14:49因为我基本上只是开启了一个新的会话。

00:14:50所以上下文容量是一个细微的差别。

00:14:52让我们给它一个问题，看看它怎么说。

00:14:54所以我想创建一个 Web 应用，

00:14:59主要做三件事。

00:15:01理想情况下，你可以在同一个页面上完成所有操作。

00:15:04一方面，我希望它能查看过去 24 小时内，

00:15:07各大主流网络资源中的 AI 新闻，

00:15:10以及像 YouTube 或 Twitter (X) 上的内容。

00:15:13然后我希望它能将其整合到一份报告中。

00:15:15一方面，我希望它能查看 AI 新闻

00:15:18在过去的 24 小时内，涵盖主要的网络来源

00:15:22以及像 YouTube 或 Twitter 之类的内容。

00:15:25然后我希望它能将这些信息整合到一份报告中。

00:15:29第二，我希望它能根据所有这些信息

00:15:31为我提供潜在的内容创意。

00:15:33比如标题应该叫什么？

00:15:34大致的大纲是什么？

00:15:36可以是那种项目符号的格式

00:15:38以及一些吸引人的开头。

00:15:39最后，我想让它具有某种调度程序的功能，

00:15:42也许像一个小型的看板

00:15:44在那里我可以操作，

00:15:46比如，“好，让我们把你刚才想到的那个点子

00:15:48安排在今天执行。”

00:15:49下一个点子我们可以明天做，类似这样。

00:15:52所以让我们来梳理一下并进行规划。

00:15:54现在我们将进入它的“计划模式”。

00:15:55计划模式基本上和 Claude Code 一模一样。

00:15:57它会进行思考。

00:15:58它会问你一系列问题。

00:16:01我注意到 5.5 Pro 在设置为 Extra High 时，

00:16:05它倾向于问相当多的问题，

00:16:08但也可能只是因为我当时正在做的项目。

00:16:10而在速度方面，

00:16:13它有点，

00:16:15我想它可能比 Opus 稍微慢一点。

00:16:18虽然我没有硬性的数据来支持这一点。

00:16:21这只是目前为止的使用感觉。

00:16:22与此同时，

00:16:23如果我只是进行来回的聊天，

00:16:255.5 感觉比 Opus 要流畅得多。

00:16:28所以如果它在执行大量的工具调用，会慢一点，

00:16:31如果只是纯聊天，速度非常快。

00:16:33这就是 Codex 想出的计划。

00:16:35构建一个全新的、单用户的本地 Web 应用程序，

00:16:38使用 Next.js、TypeScript 和 SQLite。

00:16:40该应用将有一个主仪表盘，包含三个流程：

00:16:43收集过去 24 小时的 AI 动态，

00:16:45生成简洁的报告以及 YouTube 视频创意，

00:16:48并将选定的创意安排在小型看板上。

00:16:50不使用付费 API，采用精心挑选的 RSS 源

00:16:54和本地的 Ollama 生成。

00:16:55于是 Claude Code 回复了。

00:16:58它说计划很扎实，但还存在一些差距，

00:17:00看看它是否有其他想法或任何盲点。

00:17:04所以我说，Codex 为我们的应用制定了这个计划。

00:17:06你觉得怎么样？还缺少什么吗？

00:17:08然后 Claude Code 回复了。

00:17:09它说计划很扎实，但也有一些空白，

00:17:12一些软性的担忧以及一些吹毛求疵的建议。

00:17:14所以我打算回到 Codex，

00:17:17把这些反馈粘贴进去并直接问，

00:17:18“你觉得这个建议怎么样？”

00:17:22然后提交。

00:17:25现在，我们可以继续这样无限地来回讨论下去。

00:17:30但为了节省时间，我们就停在这里。

00:17:32关键在于，我们现在有了第二双眼睛

00:17:35来审视 AI 构思出来的计划到底是什么样的。

00:17:38我认为这超级重要，

00:17:40尤其是如果你是那种，

00:17:41没有技术背景的人，对吧？

00:17:43因为问题在于你去问 AI，你有一个点子，

00:17:47它给了你一个计划。

00:17:48如果你根本不知道正确的应该是什么样子，

00:17:51你可能只会觉得，“太棒了哥们，给力，去干吧。”

00:17:55而它可能遗漏了一大堆东西。

00:17:57现在我们试图通过这些方式来规避这一点，

00:17:58比如问更多的问题，更彻底地检查，

00:18:01问诸如“我还没考虑到什么？”

00:18:03“专家会问什么？”之类的问题。

00:18:05好的，这样确实说得通。

00:18:10多位 AI 专家都告诉我这是一个可靠的计划。

00:18:11甚至 Codecs 也说，

00:18:13所以，就算没别的作用，它至少能给你

00:18:16那种内心踏实的感觉，觉得，

00:18:17“好吧，这确实说得通。”

00:18:20“多个 AI 专家都告诉我这是一个扎实的计划。”

00:18:24Codex 甚至说，

00:18:25“我同意那份评论的主要诊断。”

00:18:26“原始计划可以可靠地总结发生的事情，”

00:18:29“但你实际描述的产品”

00:18:30“需要确定今天值得制作成视频的内容。”

00:18:33“这需要趋势信号、排名，”

00:18:35“和竞争对手饱和度检查，而不不仅仅是摄取信息。”

00:18:38所以它正在对计划进行一些修改，

00:18:40我们就在第一轮之后直接执行。

00:18:42显然，这种双模型方法

00:18:44是可以应用到你项目的任何部分的。

00:18:47所以这是更新后的新计划。

00:18:49正如我所说，为了节省时间，

00:18:50我们将在第一轮之后就执行它。

00:18:5323 分 21 秒。

00:18:54它说已经实现了完整的本地 AI 趋势规划器。

00:18:58内容已经就位，它浏览了一遍关键文件，

00:19:00验证通过，它创建了一个 README。

00:19:04我可以点击 README，你可以看到这个，

00:19:06就像是在应用内部看到的一样。

00:19:08所以你可以看到它实际上写了什么

00:19:10然后它显示了所有不同的文件。

00:19:12如果我点击所有文件，

00:19:15它会快速显示出它创建的内容。

00:19:18显然它还没有删除任何东西，

00:19:19因为这是第一轮，但它也会显示相关信息。

00:19:22如果我点击任何这些文件，

00:19:24我也可以在 review 中显示它。

00:19:26进入 review 后，有一个类似 diff 浏览器。

00:19:29我可以在这里执行一些 git 操作，我只是觉得，

00:19:33能看到它实际执行了什么是很容易的。

00:19:36同样，我喜欢终端。

00:19:37你可能也喜欢终端，

00:19:38但终端确实有一些局限性，

00:19:40相比于能在一个地方看到所有东西

00:19:42这种便利性因素而言。

00:19:44所以在让 Claude Code 来看之前，

00:19:45我们先说，为我启动开发服务器

00:19:49并在侧边栏浏览器中打开它。

00:19:54我觉得我打字真的变得

00:19:57非常糟糕，因为我用了太多的 AI，

00:20:00而且在过去的一年里一直在使用语音听写。

00:20:02我实际上已经完全失去了

00:20:04打出哪怕一个没有任何错误的句子的能力。

00:20:07所以它要做的是启动开发服务器，

00:20:11然后它会在应用内浏览器中

00:20:14向我们展示实际的网页，这很不错。

00:20:16现在我们可以在浏览器中看到网页了。

00:20:18我会移到这边，这样你更容易看到。

00:20:21这就是它创建的东西。

00:20:23我们有 AI 趋势规划器。

00:20:26我们可以运行扫描。

00:20:27我们可以摄取内容，报告创意。

00:20:29总的来说，我认为对于第一轮来说，

00:20:32它采用了这种，我想这是一种

00:20:35野兽主义（brutalist）风格的处理方式。

00:20:37我觉得看起来挺不错的。

00:20:39我的意思是，我挺喜欢的，不知道你怎么想。

00:20:40反正现在到处都是 AI 的流水线产物，对吧？

00:20:43但这个小型看板，我能拖动这些吗？

00:20:46不行，不能拖动。

00:20:48希望能做到那一点。

00:20:50信号源，来源，好的。

00:20:55表面上看，我不确定这些是否真的有效，

00:20:58但在初始阶段看起来还不错。

00:21:02让我们看看如果我运行全量扫描会发生什么，

00:21:05正在获取来源。

00:21:08在它运行的同时，我们该做什么呢？

00:21:11嗯，我们应该让 Claude Code 来看看

00:21:12它的工作成果。

00:21:13嘿，你能看看 Codex 为我们的应用

00:21:17在第一轮构建的内容吗？

00:21:21有没有什么明显的弱点，或者你想改变的地方？

00:21:25根据我的理解，一切都应该

00:21:28连接妥当并正常工作，但你是否看到任何

00:21:31不知何故溜掉的问题？

00:21:34好吧，它说 Ollama 甚至都没能运行。

00:21:36所以我们可能需要解决 Ollama

00:21:38那方面的问题，但现在就开始吧。

00:21:42整体看起来很酷。

00:21:42显然我们也可以通过

00:21:44本地浏览器访问这个页面。

00:21:46我们可以在这里做的一件事，有点让人联想到

00:21:48像云设计之类的东西，就是你可以标注某些东西

00:21:52或者留下评论。

00:21:53所以我可以高亮这一块，留下评论，

00:21:58然后说类似“我们能把这个改成斜体吗？”之类的话。

00:22:03然后它就会生成一个

00:22:10这里的标注，我可以添加后续的修改建议

00:22:13或者我现在就发送它。

00:22:15然后你就拥有了

00:22:17对任何你想要的东西进行标注的能力。

00:22:20你也可以快速截个图。

00:22:22我截个图，然后我可以把它贴在那儿。

00:22:24所以它也让这类前端设计评审

00:22:28和迭代变得容易得多。

00:22:30瞧，现在我们有了斜体。

00:22:33噢，Codex 在开头确实告诉过我，

00:22:35但我太懒了，甚至都没读它，

00:22:36就是说：嘿，要使用本地 AI 生成，请运行 Ollama poll，

00:22:40Ollama 3.18 或者将 Ollama 模型设置为你已有的模型。

00:22:43我的电脑上确实有几个模型。

00:22:45所以我们就说，嘿，你能找到它吗？

00:22:47嘿，我很确定我的机器上

00:22:51已经有几个 Ollama 模型了。

00:22:52你能查看一下具体是哪几个

00:22:55然后正确地把它们连接起来吗？

00:22:57另外，让我们检查一下这些链接是否真的有效。

00:23:00它说“AI 废话（Slop）正在扼杀在线社区”，

00:23:03来自 Y Combinator。

00:23:05让我们复制一下。

00:23:06是的，没问题，这是真的链接。

00:23:08非常酷。

00:23:09那么在下面，Claude 的评审结果出来了。

00:23:12它说它发现了几个真实的 Bug，

00:23:15并带回了 20 个新 Bug。

00:23:19然后它说，底线是，接线是正确的。

00:23:22管线流程是端到端的，那些 Bug 会很快浮现，

00:23:27然后还有一些时间戳问题，

00:23:30竞争对手自我预警以及它提到的一些其他东西。

00:23:32所以，你知道，相当不错。

00:23:34我是说，20 件事。

00:23:36我也在想，如果告诉 Claude 代码是由 Codex 编写的，

00:23:39它是否会变得更具对抗性，

00:23:42我很期待这种效果。

00:23:43实际上，这完全可以作为一项技能来实现。

00:23:45考虑到 Claude Code 中 Codex 插件

00:23:48本身就有一项技能，

00:23:50名为“对抗性审查”。

00:23:51Codex 随后意识到我电脑上有 GLM 4.7 Flash，

00:23:55于是连接了它，

00:23:56并重新运行了趋势报告。

00:23:59你们可以在这里看到。

00:24:00这是一份基于抓取的

00:24:02所有信息的正式报告。

00:24:04我可以看看这些视频创意。

00:24:05比如“为什么 AI 废话正在摧毁在线社区”，

00:24:07我点击“明天”。

00:24:09看看它是否真的会放在那里。

00:24:15看起来不太行，似乎卡住了。

00:24:18那就让 Claude Code 来修复一下。

00:24:21嘿，当我点击其中一个视频创意时，

00:24:24例如“为什么 AI 废话正在摧毁在线社区”。

00:24:28如果我点击“明天”，只会出现一个进度条，

00:24:32并没有发生实际的操作。

00:24:33我们能修复这个问题吗？

00:24:35其次，目前的看板，

00:24:37我无法在上面移动任务卡片。

00:24:41一旦它们进入特定位置，比如“收件箱”，

00:24:43我就无法将它们移到“今天”或“明天”等等。

00:24:45不管怎样，

00:24:46我认为这就是两者协作的方式。

00:24:48来回配合。

00:24:50就像你在这里看到的，

00:24:50你可以让它们同时

00:24:52处理同一个任务。

00:24:53如果你觉得 Codex 搞不定，

00:24:55可以把任务交给 Claude Code。

00:24:57我认为它们可以互相弥补

00:24:59彼此的弱点。

00:25:01通常我会说，在前端设计

00:25:03以及整体设计方面，

00:25:05Claude Code 往往比 Codex 表现得更好。

00:25:08但说实话，我挺喜欢

00:25:11它第一轮生成的样子的。

00:25:12所以，虽然我可以演示

00:25:15让 Claude 处理前端设计，

00:25:17虽然这里确实还有改进空间，

00:25:19但我认为它已经做得很不错了。

00:25:21我真正想通过这个演示展示的，

00:25:23是设置过程是多么简单。

00:25:26以及像 Claude Code 发现问题的能力，

00:25:29它在第一轮就发现了 20 个 Codex

00:25:34没有察觉到的潜在漏洞。

00:25:35我认为让它们在项目中

00:25:38反反复复互相检查，

00:25:41这种复利效应随着时间的推移是物超所值的。

00:25:45虽然在最开始时，

00:25:47我们会消耗大量 Token 来做这件事，但长远来看，

00:25:49如果我们能及早抓住这些漏洞，

00:25:52并立刻找出这些薄弱环节，

00:25:54总的来说，你实际上节省了 Token。

00:25:57当然，我们也可以随时

00:25:59在常用的浏览器中打开它。

00:26:01看起来它成功修复了看板上的导航功能。

00:26:06看板上的导航问题。

00:26:07最后，我想快速谈谈

00:26:09关于“工具中立”的大思路，

00:26:12因为我觉得很多人，

00:26:14他们自认为：哦，我是工具中立的。

00:26:16如果有比 Opus 更好的工具，

00:26:18我明天就会换成最好的，

00:26:19或者如果有比 GPT 5.5

00:26:21更好的其他工具，我也会换。

00:26:23人们只是这么想，但实际上，

00:26:25他们并不会真的这么做。

00:26:26现实情况是，你习惯了一个工具，

00:26:29陷入了使用它的习惯中。

00:26:31然后对很多人来说，

00:26:33你会变得有一种莫名的“部落主义”，

00:26:35就像是：不，我是 Anthropic 的粉丝，

00:26:37我是 Cursor 的死忠，我讨厌 OpenAI，

00:26:40我讨厌 Sam Altman，或者是完全反过来，

00:26:43搞得好像它们是某支运动队一样。

00:26:46你不应该在意这些。

00:26:48你真的不应该在意。

00:26:49你应该随时愿意切换。

00:26:51而且切换其实很容易，

00:26:52只要你持续地使用所有工具并配合使用，

00:26:56因为我觉得我们正处于这样一个阶段，

00:26:58而且情况只会变得更复杂，那就是：

00:27:00哪个模型最好，这并不那么显而易见，

00:27:03因为，第一，我们中有一半人甚至不买账

00:27:06他们推销的那些基准测试数据，

00:27:08第二，它们都在趋同，

00:27:09都变得非常、非常优秀。

00:27:11而且它们变得越好，

00:27:13就越能轻易超越

00:27:15普通人正在做的事情。

00:27:1799% 的人所做的普通项目，

00:27:19现有的模型都能搞定。

00:27:21那我们要用五年后

00:27:22存在的模型去做什么呢？

00:27:25所以我觉得，从长远来看，

00:27:29如果你让他们相互竞争，你会走得更远，

00:27:31而不是纠结于：我是 Cursor 派，

00:27:33或者我是 Codex 派。

00:27:34对我们来说幸运的是，他们还没建立起

00:27:36那种封闭的“围墙花园”，

00:27:37我可以同时与两者交互。

00:27:39如果说有什么变化，那就是他们让交互

00:27:40变得非常简单了，

00:27:42比如 Codex 开发了 Cursor 插件，

00:27:44还有导入技能文件

00:27:46之类的能力。

00:27:47所以我认为我们正处于 AI 的黄金时代，

00:27:51尽管人们喜欢对此唱衰，

00:27:53说什么：哦，价格在上涨。

00:27:54我觉得现实是，我们的处境非常好，

00:27:56而且只会越来越好，

00:27:57如果你利用所有可用的工具，

00:27:59你的处境会变得更好。

00:28:02这就是我今天要分享的内容。

00:28:03我希望你们能从中有所收获。

00:28:05一如既往，请告诉我你们的想法。

00:28:07如果你想看我的 Cursor

00:28:08和 Codex 大师课，

00:28:10请务必关注 Chase AI+。

00:28:12除此之外，我们回头见。

Key Takeaway

通过在 Codex 桌面应用中运行 Claude Code 终端，开发者可以利用 GPT 5.5 更高效的 Token 消耗与 Claude 卓越的设计审查能力实现双模型协同，从而及早发现单模型漏掉的 20 多个 Bug 并优化开发流程。

Highlights

GPT 5.5 模型在性能上已超越 Opus 4.7，且其 OpenAI Pro 计划的额度限制优于 Anthropic 的 Max 计划。
Codex 桌面应用能够自动识别并一键导入 Claude Code 或 Open Code 等工具中已有的 99% 编程技能。
在 Codex 桌面应用内运行 Claude Code 终端，可实现两个编程智能体对同一项目文件的实时协同操作。
GPT 5.5 Pro 拥有 258K 上下文窗口并具备自动压缩功能，其性能在特定基准测试中优于 Mythos。
通过双模型对抗性审查，Claude Code 在第一轮测试中发现了 Codex 未察觉的 20 个潜在漏洞与 Bug。
Codex 桌面版内置了可视化“宠物”通知机制，通过视觉钩子反馈智能体是在后台运行还是已完成指令。

Timeline

打破单一生态系统的限制

GPT 5.5 的惊人性能已缩小与 Opus 4.7 之间的差距。
OpenAI Pro 计划提供的用量限制比 Anthropic 的 Max 计划更慷慨。
Codex 与 Claude Code 在功能上有 99% 的重叠，学会其中一个即可轻松上手另一个。

目前 AI 编程领域不再是单方主导，GPT 5.5 的出现让 OpenAI 重新获得竞争力。开发者不应受限于特定公司的生态系统，而应采取工具中立的态度。将两者结合使用的成本并不高，且设置过程仅需几秒钟。

Codex 桌面版核心功能与配置

GPT 5.5 Pro 仅提供给订阅 100 美元或 200 美元计划的用户，普通 20 美元计划仅限使用标准版 5.5。
可视化“宠物”功能作为通知机制，能直观显示智能体当前的工作状态。
258K 的上下文窗口限制强制实施了更有效的上下文管理，避免进入原始上下文混乱状态。

Codex 界面直观且具有类似 ChatGPT 的交互风格，支持本地和云端项目管理。它提供了针对编程的专用模式，可以输出更多技术细节。内置的个性化记忆功能可以记录用户偏好，但开发者可根据需求选择开启或关闭以优化性能。

技能导入与自动化工作流

Codex 能够自动检测并导入来自其他编程智能体（如 Claude Code）的现有技能。
插件系统支持一键安装 Supabase、Chrome 及电子表格等 MCP 服务器。
自动化标签页支持在特定项目时间或工作树上设置常规任务。

技能系统的兼容性极大降低了迁移成本，开发者在 Claude Code 中积累的技能库可以直接投射到 Codex 中。通过点击即可安装的插件，Codex 能直接与外部数据库和办公软件交互。UI 界面支持同时开启多个聊天窗口，效果等同于开启多个终端并行处理同一项目。

双模型协同开发实战演示

在同一目录下运行双模型可以实现“第二双眼睛”的审视效果，防止 AI 计划遗漏关键环节。
Claude Code 具备强大的“对抗性审查”能力，在初次构建后指出了 20 个功能漏洞。
Codex 的内置浏览器支持对前端界面进行标注、截图和实时评论，简化了 UI 迭代流程。

通过创建一个 AI 趋势规划 Web 应用的案例，展示了如何让 Codex 负责初始规划，再由 Claude Code 提供反馈。Claude 指出了 Ollama 连接、时间戳及任务移动等多个具体 Bug。这种相互竞争与检查的机制虽然初期消耗更多 Token，但因及早修复薄弱环节，长远来看反而更节省资源。

工具中立主义的长期价值

模型性能正在趋同，现有的顶级模型均能胜任 99% 的普通项目。
各大厂商尚未建立封闭的“围墙花园”，跨工具交互依然非常简单。
拒绝工具“部落主义”并随时愿意切换到更好的工具是 AI 黄金时代的生存法则。

许多用户容易陷入对特定品牌的忠诚陷阱，但这会阻碍技术进步。由于 Codex 甚至开发了针对竞争对手 Cursor 的插件，目前利用所有可用工具才是最优解。随着模型性能的提升，开发者应专注于如何通过多模型协作来超越普通人的产出质量。

Community Posts

Write about this video