别再只用 Claude Code 或 Codex 了

CChase AI
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00如果你试图在 Clod Code 或
00:00:03Codex 之间做出选择,那你就是在束缚自己。
00:00:05现在,Clod Code 已经主导了 AI 讨论好几个月了,
00:00:08这是因为 Clod Code 曾经
00:00:10与第二名之间的差距非常巨大。
00:00:14但 Codex 已经在悄无声息中缩小了这一差距。
00:00:17GPT 5.5 是一个非常惊人的模型,
00:00:20甚至可以说比 Opus 4.7 更好。
00:00:23OpenAI Pro 计划的额度限制
00:00:26比 Anthrovic 的 Max 计划要慷慨得多。
00:00:29是的,情况依然如此,
00:00:31即便他们把五小时限制翻倍了也是一样。
00:00:34顺便说一下,他们肯定没有把每周限制翻倍。
00:00:36而且 Codex 桌面应用程序确实是一个非常棒的产品。
00:00:41现在,这并不是说 Codex 比 Clod Code 更好,
00:00:44而是说你现在有了更多选择。
00:00:47最好的策略并不是坐在这里
00:00:48试图对比这两个优秀的选项中哪个更好,
00:00:51最好的策略是两者都用。
00:00:54对我们来说幸运的是,想兼顾两者的优势
00:00:57其实非常简单。
00:00:58只需几秒钟就能设置好 Codex 桌面版,
00:01:02并在其内部运行 Clod Code 终端。
00:01:05精通这两个工具也非常容易,
00:01:07因为 Codex 和 Clod Code 的交集
00:01:11基本上就是一个圆圈。
00:01:12它们有大约 99% 的重叠。
00:01:14所以如果你学会了其中一个,
00:01:16你就能很轻松地学会另一个。
00:01:18所以今天我会告诉大家
00:01:20如果你是一个打算尝试 Codex 的
00:01:21Clod Code 用户,
00:01:22你应该考虑些什么。
00:01:25我们将进行一个快速演示,
00:01:27我会展示如何协同使用这两个工具,
00:01:30然后我们会深入讨论
00:01:31为什么我认为你应该成为工具不可知论者,
00:01:34为什么我们不应该把自己限制在某一个编程智能体
00:01:38或某一家公司的生态系统中。
00:01:40因为老实说,
00:01:42你对这些公司不需要任何忠诚度。
00:01:45所以今天我们将重点关注 Codex 桌面版应用。
00:01:47虽然也有 Codex CLI,但在我的经验中,
00:01:51我发现想要兼顾两者的长处,
00:01:53最简单的办法是在 Codex 桌面应用中
00:01:56打开终端并运行 Clod Code,
00:01:59因为你可以在这个应用里打开终端。
00:02:02而且桌面版应用老实说
00:02:04有一些非常棒的生活品质提升功能,
00:02:05我会展示给你们看,比如内置浏览器
00:02:07之类的小功能。
00:02:08要使用它,你只需前往 [openai.com/codex](https://openai.com/codex),
00:02:12安装程序只需要两秒钟就能搞定。
00:02:14现在我们来快速聊聊价格。
00:02:16总的来说,如果把这与 Anthropic 的产品对比,
00:02:18你会发现每一分钱都花得更有价值。
00:02:21很难进行某种一对一的精确对比,
00:02:24因为 Token 的成本不同。
00:02:26如果我们按每百万 Token 的成本来谈论 GPT 5.5,
00:02:29它实际上和 Opus 差不多,甚至稍微贵一点,
00:02:32但它消耗的 Token 更少。
00:02:34此外,用量限制取决于一天中的时段,
00:02:37有很多影响因素。
00:02:38所以这不像是一项那种一对一的
00:02:41详细对比,但从大局来看,
00:02:44你在 OpenAI 那里能得到更多。
00:02:46现在,有哪些需要注意的事项呢。
00:02:50有 GPT 5.5,也有 GPT 5.5 Pro。
00:02:54GPT 5.5 Pro 只有在你订阅了
00:02:57100 美元或 200 美元的 Pro 计划时才能使用。
00:03:00如果你订阅的是 20 美元及以下的计划,
00:03:02你只能直接使用 5.5。
00:03:05普通版 5.5 已经很出色了。
00:03:07GPT 5.5 Pro 显然又上了一个台阶,
00:03:09这个模型在某些基准测试中
00:03:12实际上已经击败了 Mythos。
00:03:14但如果你是一个从 Clod Code 转过来的人,
00:03:16你可能会想:我已经每月花 200 美元
00:03:18在 Clod Code 上了,我真的需要再花 100 美元订阅 Pro
00:03:21来获得完整的能力吗?
00:03:22我建议先从每月 20 美元的计划开始,
00:03:25先试个水,看看你喜不喜欢它。
00:03:27这并不冲突,如果你真的喜欢,
00:03:28随时可以升级到 100 美元的计划。
00:03:30就我个人而言,我目前订阅了 100 美元的 Pro,
00:03:33同时也订阅了 Anthropic 的 Max 计划。
00:03:36安装好 Codex 之后,打开它,
00:03:37你就会看到类似这样的界面。
00:03:39现在,在我们开始快速介绍
00:03:41你需要考虑的内容之前,
00:03:43先听听今天赞助商——也就是我本人的简短介绍。
00:03:46如你所知,我最近发布了一个 Clod Code 大师课,
00:03:48这是从零开始成为 AI 开发者的最快途径,
00:03:51特别是如果你没有技术背景的话。
00:03:54但就在昨天,我也同步发布了
00:03:56Codex 大师课。
00:03:59它适用于两类人群。
00:04:01一类是完全的新手,
00:04:02从未接触过任何编程相关的东西,
00:04:04但想要学习 Codex。
00:04:05另一类是针对你们中那些
00:04:07更有经验的人,
00:04:09你们一直在使用 Clod Code 编程,
00:04:10想弄清楚该如何转型,
00:04:12以及如何协同使用这两个工具。
00:04:15基本上,它涵盖了我们今天谈论的所有内容,且深度是 10 倍以上。
00:04:19所以如果你想获取该课程,
00:04:20以及我的智能体 OS 系统之类的内容,
00:04:23你可以在 Chase AI Plus 中找到它们,
00:04:27置顶评论中有相关链接。
00:04:29接下来我们将用五分钟时间
00:04:30快速浏览一遍 Codex,
00:04:32谈谈你需要考虑的事情
00:04:33以及一些主要的差异点。
00:04:35在 UI 方面,老实说它非常直观。
00:04:37非常有 ChatGPT 的风格,对吧?
00:04:40我们有提示词窗口。
00:04:42我可以添加照片和文件。
00:04:43我可以直接在这里切换“计划模式”。
00:04:46这里有权限设置,
00:04:47和 Clod Code 里的权限设置非常相似,
00:04:50我们可以选择“绕过权限”、“自动”
00:04:52等选项。
00:04:53我可以选择智能水平,也就是投入程度,
00:04:55以及在这里选择模型。
00:04:57我也可以非常快地看到
00:04:59我当前正在操作哪些文件夹。
00:05:01他们把这些称为“项目”。
00:05:02我可以在本地或云端工作。
00:05:05我可以处理不同的工作树,诸如此类。
00:05:07所以导航起来非常容易。
00:05:09现在让我们快速浏览一下设置选项卡。
00:05:11有常规选项和工作模式。
00:05:13你会想要开启“针对编程”模式。
00:05:15这会为你提供更多的技术细节。
00:05:17权限设置再次出现。
00:05:19这其实是在问:“你是否希望这些选项
00:05:20显示在你的面前?”
00:05:22答案是肯定的,
00:05:23因为你会想要一直开启“完全访问”。
00:05:25接着在常规选项中,
00:05:26大部分内容都只是
00:05:27关于环境设置本身的。
00:05:30你可能会注意到这里,
00:05:31“后续行为”:队列 vs. 引导。
00:05:34我们稍后会详细讨论这个。
00:05:36现在先保持在“队列”模式。
00:05:38外观设置正如你所预料的那样,
00:05:40但在下面你可以看到“宠物”,
00:05:42这听起来可能有点傻,
00:05:44但老实说非常实用,
00:05:46因为它们就像是一个视觉钩子,
00:05:48让你知道 Codex 是在后台运行
00:05:51还是已经准备好接收下一个指令了。
00:05:53就像这个小东西,对吧?
00:05:56它可以放在你电脑上的任何地方。
00:05:58它会置于你正在使用的任何程序之上。
00:06:00所以即使我关掉 Codex,
00:06:03我依然能看到我的小家伙。
00:06:06等下我们实际操作任务时你就会看到它。
00:06:08它会显示一串小文本,
00:06:09让你看到它正在忙什么。
00:06:10当它完成工作后,
00:06:12它就会像这样趴下。
00:06:13说实话,我非常喜欢这样的通知机制。
00:06:17比如用 Claude code 时,我设置了
00:06:19每次完成任务都会播放一段音频,
00:06:23因为在进行智能体编程时,我浪费的
00:06:27大部分时间其实都是因为
00:06:29在下达指令之后,
00:06:30我就切到别的窗口或走开了,没有及时回来。
00:06:32所以,随你用不用吧,这并不重要。
00:06:35接着是配置选项。
00:06:37他们有一些关于钩子的功能。
00:06:38看来我需要更新一下。
00:06:39这边是审批政策
00:06:41和沙盒设置。
00:06:42这和权限设置很像,只是属于全局层面的。
00:06:45然后在工作区依赖项这里,
00:06:48你会想要开启“Codex 依赖项”,
00:06:51默认应该是开启的。
00:06:52接着是个性化。
00:06:53你可以选择你的个性风格。
00:06:54注意,这不是 agents.md,也不是 claud.md。
00:06:59Codex 有它自己版本的 claud.md。
00:07:02它叫做 agents.md。
00:07:03同样,我们稍后会详细谈论这个。
00:07:06个性化功能有点类似,但并不完全一样。
00:07:09它更像是:“嘿,我希望你一直
00:07:11称呼我这个名字”之类的。
00:07:13还有记忆功能。
00:07:14这类似于 claud code 里的记忆功能,
00:07:17默认也是开启的。
00:07:18我通常会关掉这些。
00:07:19比如,如果我告诉 Codex:
00:07:22“嘿,我每周二都会去健身房”,
00:07:24到了周二我随口说一句:
00:07:26“我今天不知道该干什么。”
00:07:27它就会说:“哦对,你周二要去健身房。”
00:07:30老实说,我并不太在乎这些东西,
00:07:33但这取决于你。
00:07:34剩下的部分就是像 MCP 服务器、
00:07:37Git、环境、工作树之类的。
00:07:39这在某种程度上取决于,
00:07:40取决于你的技术水平,
00:07:42以及你想深入研究到什么程度。
00:07:43然后还有像浏览器使用和计算机使用之类的功能。
00:07:46关于计算机使用,你需要使用 Mac,
00:07:50而浏览器使用就正如其名。
00:07:54然后我们还有归档聊天和使用情况。
00:07:56所以这里没有太多需要摆弄的地方。
00:07:59你主要会使用“常规”选项,
00:08:01以及“外观”和“配置”。
00:08:03在顶部,我们有插件。
00:08:04Codex 拥有类似于 Claude code 的插件和技能。
00:08:08这两者之间的界限非常模糊。
00:08:11总的来说,插件几乎就像是技能包,
00:08:14或者是来自供应商本身、可以轻松安装的 MCP。
00:08:16比如安装 Supabase 就会安装一个 Supabase MCP
00:08:17和必需的技能。
00:08:21所以如果我现在打开一个聊天并说,
00:08:22“嘿,帮我在 Supabase 里打开或创建一个数据库”,
00:08:24它就能直接完成。
00:08:27所有这些插件都是如此,它还包括
00:08:28Chrome、电子表格和演示文稿等功能。
00:08:31而且它是点击即可安装的。
00:08:33然后我们的技能功能,运作方式几乎和 Claude code 一样。
00:08:35如果你刚打开 Codex,
00:08:38你可能会看到一个弹出窗口,写着类似这样的话:
00:08:40“嘿,我们注意到你拥有来自
00:08:42另一个编程智能体的所有这些技能。”
00:08:45“你想导入它们吗?”
00:08:46所以只需点击一下按钮,它就会导入
00:08:48来自 Claude code 或像 open code
00:08:51这类工具中的几乎所有内容。
00:08:53它能够识别你电脑上的这些内容。
00:08:55所以这也是让在这些工具之间
00:08:56切换变得非常容易的另一个原因。
00:08:59所以我会想,“天哪,”
00:09:00“我在 Claude code 上建立了一支技能大军。”
00:09:01“我不能离开它。”
00:09:03其实并非如此,你完全可以离开。
00:09:04它会自动把这些技能都投射到这里。
00:09:06要使用这些技能,你只需点击它们。
00:09:08你可以卸载它们。
00:09:11你可以开启或关闭它们。
00:09:12再次强调,这非常直观。
00:09:13你也可以在上面管理它们,
00:09:15非常容易地创建一个技能。
00:09:17它甚至还有自己的“技能创建者”技能。
00:09:19还有“自动化”标签页,
00:09:22类似于 Claude code 中的“常规任务” (routines)。
00:09:23它们这里有一些默认的选项。
00:09:25我们可以去这里自动创建一个新的自动化。
00:09:27你可以把它设置在工作树或本地。
00:09:30你可以把它放在特定的项目时间,诸如此类。
00:09:32你还拥有这样的能力,
00:09:36就像你在 Claude code 的终端里所做的一样,
00:09:37直接说,“嘿,让我们用 X、Y 和 Z 创建一个自动化。”
00:09:39它就会自动放进去,非常简单,
00:09:42在这里通过视觉点击进行操作非常直观。
00:09:45现在,关于浏览文件结构
00:09:47和你电脑上的空间,
00:09:50它的划分方式是“项目”和“聊天”。
00:09:52现在我可以进入一个叫 audit flow 的项目,
00:09:54这是我今天早些时候在处理的,
00:09:58或者我可以添加一个新项目,或者直接说,
00:10:00点击这里,我就进入了一个新聊天。
00:10:02新聊天并不真的在任何特定文件夹里。
00:10:04这就像是身处 Claude code 桌面版
00:10:07的聊天窗口里一样。
00:10:09就像我正把它当成 ChatGPT 在聊天。
00:10:11如果我想在特定文件夹中工作,
00:10:14或者我想启动一个新项目,
00:10:16我们要去“项目”选项。
00:10:17操作非常简单,你可以点击这里。
00:10:19你可以从零开始,它会在你设置的
00:10:22默认位置创建一个新文件夹。
00:10:24我通常只选择“使用现有文件夹”,
00:10:26这样我可以更具体地确定
00:10:28我想去哪里。
00:10:31在这里,我们新建文件夹,
00:10:33我们把它命名为 YouTube demo codex 之类的。
00:10:36然后,是的,“你想导入一些设置吗?”
00:10:40当然,就这么办吧。
00:10:43正在导入我最近在 Claude code 中所做的设置更改。
00:10:44现在你可以看到,我已经在 YouTube demo codex 目录下了。
00:10:47我们正在本地的主分支 (main branch) 上工作。
00:10:52你也可以在“项目”这边看到这些。
00:10:54我可以打个招呼,“嘿,最近怎么样?”
00:10:56然后你现在就能在下面看到那个聊天了。
00:10:59现在的这个聊天窗口几乎
00:11:05等同于打开了一个终端窗口,
00:11:07因为我可以留在同一个项目里。
00:11:08如果我点击顶部的“开始新聊天”,说声“你好”,
00:11:10我现在就打开了两个聊天窗口,
00:11:15这在实质上
00:11:18和我打开两个终端是一模一样的,对吧?
00:11:20同样的过程,在同一个文件夹中打开,
00:11:24各忙各的,
00:11:27但仍然在处理同一个项目。
00:11:28它们之间可以看到彼此的所有内容,
00:11:29但在这种 UI 界面下,
00:11:31非常容易追踪进度。
00:11:34我还可以点击任何一个聊天。
00:11:35我可以复制它们,复刻 (fork) 到本地,
00:11:36复刻到新的工作树,重命名,置顶,
00:11:38随心所欲。我也可以非常容易地点击项目
00:11:40右边的三个点,在资源管理器中打开它。
00:11:41所以,实际上导航聊天、
00:11:43导航你的文件系统,并在脑海中构建出
00:11:46文件在机器上的位置模型,
00:11:49这都非常容易实现。
00:11:51说实话,这就是 Codex 桌面应用的大致情况。
00:11:53这里还有很多其他酷炫的功能,对吧?
00:11:54你可以看到分支详情,
00:11:58很容易执行 Git 操作,
00:12:00不过刚才说的这些基本上就是核心部分了,对吧?
00:12:01我刚才告诉你的这些,你已经可以使用了。
00:12:03你可以构建任何你想构建的东西。
00:12:05我们早些时候谈到过,
00:12:08嘿,你可以在这里面使用终端,
00:12:09就在右上方,对吧?
00:12:11切换终端,砰,终端就出来了。
00:12:13它就在我的 YT demo codex 项目里。
00:12:14然后我们就可以运行 Claude,砰。
00:12:17我现在在同一个项目中同时开启了 Claude code 和 Codex。
00:12:20现在,关于让它们互相配合,
00:12:25有几种方法可以实现。
00:12:28第一,我们可以,也就是我们现在要做的事,
00:12:30是让它为我们创建某种小型 Web 应用。
00:12:31我可以先在 Codex 里做一个规划,然后把规划
00:12:33复制到 Claude code,看看它怎么说,
00:12:36就像这样来回复制粘贴。
00:12:38或者我可以让 Codex 构建一些东西,
00:12:40然后让 Claude code 实际去查看代码,
00:12:43因为它们在同一个目录下,
00:12:44弄清楚代码说的是什么。
00:12:46我确信实际上有比这更高级
00:12:48且简单的方法,
00:12:50你可以自动设置一些联动。
00:12:51我还没怎么尝试过那个。
00:12:53关键在于基础设施已经准备就绪,非常容易操作。
00:12:55我们拥有了两个世界中最好的部分。
00:12:56那么让我们做一个简单的演示,
00:13:01来测试一下它的性能。
00:13:03我们将让它创建一个
00:13:05内容/研究、构思类型的 Web 应用。
00:13:07第一部分需要能够从一堆来源中提取信息,
00:13:12并给我们一些可能的点子。
00:13:16第二部分,我希望它能合成
00:13:18它抓取到的所有信息,并想出内容创意。
00:13:21然后第三部分,
00:13:24让我们在底部创建一个类似小型进度表的工具,
00:13:27可能像一个微型看板,来跟踪我们的点子。
00:13:29所以它需要能够研究、构思,
00:13:30然后实际组织所有这些数据。
00:13:32让我们看看它表现如何。
00:13:34我们将从 Codex 开始。
00:13:36首先把它调到规划模式。
00:13:38此外,在调用技能和类似操作方面,
00:13:39也几乎是一样的。
00:13:40你可以输入正斜杠,
00:13:42然后调用某个特定技能。
00:13:47如果我说“前端设计技能”,
00:13:48砰,就在那里。
00:13:50或者我也可以用 @ 符号。
00:13:53比如输入 @ 电子表格。
00:13:55所以现在它就在使用电子表格插件。
00:13:56我也可以直接使用自然语言。
00:13:58就像 Claude code 一样,它应该能领会,
00:14:00但使用斜杠命令和 @ 命令,
00:14:03就是你指向不同功能的方式。
00:14:05指向特定的文件或文件夹,
00:14:07也是同样的操作方式。
00:14:10还有一件事,关于上下文,需要注意,
00:14:115.5 Pro 拥有 258K 的上下文窗口,
00:14:15而 Claude code 是一百万。
00:14:17我的看法是,这并不完全是件坏事。
00:14:20因为大多数人根本不知道
00:14:25如何管理他们自己的上下文。
00:14:28他们生活在原始上下文的地狱里。
00:14:31而 258K 几乎让你不可能
00:14:33长时间处于那种混乱状态。
00:14:35当你达到 258K 时它会有自动压缩功能,
00:14:37而自动压缩本身也有一系列问题,
00:14:40尤其是当我们开始一遍又一遍地压缩同一段对话时。
00:14:41但正如我刚才展示给你的,
00:14:44执行等同于正斜杠 clear 的操作
00:14:47其实就是开始一个新聊天,对吧?
00:14:49因为我基本上只是开启了一个新的会话。
00:14:50所以上下文容量是一个细微的差别。
00:14:52让我们给它一个问题,看看它怎么说。
00:14:54所以我想创建一个 Web 应用,
00:14:59主要做三件事。
00:15:01理想情况下,你可以在同一个页面上完成所有操作。
00:15:04一方面,我希望它能查看过去 24 小时内,
00:15:07各大主流网络资源中的 AI 新闻,
00:15:10以及像 YouTube 或 Twitter (X) 上的内容。
00:15:13然后我希望它能将其整合到一份报告中。
00:15:15一方面,我希望它能查看 AI 新闻
00:15:18在过去的 24 小时内,涵盖主要的网络来源
00:15:22以及像 YouTube 或 Twitter 之类的内容。
00:15:25然后我希望它能将这些信息整合到一份报告中。
00:15:29第二,我希望它能根据所有这些信息
00:15:31为我提供潜在的内容创意。
00:15:33比如标题应该叫什么?
00:15:34大致的大纲是什么?
00:15:36可以是那种项目符号的格式
00:15:38以及一些吸引人的开头。
00:15:39最后,我想让它具有某种调度程序的功能,
00:15:42也许像一个小型的看板
00:15:44在那里我可以操作,
00:15:46比如,“好,让我们把你刚才想到的那个点子
00:15:48安排在今天执行。”
00:15:49下一个点子我们可以明天做,类似这样。
00:15:52所以让我们来梳理一下并进行规划。
00:15:54现在我们将进入它的“计划模式”。
00:15:55计划模式基本上和 Claude Code 一模一样。
00:15:57它会进行思考。
00:15:58它会问你一系列问题。
00:16:01我注意到 5.5 Pro 在设置为 Extra High 时,
00:16:05它倾向于问相当多的问题,
00:16:08但也可能只是因为我当时正在做的项目。
00:16:10而在速度方面,
00:16:13它有点,
00:16:15我想它可能比 Opus 稍微慢一点。
00:16:18虽然我没有硬性的数据来支持这一点。
00:16:21这只是目前为止的使用感觉。
00:16:22与此同时,
00:16:23如果我只是进行来回的聊天,
00:16:255.5 感觉比 Opus 要流畅得多。
00:16:28所以如果它在执行大量的工具调用,会慢一点,
00:16:31如果只是纯聊天,速度非常快。
00:16:33这就是 Codex 想出的计划。
00:16:35构建一个全新的、单用户的本地 Web 应用程序,
00:16:38使用 Next.js、TypeScript 和 SQLite。
00:16:40该应用将有一个主仪表盘,包含三个流程:
00:16:43收集过去 24 小时的 AI 动态,
00:16:45生成简洁的报告以及 YouTube 视频创意,
00:16:48并将选定的创意安排在小型看板上。
00:16:50不使用付费 API,采用精心挑选的 RSS 源
00:16:54和本地的 Ollama 生成。
00:16:55于是 Claude Code 回复了。
00:16:58它说计划很扎实,但还存在一些差距,
00:17:00看看它是否有其他想法或任何盲点。
00:17:04所以我说,Codex 为我们的应用制定了这个计划。
00:17:06你觉得怎么样?还缺少什么吗?
00:17:08然后 Claude Code 回复了。
00:17:09它说计划很扎实,但也有一些空白,
00:17:12一些软性的担忧以及一些吹毛求疵的建议。
00:17:14所以我打算回到 Codex,
00:17:17把这些反馈粘贴进去并直接问,
00:17:18“你觉得这个建议怎么样?”
00:17:22然后提交。
00:17:25现在,我们可以继续这样无限地来回讨论下去。
00:17:30但为了节省时间,我们就停在这里。
00:17:32关键在于,我们现在有了第二双眼睛
00:17:35来审视 AI 构思出来的计划到底是什么样的。
00:17:38我认为这超级重要,
00:17:40尤其是如果你是那种,
00:17:41没有技术背景的人,对吧?
00:17:43因为问题在于你去问 AI,你有一个点子,
00:17:47它给了你一个计划。
00:17:48如果你根本不知道正确的应该是什么样子,
00:17:51你可能只会觉得,“太棒了哥们,给力,去干吧。”
00:17:55而它可能遗漏了一大堆东西。
00:17:57现在我们试图通过这些方式来规避这一点,
00:17:58比如问更多的问题,更彻底地检查,
00:18:01问诸如“我还没考虑到什么?”
00:18:03“专家会问什么?”之类的问题。
00:18:05好的,这样确实说得通。
00:18:10多位 AI 专家都告诉我这是一个可靠的计划。
00:18:11甚至 Codecs 也说,
00:18:13所以,就算没别的作用,它至少能给你
00:18:16那种内心踏实的感觉,觉得,
00:18:17“好吧,这确实说得通。”
00:18:20“多个 AI 专家都告诉我这是一个扎实的计划。”
00:18:24Codex 甚至说,
00:18:25“我同意那份评论的主要诊断。”
00:18:26“原始计划可以可靠地总结发生的事情,”
00:18:29“但你实际描述的产品”
00:18:30“需要确定今天值得制作成视频的内容。”
00:18:33“这需要趋势信号、排名,”
00:18:35“和竞争对手饱和度检查,而不不仅仅是摄取信息。”
00:18:38所以它正在对计划进行一些修改,
00:18:40我们就在第一轮之后直接执行。
00:18:42显然,这种双模型方法
00:18:44是可以应用到你项目的任何部分的。
00:18:47所以这是更新后的新计划。
00:18:49正如我所说,为了节省时间,
00:18:50我们将在第一轮之后就执行它。
00:18:5323 分 21 秒。
00:18:54它说已经实现了完整的本地 AI 趋势规划器。
00:18:58内容已经就位,它浏览了一遍关键文件,
00:19:00验证通过,它创建了一个 README。
00:19:04我可以点击 README,你可以看到这个,
00:19:06就像是在应用内部看到的一样。
00:19:08所以你可以看到它实际上写了什么
00:19:10然后它显示了所有不同的文件。
00:19:12如果我点击所有文件,
00:19:15它会快速显示出它创建的内容。
00:19:18显然它还没有删除任何东西,
00:19:19因为这是第一轮,但它也会显示相关信息。
00:19:22如果我点击任何这些文件,
00:19:24我也可以在 review 中显示它。
00:19:26进入 review 后,有一个类似 diff 浏览器。
00:19:29我可以在这里执行一些 git 操作,我只是觉得,
00:19:33能看到它实际执行了什么是很容易的。
00:19:36同样,我喜欢终端。
00:19:37你可能也喜欢终端,
00:19:38但终端确实有一些局限性,
00:19:40相比于能在一个地方看到所有东西
00:19:42这种便利性因素而言。
00:19:44所以在让 Claude Code 来看之前,
00:19:45我们先说,为我启动开发服务器
00:19:49并在侧边栏浏览器中打开它。
00:19:54我觉得我打字真的变得
00:19:57非常糟糕,因为我用了太多的 AI,
00:20:00而且在过去的一年里一直在使用语音听写。
00:20:02我实际上已经完全失去了
00:20:04打出哪怕一个没有任何错误的句子的能力。
00:20:07所以它要做的是启动开发服务器,
00:20:11然后它会在应用内浏览器中
00:20:14向我们展示实际的网页,这很不错。
00:20:16现在我们可以在浏览器中看到网页了。
00:20:18我会移到这边,这样你更容易看到。
00:20:21这就是它创建的东西。
00:20:23我们有 AI 趋势规划器。
00:20:26我们可以运行扫描。
00:20:27我们可以摄取内容,报告创意。
00:20:29总的来说,我认为对于第一轮来说,
00:20:32它采用了这种,我想这是一种
00:20:35野兽主义(brutalist)风格的处理方式。
00:20:37我觉得看起来挺不错的。
00:20:39我的意思是,我挺喜欢的,不知道你怎么想。
00:20:40反正现在到处都是 AI 的流水线产物,对吧?
00:20:43但这个小型看板,我能拖动这些吗?
00:20:46不行,不能拖动。
00:20:48希望能做到那一点。
00:20:50信号源,来源,好的。
00:20:55表面上看,我不确定这些是否真的有效,
00:20:58但在初始阶段看起来还不错。
00:21:02让我们看看如果我运行全量扫描会发生什么,
00:21:05正在获取来源。
00:21:08在它运行的同时,我们该做什么呢?
00:21:11嗯,我们应该让 Claude Code 来看看
00:21:12它的工作成果。
00:21:13嘿,你能看看 Codex 为我们的应用
00:21:17在第一轮构建的内容吗?
00:21:21有没有什么明显的弱点,或者你想改变的地方?
00:21:25根据我的理解,一切都应该
00:21:28连接妥当并正常工作,但你是否看到任何
00:21:31不知何故溜掉的问题?
00:21:34好吧,它说 Ollama 甚至都没能运行。
00:21:36所以我们可能需要解决 Ollama
00:21:38那方面的问题,但现在就开始吧。
00:21:42整体看起来很酷。
00:21:42显然我们也可以通过
00:21:44本地浏览器访问这个页面。
00:21:46我们可以在这里做的一件事,有点让人联想到
00:21:48像云设计之类的东西,就是你可以标注某些东西
00:21:52或者留下评论。
00:21:53所以我可以高亮这一块,留下评论,
00:21:58然后说类似“我们能把这个改成斜体吗?”之类的话。
00:22:03然后它就会生成一个
00:22:10这里的标注,我可以添加后续的修改建议
00:22:13或者我现在就发送它。
00:22:15然后你就拥有了
00:22:17对任何你想要的东西进行标注的能力。
00:22:20你也可以快速截个图。
00:22:22我截个图,然后我可以把它贴在那儿。
00:22:24所以它也让这类前端设计评审
00:22:28和迭代变得容易得多。
00:22:30瞧,现在我们有了斜体。
00:22:33噢,Codex 在开头确实告诉过我,
00:22:35但我太懒了,甚至都没读它,
00:22:36就是说:嘿,要使用本地 AI 生成,请运行 Ollama poll,
00:22:40Ollama 3.18 或者将 Ollama 模型设置为你已有的模型。
00:22:43我的电脑上确实有几个模型。
00:22:45所以我们就说,嘿,你能找到它吗?
00:22:47嘿,我很确定我的机器上
00:22:51已经有几个 Ollama 模型了。
00:22:52你能查看一下具体是哪几个
00:22:55然后正确地把它们连接起来吗?
00:22:57另外,让我们检查一下这些链接是否真的有效。
00:23:00它说“AI 废话(Slop)正在扼杀在线社区”,
00:23:03来自 Y Combinator。
00:23:05让我们复制一下。
00:23:06是的,没问题,这是真的链接。
00:23:08非常酷。
00:23:09那么在下面,Claude 的评审结果出来了。
00:23:12它说它发现了几个真实的 Bug,
00:23:15并带回了 20 个新 Bug。
00:23:19然后它说,底线是,接线是正确的。
00:23:22管线流程是端到端的,那些 Bug 会很快浮现,
00:23:27然后还有一些时间戳问题,
00:23:30竞争对手自我预警以及它提到的一些其他东西。
00:23:32所以,你知道,相当不错。
00:23:34我是说,20 件事。
00:23:36我也在想,如果告诉 Claude 代码是由 Codex 编写的,
00:23:39它是否会变得更具对抗性,
00:23:42我很期待这种效果。
00:23:43实际上,这完全可以作为一项技能来实现。
00:23:45考虑到 Claude Code 中 Codex 插件
00:23:48本身就有一项技能,
00:23:50名为“对抗性审查”。
00:23:51Codex 随后意识到我电脑上有 GLM 4.7 Flash,
00:23:55于是连接了它,
00:23:56并重新运行了趋势报告。
00:23:59你们可以在这里看到。
00:24:00这是一份基于抓取的
00:24:02所有信息的正式报告。
00:24:04我可以看看这些视频创意。
00:24:05比如“为什么 AI 废话正在摧毁在线社区”,
00:24:07我点击“明天”。
00:24:09看看它是否真的会放在那里。
00:24:15看起来不太行,似乎卡住了。
00:24:18那就让 Claude Code 来修复一下。
00:24:21嘿,当我点击其中一个视频创意时,
00:24:24例如“为什么 AI 废话正在摧毁在线社区”。
00:24:28如果我点击“明天”,只会出现一个进度条,
00:24:32并没有发生实际的操作。
00:24:33我们能修复这个问题吗?
00:24:35其次,目前的看板,
00:24:37我无法在上面移动任务卡片。
00:24:41一旦它们进入特定位置,比如“收件箱”,
00:24:43我就无法将它们移到“今天”或“明天”等等。
00:24:45不管怎样,
00:24:46我认为这就是两者协作的方式。
00:24:48来回配合。
00:24:50就像你在这里看到的,
00:24:50你可以让它们同时
00:24:52处理同一个任务。
00:24:53如果你觉得 Codex 搞不定,
00:24:55可以把任务交给 Claude Code。
00:24:57我认为它们可以互相弥补
00:24:59彼此的弱点。
00:25:01通常我会说,在前端设计
00:25:03以及整体设计方面,
00:25:05Claude Code 往往比 Codex 表现得更好。
00:25:08但说实话,我挺喜欢
00:25:11它第一轮生成的样子的。
00:25:12所以,虽然我可以演示
00:25:15让 Claude 处理前端设计,
00:25:17虽然这里确实还有改进空间,
00:25:19但我认为它已经做得很不错了。
00:25:21我真正想通过这个演示展示的,
00:25:23是设置过程是多么简单。
00:25:26以及像 Claude Code 发现问题的能力,
00:25:29它在第一轮就发现了 20 个 Codex
00:25:34没有察觉到的潜在漏洞。
00:25:35我认为让它们在项目中
00:25:38反反复复互相检查,
00:25:41这种复利效应随着时间的推移是物超所值的。
00:25:45虽然在最开始时,
00:25:47我们会消耗大量 Token 来做这件事,但长远来看,
00:25:49如果我们能及早抓住这些漏洞,
00:25:52并立刻找出这些薄弱环节,
00:25:54总的来说,你实际上节省了 Token。
00:25:57当然,我们也可以随时
00:25:59在常用的浏览器中打开它。
00:26:01看起来它成功修复了看板上的导航功能。
00:26:06看板上的导航问题。
00:26:07最后,我想快速谈谈
00:26:09关于“工具中立”的大思路,
00:26:12因为我觉得很多人,
00:26:14他们自认为:哦,我是工具中立的。
00:26:16如果有比 Opus 更好的工具,
00:26:18我明天就会换成最好的,
00:26:19或者如果有比 GPT 5.5
00:26:21更好的其他工具,我也会换。
00:26:23人们只是这么想,但实际上,
00:26:25他们并不会真的这么做。
00:26:26现实情况是,你习惯了一个工具,
00:26:29陷入了使用它的习惯中。
00:26:31然后对很多人来说,
00:26:33你会变得有一种莫名的“部落主义”,
00:26:35就像是:不,我是 Anthropic 的粉丝,
00:26:37我是 Cursor 的死忠,我讨厌 OpenAI,
00:26:40我讨厌 Sam Altman,或者是完全反过来,
00:26:43搞得好像它们是某支运动队一样。
00:26:46你不应该在意这些。
00:26:48你真的不应该在意。
00:26:49你应该随时愿意切换。
00:26:51而且切换其实很容易,
00:26:52只要你持续地使用所有工具并配合使用,
00:26:56因为我觉得我们正处于这样一个阶段,
00:26:58而且情况只会变得更复杂,那就是:
00:27:00哪个模型最好,这并不那么显而易见,
00:27:03因为,第一,我们中有一半人甚至不买账
00:27:06他们推销的那些基准测试数据,
00:27:08第二,它们都在趋同,
00:27:09都变得非常、非常优秀。
00:27:11而且它们变得越好,
00:27:13就越能轻易超越
00:27:15普通人正在做的事情。
00:27:1799% 的人所做的普通项目,
00:27:19现有的模型都能搞定。
00:27:21那我们要用五年后
00:27:22存在的模型去做什么呢?
00:27:25所以我觉得,从长远来看,
00:27:29如果你让他们相互竞争,你会走得更远,
00:27:31而不是纠结于:我是 Cursor 派,
00:27:33或者我是 Codex 派。
00:27:34对我们来说幸运的是,他们还没建立起
00:27:36那种封闭的“围墙花园”,
00:27:37我可以同时与两者交互。
00:27:39如果说有什么变化,那就是他们让交互
00:27:40变得非常简单了,
00:27:42比如 Codex 开发了 Cursor 插件,
00:27:44还有导入技能文件
00:27:46之类的能力。
00:27:47所以我认为我们正处于 AI 的黄金时代,
00:27:51尽管人们喜欢对此唱衰,
00:27:53说什么:哦,价格在上涨。
00:27:54我觉得现实是,我们的处境非常好,
00:27:56而且只会越来越好,
00:27:57如果你利用所有可用的工具,
00:27:59你的处境会变得更好。
00:28:02这就是我今天要分享的内容。
00:28:03我希望你们能从中有所收获。
00:28:05一如既往,请告诉我你们的想法。
00:28:07如果你想看我的 Cursor
00:28:08和 Codex 大师课,
00:28:10请务必关注 Chase AI+。
00:28:12除此之外,我们回头见。

Key Takeaway

通过在 Codex 桌面应用中运行 Claude Code 终端,开发者可以利用 GPT 5.5 更高效的 Token 消耗与 Claude 卓越的设计审查能力实现双模型协同,从而及早发现单模型漏掉的 20 多个 Bug 并优化开发流程。

Highlights

  • GPT 5.5 模型在性能上已超越 Opus 4.7,且其 OpenAI Pro 计划的额度限制优于 Anthropic 的 Max 计划。

  • Codex 桌面应用能够自动识别并一键导入 Claude Code 或 Open Code 等工具中已有的 99% 编程技能。

  • 在 Codex 桌面应用内运行 Claude Code 终端,可实现两个编程智能体对同一项目文件的实时协同操作。

  • GPT 5.5 Pro 拥有 258K 上下文窗口并具备自动压缩功能,其性能在特定基准测试中优于 Mythos。

  • 通过双模型对抗性审查,Claude Code 在第一轮测试中发现了 Codex 未察觉的 20 个潜在漏洞与 Bug。

  • Codex 桌面版内置了可视化“宠物”通知机制,通过视觉钩子反馈智能体是在后台运行还是已完成指令。

Timeline

打破单一生态系统的限制

  • GPT 5.5 的惊人性能已缩小与 Opus 4.7 之间的差距。
  • OpenAI Pro 计划提供的用量限制比 Anthropic 的 Max 计划更慷慨。
  • Codex 与 Claude Code 在功能上有 99% 的重叠,学会其中一个即可轻松上手另一个。

目前 AI 编程领域不再是单方主导,GPT 5.5 的出现让 OpenAI 重新获得竞争力。开发者不应受限于特定公司的生态系统,而应采取工具中立的态度。将两者结合使用的成本并不高,且设置过程仅需几秒钟。

Codex 桌面版核心功能与配置

  • GPT 5.5 Pro 仅提供给订阅 100 美元或 200 美元计划的用户,普通 20 美元计划仅限使用标准版 5.5。
  • 可视化“宠物”功能作为通知机制,能直观显示智能体当前的工作状态。
  • 258K 的上下文窗口限制强制实施了更有效的上下文管理,避免进入原始上下文混乱状态。

Codex 界面直观且具有类似 ChatGPT 的交互风格,支持本地和云端项目管理。它提供了针对编程的专用模式,可以输出更多技术细节。内置的个性化记忆功能可以记录用户偏好,但开发者可根据需求选择开启或关闭以优化性能。

技能导入与自动化工作流

  • Codex 能够自动检测并导入来自其他编程智能体(如 Claude Code)的现有技能。
  • 插件系统支持一键安装 Supabase、Chrome 及电子表格等 MCP 服务器。
  • 自动化标签页支持在特定项目时间或工作树上设置常规任务。

技能系统的兼容性极大降低了迁移成本,开发者在 Claude Code 中积累的技能库可以直接投射到 Codex 中。通过点击即可安装的插件,Codex 能直接与外部数据库和办公软件交互。UI 界面支持同时开启多个聊天窗口,效果等同于开启多个终端并行处理同一项目。

双模型协同开发实战演示

  • 在同一目录下运行双模型可以实现“第二双眼睛”的审视效果,防止 AI 计划遗漏关键环节。
  • Claude Code 具备强大的“对抗性审查”能力,在初次构建后指出了 20 个功能漏洞。
  • Codex 的内置浏览器支持对前端界面进行标注、截图和实时评论,简化了 UI 迭代流程。

通过创建一个 AI 趋势规划 Web 应用的案例,展示了如何让 Codex 负责初始规划,再由 Claude Code 提供反馈。Claude 指出了 Ollama 连接、时间戳及任务移动等多个具体 Bug。这种相互竞争与检查的机制虽然初期消耗更多 Token,但因及早修复薄弱环节,长远来看反而更节省资源。

工具中立主义的长期价值

  • 模型性能正在趋同,现有的顶级模型均能胜任 99% 的普通项目。
  • 各大厂商尚未建立封闭的“围墙花园”,跨工具交互依然非常简单。
  • 拒绝工具“部落主义”并随时愿意切换到更好的工具是 AI 黄金时代的生存法则。

许多用户容易陷入对特定品牌的忠诚陷阱,但这会阻碍技术进步。由于 Codex 甚至开发了针对竞争对手 Cursor 的插件,目前利用所有可用工具才是最优解。随着模型性能的提升,开发者应专注于如何通过多模型协作来超越普通人的产出质量。

Community Posts

View all posts