00:00:00如果我告诉大家 AI 领域的一切都在飞速发展,
00:00:06你可能并不会感到特别意外。我指的不仅仅是模型发布,虽然我们几乎每周都有新模型,
00:00:12而且每周似乎都会出现一个新的“最强模型”。但我这里特别指的是开发者工具,或者说这些智能体
00:00:20工程工具。就在几周前的 1 月份,我才刚刚录制并发布了一个视频,
00:00:26分享了我对 Claude Code、Open Code、Cursor 和 GitHub Copilot 的看法。当时我其实
00:00:35才刚用 Codex 没多久,也就几周时间,而且只是偶尔用一下,但我深受
00:00:44Peter Steinberger 的影响。大家肯定都从 OpenClaw 认识他,那是一个传奇故事,但那是
00:00:49题外话了。早在 1 月份,我就不时看到他发布的动态,提到
00:00:56Codex 真的很神奇。据我所知,他指的既是模型,
00:01:04可能也包括那个 AI 编程智能体,也就是 Claude Code 的替代方案。于是
00:01:13我也开始尝试使用它。不过在那时,Claude Code 仍是我的主力工具,而在 2025 年,我主要用的是
00:01:20GitHub Copilot、Cursor 和 Open Code。所以没错,我换工具换得很勤,因为我
00:01:26真的很喜欢捣鼓这些不同的工具,看看它们能做什么,
00:01:30提供哪些功能。我是那种在 2019 年就沉迷于尝试各种不同 JavaScript
00:01:35框架的人,所以我猜我天生就爱学新东西。这也是为什么我乐于
00:01:41深入研究这些工具。我得说,OpenAI 的 Codex 确实是一款非常出色的智能体工程工具。
00:01:50在此先声明,我并不是说它就比 Claude Code 或 Cursor 更好,
00:01:57而且这种排名随时都在变。但它确实很棒,我认为 Codex 非常出色,
00:02:02值得更深入地了解。其中一个原因就是 Codex AI 模型,
00:02:08没错,模型名和工具名是一样的。我指的其实是 GPT 5.2 Codex 和 GPT 5.3
00:02:16Codex。顺便说个趣事,GPT 5.3 是在 2 月初发布的,而我在 1 月下旬成了 Codex 的
00:02:24重度用户。所以我大部分时间都在用这个模型。GPT 5.2 则是 12 月才发布的,
00:02:32可见这些模型的发布间隔真的越来越短了。显而易见的原因是
00:02:38OpenAI 想要与 Anthropic 的 Claude Opus 模型竞争。确实是这样。
00:02:45但我必须说,Codex 模型真的很棒。对我来说,5.3 Codex 经常会稍微慢一点,
00:02:52但在处理某些任务时比 Opus 更彻底。不过话说回来,我并不属于
00:03:01那种非要分出高下,或者认为这些工具之间有巨大鸿沟的阵营。
00:03:07但我喜欢 Codex(这里指工具而非模型)的地方,除了它由强大模型驱动外,
00:03:15还在于它有不同的形态,提供了不同的使用方式。
00:03:20例如,它有一个在我看来非常棒的桌面端应用。在我录制视频时,
00:03:27它只有 macOS 版,但我听说 Windows 版已在计划中。顺便说一下,
00:03:33我最近做了一个关于 Codex 的新课程,我就是结合使用 Codex 和 Claude Code
00:03:41开发出了这款 MaxDraw 应用。我在所有这些视频中,以及过去几周和
00:03:45几个月里一直在用它。这是我用这些 AI 工具亲手打造的,我从中获益良多。这就是为什么我
00:03:52基本上浓缩了我所有的心得、经验,以及如何使用技能、
00:03:57如何利用工作树、如何将任务卸载到云端的技巧。我把这些都放进了课程里,如果你感兴趣,
00:04:03想学习这些,可以在视频下方的链接找到它。所以这个应用,这个原生
00:04:09桌面应用,我真心觉得非常惊艳。我会说,
00:04:16它让我们看到了未来智能体工程的样子。因为在这个应用中,你主要关注的不是
00:04:23代码本身,这里没有文件列表。相反,这里只有会话,你基本上只需
00:04:30向 Codex 发送指令,让它完成任务。然后你可以随时
00:04:39在应用中审查更改。比如在这里,我在另一个项目中进行了一次对话,那里有很多更改,
00:04:45实际上改动非常大。接着你可以开启这个模式,你可以深入查看
00:04:51不同的文件,对比自上次提交后的变化。我的工作流程确实
00:04:58发生了改变,我现在不再自己写太多代码了。虽然偶尔还是会写一点,但我
00:05:04更多是在进行软件架构设计和引导 AI。我会非常小心且有目的地引导,
00:05:11给它细分的任务,但我现在大部分时间——或者说很大一部分时间——
00:05:19是花在审查代码上。因为我不会不管不顾直接盲目接受,
00:05:25相反,我会阅读它制定的计划,修改计划,并且一定会审查代码。我真的很
00:05:32喜欢这个应用的观感,以及它在操作智能体、切换
00:05:38会话以及审查代码时的便捷。除此之外,应用中还有很多实用的功能,
00:05:43我也在课程中详细介绍了,比如使用工作树或云项目。它确实是个
00:05:49非常棒的应用,我个人非常喜欢。当然,如果你不喜欢用 App,或者
00:05:55你是 Windows 用户目前还无法使用,我必须说,Codex 首先
00:06:01也是一个 CLI 工具,一个像 Claude Code 那样的终端交互界面,而且做得很棒。
00:06:10我觉得它的功能集恰到好处。更棒的一点(虽然听起来可能不是什么大事),
00:06:18它是用 Rust 编写的。我并不是那种 Rust 狂热粉丝,所以这对我来说关系不大。
00:06:24虽然我觉得 Rust 确实是一门很棒的语言,但关键在于它的性能。在 Claude Code
00:06:31有时会让人觉得有些迟钝和缓慢时,这款 Codex CLI 对我来说运行得
00:06:40非常丝滑。再次声明,Claude Code 和 Cursor 都很棒,但我必须说,这是一个优秀的 CLI。
00:06:46结合那个原生 App 和出色的模型,我的使用体验非常好。现在我觉得
00:06:53有趣的是,如果我们回顾一下这些 AI 模型的发展和演变——我指的是
00:07:04这些编程智能体随时间的演进,而不是模型本身——那真的很意思。
00:07:10GitHub Copilot 始于 2021 年,当时它只是由一个名为 Codex 的模型驱动的
00:07:18自动补全工具,那跟今天的 Codex 几乎没有关系。然后 2023 年我们有了 Cursor,
00:07:25它当时是一件大事,现在也依然很重要。但对我来说,现在到了 2026 年,Claude Code 和 Codex
00:07:36似乎是目前更受欢迎、更受追捧的工具。不过“热度”是个危险的东西,尤其在
00:07:44AI 领域,我们已经见证了事物变化有多快。我的意思是,Codex 在一个月前
00:07:52可以说完全没人关注,这种状态最近才改变。当然,它也可能再次发生变化。
00:07:57不过它确实是个好工具,所以热度是有原因的。但现在对我来说,感觉
00:08:03Cursor 简直快要……虽然没到倒闭的地步,但它在三个月前还是主流的智能体工程工具,
00:08:14而现在感觉它正在走下坡路,没人再对它感兴趣了。我敢肯定这种感觉是错的,
00:08:21这只是我所处的社交媒体信息茧房,可能并不是最好的衡量指标,但即便如此,
00:08:30这种变化的速度依然惊人。例如,GitHub Copilot 现在给我的感觉是正在强势回归。
00:08:37因为它曾经是第一,接着 Cursor 抢走了它的风头,然后 GitHub
00:08:45Copilot 经历了一段艰难的追赶期。但现在,我觉得他们做得更好了。
00:08:51我是说,随着最新版 VS Code 的发布,整个智能体界面得到了改进
00:08:58和现代化升级。顺便提一下,如果你有相应的订阅并安装了工具,你也可以在里面使用 Claude Code 和 Codex。
00:09:04所以感觉它可能正在卷土重来,
00:09:10而 Cursor 感觉在下滑。谁知道三周或三个月后,一切会不会又完全不同了呢?
00:09:16这又把我带回了之前的观点:我是那种
00:09:23并不太担心 2019 年那些 JavaScript 框架战争的人。这不只是
00:09:30因为我制作课程,我并没有为当时所有的框架都做过课程。
00:09:34我只是单纯喜欢学习新东西,看看哪里能发挥最大的作用。显然,
00:09:41如果你在公司上班,有特定的框架或工具要用,
00:09:46这些波动对你完全没影响。但对我来说,我喜欢这种创新,我非常兴奋
00:09:52能看到这些 AI 编程工具会如何演变,几个月后又会有什么
00:09:59新趋势。当然,我会尽力保持相关课程的更新。我已经为所有这些工具
00:10:04制作了课程,因为我都深入使用过,所以我当然会努力跟上潮流。
00:10:10但是,我不得不说这是一个非常有趣的时代。一切都发展得如此迅速,
00:10:16我完全理解这可能会让人感到不安。但与此同时,我觉得这在某种程度上
00:10:22也确实令人兴奋。不过,我也知道肯定不是每个人都认同这个观点。