00:00:00我得聊聊又一款 AI 编程助手。我知道,我知道,我之前已经发过
00:00:07关于 Claude Code 和 Codex 的视频和课程了,因为它们都非常出色,当然你还有
00:00:15Cursor 和 GitHub Copilot,我也出过相关的课程,链接就在下方。但今天
00:00:21我想聊聊 Pi 编程助手,因为它不仅仅是一个编程助手。那么,
00:00:31再次强调,所有这些工具都能帮你达成目标。没有所谓错误或正确的选择。我完全理解
00:00:38这听起来可能像 2019 年那场 JavaScript 框架之战,当时
00:00:46每周都会冒出一个亮眼的新工具。没错,从某种程度上说,现在的情况确实有点像,
00:00:53我想。但话又说回来,就像当年一样,坦白说,你选哪一个
00:01:00其实没那么重要。这也不是一个赞助视频,我也没有相关的课程。
00:01:06我只是单纯觉得 Pi 编程助手是一个你也值得关注的工具。现在,
00:01:13与 Codex、Claude Code 或 Open Code 不同,这款工具并不提供
00:01:20那种订阅服务。当然,Open Code 你也可以不买订阅,通过使用其他
00:01:27订阅(如 Codex)或按需付费来使用。而对于 Pi 编程助手,
00:01:32你只能选择按需付费,或者使用其他的订阅服务。例如,
00:01:39这里,我已经把它安装在系统里了,我正配合我的 Codex 订阅使用,这个订阅
00:01:45本可以用在 Codex App 或 CLI 上,但在这里也能用。我想你也可以
00:01:50配合 Anthropic 的 Claude Code 订阅使用,但你可能听说过他们
00:01:55并不喜欢这种做法,据我所知,这可能会导致你的账号被封。那么,Pi 有什么特别之处?
00:02:00为什么要用它而不是常规的 Codex CLI 呢?原因有几点。首先,
00:02:08Pi 这个助手非常精简且简单,这是一种褒义。它有着极其精简的系统提示词,
00:02:20而且只配备了寥寥几个工具。基本上,据我所知,如果还没变的话,
00:02:28它只带有读取、写入、编辑和 bash 工具。而 bash 工具当然是最强大的,
00:02:36因为只要有了 bash,你基本上就拥有了一切权限,因为你可以
00:02:44通过 bash,也就是命令行,来控制你的整个系统、整台机器,
00:02:50毕竟你可以从那里调用许多其他工具。事实证明,
00:02:55正如我在另一个视频中提到的,命令行界面(CLI)似乎是目前
00:03:03你最想开放给编程助手的东西,因为它们非常擅长使用 CLI,甚至
00:03:10是那些它们从未见过的界面。当然,通过 CLI、通过命令行界面
00:03:15或他人编写的工具,你的助手可以在电脑上完成各种操作。它们可以发送
00:03:21HTTP 请求。它们可以创建并执行脚本。它们可以解析 JSON 数据。它们无所不能。
00:03:29这就是 Pi 助手的哲学。极其精简,但给予它最强大的 bash 工具,
00:03:35让它基本上可以做任何事。再加上内置的精简、干练的系统提示词,
00:03:41你就得到了一个上下文窗口毫不臃肿的助手,它可以非常灵活地
00:03:50按照你的意愿执行任务。而且
00:03:57他们的核心哲学是:与其塞入一堆东西,不如给你一个
00:04:04扩展性极强的助手。你可以安装所谓的“扩展(extensions)”。我们稍后细聊。
00:04:10你可以使用“助手技能(agent skills)”。我指的是这种官方标准,虽然它也算是一种标准,
00:04:17某些工具的实现方式不同。但助手技能的核心理念当然是
00:04:24拥有技能目录和 skill.md 文件,里面包含提示词或额外的上下文,
00:04:31随你如何命名。这些内容是根据需求加载的,不是预加载,而是按需懒加载,
00:04:39取决于助手正在处理的任务。例如,在我当前运行的这个 Pi 会话中,
00:04:46我加载了一堆技能,有些是我设置的全局技能,用来尝试特定的功能,
00:04:53有些则非常实用,比如“代码调研”技能。如果
00:04:59我们查看一下,你会发现它只是一个包含名称和描述的 Markdown 文件。在这个技能里,
00:05:03描述当然至关重要,因为这最终决定了助手是否会
00:05:08激活并使用该技能。只有当助手根据名称和描述判断该技能
00:05:16与当前任务相关时,它才会加载文件的其余部分。然后,还是那句话,
00:05:21这就是一些额外的上下文或提示词,比如在这个“代码调研”技能里,
00:05:26我会告诉任何感兴趣的助手(如 Pi 或 Codex,如果它加载了这个技能的话),
00:05:32该如何进行代码调研,以及我希望它怎么做,比如它应该使用 Peter Steinberger 开发的
00:05:38MC Porter 工具来使用其他 MCP 服务,比如 deep wiki MCP 服务,这个服务
00:05:46可以用来探索 GitHub 仓库并深入了解它们,以及它应该使用的其他调研工具。
00:05:51这里还有另一个重点,谈到 MCP,Pi
00:05:58助手并不原生支持 MCP。原因在于 MCP 往往会占满你的上下文
00:06:05窗口,因为必须将大量关于可用 MCP 工具和资源的信息
00:06:10放入上下文窗口,AI 才能意识到它们的存在。而 Pi 背后的
00:06:18团队或开发者并不希望这样。这就是他们的理由。这种观点也被许多人
00:06:23(包括我自己)所认同。虽然我知道像 MCP search 这样的解决方案,但这里
00:06:28仍然没有原生 MCP 支持。但如果你使用 MC Porter 这样的工具,你就不需要它。
00:06:35我所说的“使用”,是指我告诉 AI 如何在需要
00:06:43使用 MCP 时实时调用这个 MC Porter 工具,这样它就不需要被安装或暴露在
00:06:49上下文窗口中。所以你明白了吧,它非常精简干练。这就是
00:06:54Pi 编程助手的核心故事。我已经提过了,关于这个助手
00:07:01另一件很棒的事就是它的可扩展性。这不仅限于技能,我认为首先是
00:07:08扩展插件。扩展背后的理念是,Pi 编程助手拥有一种原生支持,
00:07:16允许对其进行扩展,挂载到助手的不同部分,或挂载到助手逻辑循环的
00:07:22不同步骤。当助手工作时,允许你进行各种操作并以各种方式扩展
00:07:30这个助手。例如,如果你愿意,你甚至可以自己添加 MCP 支持。
00:07:36我现在自己设置了一堆扩展。例如,我通过一个扩展
00:07:41添加了“规划模式(plan mode)”。原本默认是不带规划模式的,但它的扩展性太强了,
00:07:47你可以添加一个扩展来阻止助手使用写入或编辑工具。当它处于
00:07:53规划模式时,这个扩展允许你设置一个快捷键来切换进入
00:08:00该模式。它还允许你更新 UI(终端界面),向用户显示正处于规划模式。
00:08:07你还可以添加额外的斜杠命令,比如 /plan,它能将我切换到规划模式并显示
00:08:14这个指示符。现在,某些工具就会被锁定,我可以再次切换出来。
00:08:20这就是通过扩展可以实现的操作。而且这里还有一个
00:08:24类似于官方扩展市场的存在,因为 Pi 助手也支持
00:08:31将你的扩展或技能打包并分享给他人。而像你我这样的其他人,
00:08:36就可以安装这些包,例如安装由他人构建的扩展。
00:08:40还有像“子助手(subagents)”这样的东西,你可以通过包含扩展的包来添加,
00:08:47或者添加“网络访问(web access)”包,这非常棒,它赋予了助手额外的工具
00:08:54来进行网页调研并高效获取网站内容。所以你明白了吧。它扩展性极强。
00:09:00你得到一个极简的核心,然后可以按需扩展,添加任何你想要的
00:09:06技能或扩展。这本身就已经非常有趣了,因为
00:09:12对于 Claude Code 或 Codex 以及所有这些工具,你得到的是开箱即用、
00:09:20功能更强但扩展性较差的预置工具。而 Pi 的理念恰恰相反。
00:09:28你得到一个极简核心,然后可以把它变成任何你想要的样子。你既可以
00:09:33全局设置,也可以针对每个项目进行设置,因为所有这些技能和扩展
00:09:39都可以全局安装或按项目安装。这使得它非常多功能。这也是为什么它值得
00:09:46一试。过去几周我一直在用它。除了 Claude Code 和 Codex,我还会经常
00:09:51切换使用,因为这些工具进化得太快了,而我真的很喜欢 Pi。那么,有趣的地方来了。
00:09:59你并不局限于只用 Pi 来写代码。虽然它被称为编程
00:10:08助手,这主要是你(以及我)会用到它的地方。
00:10:15但这并不是它的全部。例如,我确实安装了网络访问
00:10:21包,并将其连接到我的 Gemini API 密钥,从而让这个 Pi 助手拥有了
00:10:30基于 Gemini API 的完整网页调研能力。因此,我可以脱离任何项目、
00:10:35脱离任何编程项目运行这个助手,给它布置这样一个任务:调查
00:10:41过去七天苹果和英伟达股票的情况,获取它们的价格,并分析它们
00:10:46这七天的表现。如果我这么做了,它就会去执行。它会想方设法
00:10:55获取这些股票的价格数据。它会进行网页搜索,也许会访问它们的投资者关系
00:11:04页面,我们拭目以待。当然,它接着还会进行实际的计算,启动一个临时
00:11:12脚本或类似的操作。让我们看看它怎么做。例如,这里它激活了我添加的一个网页调研
00:11:18技能,我在其中提供了关于它该如何进行网页调研的更多细节。然后它尝试执行。
00:11:23现在遇到了一个问题,因为我没有安装 Python,或者不是这个名字的 Python
00:11:29可执行文件,它应该是 python3,它自己也发现了这一点。然后它写了
00:11:34一个脚本,借助 Python 从网站获取了一些数据,这是一个临时脚本,
00:11:40它在这里执行了,看起来它已经获得了一些股价。接着它很可能
00:11:47还会写一小段脚本,以便根据这些数据进行计算并计算
00:11:55股价的波动。在工作了一段时间并对各种事情(包括一些
00:12:01新闻调研)进行了大量研究后,它完成了任务。它给了我苹果和英伟达
00:12:08过去七天的数据,向我展示了它们的股价在这些日子里的变化。这里还给了我一些表现总结。
00:12:14它还给我提供了一些文字分析,将结果总结出来供我
00:12:23阅读,就像一份高管报告。而所有这一切都是由这个 Pi 编程助手配合
00:12:29我给它的扩展和技能完成的,除此之外别无他物。我没写代码,也没指定
00:12:36去访问哪些网站。它全是自主完成的。当然,你完全可以用 Claude Code
00:12:43或 Codex 来做,因为归根结底,它们都是拥有各种工具来完成任务的 AI 助手。
00:12:50虽然它们主要为编程而生,但你当然可以“滥用”它们来做
00:12:56各种其他事情。因为归根结底,这项任务同样涉及获取
00:13:01网页和编写脚本,这与编程项目非常相似,你也可能
00:13:06想让它获取一些文档并编写一些代码,对吧?所以它也能做很多其他事。
00:13:11在我看来,Pi 处理这类任务比 Codex 或
00:13:17Claude 更好一点的原因是,它拥有精简的核心,并且可以被扩展成你完全想要的工具,
00:13:24甚至可以针对每个项目进行定制。所以你可以在系统中让一个项目拥有
00:13:29调研专家,另一个项目拥有,我不清楚,股票研究专家,而第三个项目
00:13:37则拥有一个完全不同的专家,一个分析系统和硬盘
00:13:42利用率的专家,或者随便什么。这可能也是为什么 OpenClaw
00:13:50在内部使用 Pi 的原因。现在我在 deep wiki 的 OpenClaw 仓库页面。如果你还不了解它,
00:13:55这是一个了解 GitHub 仓库的绝佳网站。它会分析仓库并
00:14:00根据它看到的预览代码实时生成文档。你还可以
00:14:05与仓库“对话”。在这里我可以问:OpenClaw 是否在内部使用了 Pi 编程助手?
00:14:12如果是,是怎么实现的?它会分析已经加载好的代码。它告诉我,
00:14:18是的,OpenClaw 正在使用 Pi 编程助手。然后它告诉我具体是如何实现的。所以,
00:14:24这就是 Pi 编程助手。我只是想分享一下。再次声明,不是因为我能
00:14:31从中赚到钱。我没出课程,什么也没有。但它确实是个很棒的工具,尤其是
00:14:38如果你打算或者想尝试用助手处理非编程任务。当然,
00:14:44为了说清楚,对于编程任务,它同样能胜任。它是一款非常
00:14:50全能的 AI 助手。你甚至可以像 OpenClaw 那样在它之上构建自己的工具。
00:14:56虽然你用 Codex 也能做这些事,但再次强调,这里的精简核心真的很赞。
00:15:02所以,除了 Codex 或 Claude Code,或者作为它们的替代品,这款工具都值得一看。
00:15:09过去几周我用得很开心。我很期待看到
00:15:14所有这些助手技术将走向何方,以及一年后我们能用它们做些什么。我得说,
00:15:18这一切既有点令人畏惧,但也非常有趣。一种奇妙的混合感。