“PI” (编程) 智能体远不止是另一个令人惊叹的编程助手!

MMaximilian Schwarzmüller
Computing/SoftwareSmall Business/StartupsStocksInternet Technology

Transcript

00:00:00我得聊聊又一款 AI 编程助手。我知道,我知道,我之前已经发过
00:00:07关于 Claude Code 和 Codex 的视频和课程了,因为它们都非常出色,当然你还有
00:00:15Cursor 和 GitHub Copilot,我也出过相关的课程,链接就在下方。但今天
00:00:21我想聊聊 Pi 编程助手,因为它不仅仅是一个编程助手。那么,
00:00:31再次强调,所有这些工具都能帮你达成目标。没有所谓错误或正确的选择。我完全理解
00:00:38这听起来可能像 2019 年那场 JavaScript 框架之战,当时
00:00:46每周都会冒出一个亮眼的新工具。没错,从某种程度上说,现在的情况确实有点像,
00:00:53我想。但话又说回来,就像当年一样,坦白说,你选哪一个
00:01:00其实没那么重要。这也不是一个赞助视频,我也没有相关的课程。
00:01:06我只是单纯觉得 Pi 编程助手是一个你也值得关注的工具。现在,
00:01:13与 Codex、Claude Code 或 Open Code 不同,这款工具并不提供
00:01:20那种订阅服务。当然,Open Code 你也可以不买订阅,通过使用其他
00:01:27订阅(如 Codex)或按需付费来使用。而对于 Pi 编程助手,
00:01:32你只能选择按需付费,或者使用其他的订阅服务。例如,
00:01:39这里,我已经把它安装在系统里了,我正配合我的 Codex 订阅使用,这个订阅
00:01:45本可以用在 Codex App 或 CLI 上,但在这里也能用。我想你也可以
00:01:50配合 Anthropic 的 Claude Code 订阅使用,但你可能听说过他们
00:01:55并不喜欢这种做法,据我所知,这可能会导致你的账号被封。那么,Pi 有什么特别之处?
00:02:00为什么要用它而不是常规的 Codex CLI 呢?原因有几点。首先,
00:02:08Pi 这个助手非常精简且简单,这是一种褒义。它有着极其精简的系统提示词,
00:02:20而且只配备了寥寥几个工具。基本上,据我所知,如果还没变的话,
00:02:28它只带有读取、写入、编辑和 bash 工具。而 bash 工具当然是最强大的,
00:02:36因为只要有了 bash,你基本上就拥有了一切权限,因为你可以
00:02:44通过 bash,也就是命令行,来控制你的整个系统、整台机器,
00:02:50毕竟你可以从那里调用许多其他工具。事实证明,
00:02:55正如我在另一个视频中提到的,命令行界面(CLI)似乎是目前
00:03:03你最想开放给编程助手的东西,因为它们非常擅长使用 CLI,甚至
00:03:10是那些它们从未见过的界面。当然,通过 CLI、通过命令行界面
00:03:15或他人编写的工具,你的助手可以在电脑上完成各种操作。它们可以发送
00:03:21HTTP 请求。它们可以创建并执行脚本。它们可以解析 JSON 数据。它们无所不能。
00:03:29这就是 Pi 助手的哲学。极其精简,但给予它最强大的 bash 工具,
00:03:35让它基本上可以做任何事。再加上内置的精简、干练的系统提示词,
00:03:41你就得到了一个上下文窗口毫不臃肿的助手,它可以非常灵活地
00:03:50按照你的意愿执行任务。而且
00:03:57他们的核心哲学是:与其塞入一堆东西,不如给你一个
00:04:04扩展性极强的助手。你可以安装所谓的“扩展(extensions)”。我们稍后细聊。
00:04:10你可以使用“助手技能(agent skills)”。我指的是这种官方标准,虽然它也算是一种标准,
00:04:17某些工具的实现方式不同。但助手技能的核心理念当然是
00:04:24拥有技能目录和 skill.md 文件,里面包含提示词或额外的上下文,
00:04:31随你如何命名。这些内容是根据需求加载的,不是预加载,而是按需懒加载,
00:04:39取决于助手正在处理的任务。例如,在我当前运行的这个 Pi 会话中,
00:04:46我加载了一堆技能,有些是我设置的全局技能,用来尝试特定的功能,
00:04:53有些则非常实用,比如“代码调研”技能。如果
00:04:59我们查看一下,你会发现它只是一个包含名称和描述的 Markdown 文件。在这个技能里,
00:05:03描述当然至关重要,因为这最终决定了助手是否会
00:05:08激活并使用该技能。只有当助手根据名称和描述判断该技能
00:05:16与当前任务相关时,它才会加载文件的其余部分。然后,还是那句话,
00:05:21这就是一些额外的上下文或提示词,比如在这个“代码调研”技能里,
00:05:26我会告诉任何感兴趣的助手(如 Pi 或 Codex,如果它加载了这个技能的话),
00:05:32该如何进行代码调研,以及我希望它怎么做,比如它应该使用 Peter Steinberger 开发的
00:05:38MC Porter 工具来使用其他 MCP 服务,比如 deep wiki MCP 服务,这个服务
00:05:46可以用来探索 GitHub 仓库并深入了解它们,以及它应该使用的其他调研工具。
00:05:51这里还有另一个重点,谈到 MCP,Pi
00:05:58助手并不原生支持 MCP。原因在于 MCP 往往会占满你的上下文
00:06:05窗口,因为必须将大量关于可用 MCP 工具和资源的信息
00:06:10放入上下文窗口,AI 才能意识到它们的存在。而 Pi 背后的
00:06:18团队或开发者并不希望这样。这就是他们的理由。这种观点也被许多人
00:06:23(包括我自己)所认同。虽然我知道像 MCP search 这样的解决方案,但这里
00:06:28仍然没有原生 MCP 支持。但如果你使用 MC Porter 这样的工具,你就不需要它。
00:06:35我所说的“使用”,是指我告诉 AI 如何在需要
00:06:43使用 MCP 时实时调用这个 MC Porter 工具,这样它就不需要被安装或暴露在
00:06:49上下文窗口中。所以你明白了吧,它非常精简干练。这就是
00:06:54Pi 编程助手的核心故事。我已经提过了,关于这个助手
00:07:01另一件很棒的事就是它的可扩展性。这不仅限于技能,我认为首先是
00:07:08扩展插件。扩展背后的理念是,Pi 编程助手拥有一种原生支持,
00:07:16允许对其进行扩展,挂载到助手的不同部分,或挂载到助手逻辑循环的
00:07:22不同步骤。当助手工作时,允许你进行各种操作并以各种方式扩展
00:07:30这个助手。例如,如果你愿意,你甚至可以自己添加 MCP 支持。
00:07:36我现在自己设置了一堆扩展。例如,我通过一个扩展
00:07:41添加了“规划模式(plan mode)”。原本默认是不带规划模式的,但它的扩展性太强了,
00:07:47你可以添加一个扩展来阻止助手使用写入或编辑工具。当它处于
00:07:53规划模式时,这个扩展允许你设置一个快捷键来切换进入
00:08:00该模式。它还允许你更新 UI(终端界面),向用户显示正处于规划模式。
00:08:07你还可以添加额外的斜杠命令,比如 /plan,它能将我切换到规划模式并显示
00:08:14这个指示符。现在,某些工具就会被锁定,我可以再次切换出来。
00:08:20这就是通过扩展可以实现的操作。而且这里还有一个
00:08:24类似于官方扩展市场的存在,因为 Pi 助手也支持
00:08:31将你的扩展或技能打包并分享给他人。而像你我这样的其他人,
00:08:36就可以安装这些包,例如安装由他人构建的扩展。
00:08:40还有像“子助手(subagents)”这样的东西,你可以通过包含扩展的包来添加,
00:08:47或者添加“网络访问(web access)”包,这非常棒,它赋予了助手额外的工具
00:08:54来进行网页调研并高效获取网站内容。所以你明白了吧。它扩展性极强。
00:09:00你得到一个极简的核心,然后可以按需扩展,添加任何你想要的
00:09:06技能或扩展。这本身就已经非常有趣了,因为
00:09:12对于 Claude Code 或 Codex 以及所有这些工具,你得到的是开箱即用、
00:09:20功能更强但扩展性较差的预置工具。而 Pi 的理念恰恰相反。
00:09:28你得到一个极简核心,然后可以把它变成任何你想要的样子。你既可以
00:09:33全局设置,也可以针对每个项目进行设置,因为所有这些技能和扩展
00:09:39都可以全局安装或按项目安装。这使得它非常多功能。这也是为什么它值得
00:09:46一试。过去几周我一直在用它。除了 Claude Code 和 Codex,我还会经常
00:09:51切换使用,因为这些工具进化得太快了,而我真的很喜欢 Pi。那么,有趣的地方来了。
00:09:59你并不局限于只用 Pi 来写代码。虽然它被称为编程
00:10:08助手,这主要是你(以及我)会用到它的地方。
00:10:15但这并不是它的全部。例如,我确实安装了网络访问
00:10:21包,并将其连接到我的 Gemini API 密钥,从而让这个 Pi 助手拥有了
00:10:30基于 Gemini API 的完整网页调研能力。因此,我可以脱离任何项目、
00:10:35脱离任何编程项目运行这个助手,给它布置这样一个任务:调查
00:10:41过去七天苹果和英伟达股票的情况,获取它们的价格,并分析它们
00:10:46这七天的表现。如果我这么做了,它就会去执行。它会想方设法
00:10:55获取这些股票的价格数据。它会进行网页搜索,也许会访问它们的投资者关系
00:11:04页面,我们拭目以待。当然,它接着还会进行实际的计算,启动一个临时
00:11:12脚本或类似的操作。让我们看看它怎么做。例如,这里它激活了我添加的一个网页调研
00:11:18技能,我在其中提供了关于它该如何进行网页调研的更多细节。然后它尝试执行。
00:11:23现在遇到了一个问题,因为我没有安装 Python,或者不是这个名字的 Python
00:11:29可执行文件,它应该是 python3,它自己也发现了这一点。然后它写了
00:11:34一个脚本,借助 Python 从网站获取了一些数据,这是一个临时脚本,
00:11:40它在这里执行了,看起来它已经获得了一些股价。接着它很可能
00:11:47还会写一小段脚本,以便根据这些数据进行计算并计算
00:11:55股价的波动。在工作了一段时间并对各种事情(包括一些
00:12:01新闻调研)进行了大量研究后,它完成了任务。它给了我苹果和英伟达
00:12:08过去七天的数据,向我展示了它们的股价在这些日子里的变化。这里还给了我一些表现总结。
00:12:14它还给我提供了一些文字分析,将结果总结出来供我
00:12:23阅读,就像一份高管报告。而所有这一切都是由这个 Pi 编程助手配合
00:12:29我给它的扩展和技能完成的,除此之外别无他物。我没写代码,也没指定
00:12:36去访问哪些网站。它全是自主完成的。当然,你完全可以用 Claude Code
00:12:43或 Codex 来做,因为归根结底,它们都是拥有各种工具来完成任务的 AI 助手。
00:12:50虽然它们主要为编程而生,但你当然可以“滥用”它们来做
00:12:56各种其他事情。因为归根结底,这项任务同样涉及获取
00:13:01网页和编写脚本,这与编程项目非常相似,你也可能
00:13:06想让它获取一些文档并编写一些代码,对吧?所以它也能做很多其他事。
00:13:11在我看来,Pi 处理这类任务比 Codex 或
00:13:17Claude 更好一点的原因是,它拥有精简的核心,并且可以被扩展成你完全想要的工具,
00:13:24甚至可以针对每个项目进行定制。所以你可以在系统中让一个项目拥有
00:13:29调研专家,另一个项目拥有,我不清楚,股票研究专家,而第三个项目
00:13:37则拥有一个完全不同的专家,一个分析系统和硬盘
00:13:42利用率的专家,或者随便什么。这可能也是为什么 OpenClaw
00:13:50在内部使用 Pi 的原因。现在我在 deep wiki 的 OpenClaw 仓库页面。如果你还不了解它,
00:13:55这是一个了解 GitHub 仓库的绝佳网站。它会分析仓库并
00:14:00根据它看到的预览代码实时生成文档。你还可以
00:14:05与仓库“对话”。在这里我可以问:OpenClaw 是否在内部使用了 Pi 编程助手?
00:14:12如果是,是怎么实现的?它会分析已经加载好的代码。它告诉我,
00:14:18是的,OpenClaw 正在使用 Pi 编程助手。然后它告诉我具体是如何实现的。所以,
00:14:24这就是 Pi 编程助手。我只是想分享一下。再次声明,不是因为我能
00:14:31从中赚到钱。我没出课程,什么也没有。但它确实是个很棒的工具,尤其是
00:14:38如果你打算或者想尝试用助手处理非编程任务。当然,
00:14:44为了说清楚,对于编程任务,它同样能胜任。它是一款非常
00:14:50全能的 AI 助手。你甚至可以像 OpenClaw 那样在它之上构建自己的工具。
00:14:56虽然你用 Codex 也能做这些事,但再次强调,这里的精简核心真的很赞。
00:15:02所以,除了 Codex 或 Claude Code,或者作为它们的替代品,这款工具都值得一看。
00:15:09过去几周我用得很开心。我很期待看到
00:15:14所有这些助手技术将走向何方,以及一年后我们能用它们做些什么。我得说,
00:15:18这一切既有点令人畏惧,但也非常有趣。一种奇妙的混合感。

Key Takeaway

Pi 编程助手是一个以极简核心为基础、具有极高扩展性的 AI 智能体,它通过赋予最强大的 Bash 权限和按需加载的技能机制,超越了传统编程助手的范畴,成为可定制的通用任务解决工具。

Highlights

Pi 编程助手并非传统的订阅制工具,而是采用按需付费或结合其他现有 API 订阅的使用模式

其核心哲学是“极简主义”,通过精简系统提示词和基础工具(读取、写入、编辑、Bash)降低上下文开销

Bash 工具被视为核心竞争力,赋予了助手控制系统、执行脚本及调用各种外部工具的无限权限

独特的“技能(Skills)”机制支持按需懒加载(Lazy Loading),有效避免了上下文窗口被非必要信息填满

强大的可扩展性允许用户通过插件添加功能,例如规划模式、网页访问以及针对特定项目的专家配置

Pi 并不原生支持 MCP 以保持轻量化,但可以通过 MC Porter 等工具实时调用 MCP 服务而不占用上下文

虽然定位为编程助手,但其自主性和灵活性使其能够胜任股票分析、高管报告撰写等非编程任务

Timeline

市场现状与 Pi 的独特定位

演讲者首先回顾了当前 AI 编程助手市场的激烈竞争,提到了 Claude Code、Cursor 和 GitHub Copilot 等知名工具。他将当下的工具爆发比作 2019 年的 JavaScript 框架之战,强调并没有绝对正确或错误的选择。虽然市场日新月异,但 Pi 编程助手因其独特的功能和哲学值得开发者关注。演讲者明确表示这不是一个赞助视频,他只是纯粹分享一个有价值的发现。通过这一背景铺垫,观众可以理解 AI 助手领域正处于快速进化的阶段。

付费模式与系统集成

本段详细说明了 Pi 在付费机制上与 Codex 或 Claude Code 的显著差异,它不提供传统的月度订阅服务。用户通常选择按需付费,或者通过集成已有的 API 订阅(如 Codex API)来运行 Pi。演讲者分享了自己在系统上安装 Pi 并配合现有订阅使用的经验,同时也提醒了使用其他第三方订阅可能面临的账号风险。这种灵活性使得 Pi 成为那些希望自主控制成本和集成方式的用户的理想选择。这也反映了 Pi 在工具生态定位上的独立性和开放性。

极简核心与 Bash 工具的力量

演讲者深入剖析了 Pi 的核心架构,重点强调了其系统提示词和预设工具的“精简性”。Pi 仅提供读取、写入、编辑和 Bash 这几个基本工具,其中 Bash 工具是其功能的核心,因为它允许助手控制整个命令行界面。由于 AI 在处理 CLI 任务方面表现卓越,这种设计赋予了 Pi 执行 HTTP 请求、解析 JSON 和运行复杂脚本的能力。这种做法的优势在于避免了上下文窗口的臃肿,使得模型能够更专注于当前任务的指令。这种“少即是多”的哲学在实际操作中转化为更高的灵活性和准确度。

按需加载的“技能”与可扩展性

这一章节介绍了 Pi 的核心竞争优势:基于 Markdown 文件的“助手技能”机制。不同于将所有功能预加载到上下文中的传统工具,Pi 采用按需懒加载,只有当助手判断当前任务相关时才会读取技能描述。演讲者以“代码调研”技能为例,展示了如何通过技能文件引导助手使用 MC Porter 等外部调研工具。这种设计有效解决了 MCP 服务容易占满上下文窗口的问题,保持了会话的高效性。这种高度模块化的结构使得 Pi 能够像搭积木一样根据不同任务进行个性化定制。

插件扩展与功能演示(如规划模式)

演讲者展示了 Pi 强大的扩展插件系统,说明用户可以将其挂载到助手的逻辑循环中以改变其行为。他展示了自己添加的“规划模式”扩展,该模式可以通过快捷键或斜杠命令切换,并在处于该模式时锁定写入工具。此外,Pi 还有一个类似于官方市场的生态系统,允许用户打包并分享扩展、技能甚至子助手。这种设计允许开发者为特定项目设置全局或局部的专家配置。这种极高的自定义自由度,使 Pi 从一个通用的预置工具变成了一个可以无限进化的开发平台。

超越编程:自主任务执行演示

为了证明 Pi 不仅仅是一个代码助手,演讲者演示了如何利用其进行复杂的网页调研和财务分析。通过连接 Gemini API 密钥和网页访问扩展,Pi 能够自主搜索苹果和英伟达过去七天的股价。在执行过程中,Pi 展示了极强的适应性,例如它能自动纠正 Python 命令名的错误并编写临时脚本进行数据计算。最终,Pi 生成了一份详细的高管总结报告,全程无需人工干预或编写代码。这一案例有力地证明了 Pi 处理跨领域、非结构化任务的能力,展示了其作为通用 AI 代理的潜力。

开源项目应用与未来展望

在视频的最后,演讲者引用了开源项目 OpenClaw 内部使用 Pi 的例子,展示了它在分析仓库代码和生成文档方面的实际应用。他再次强调了 Pi 极简核心的魅力,认为无论是作为主选还是备选方案,它都极具价值。演讲者表达了对 AI 助手技术快速进化的期待,同时也承认这种技术进步带来的“奇妙的混合感”,既令人兴奋又略带畏惧。他鼓励观众尝试使用这类全能型助手来处理日常任务。总结而言,Pi 代表了 AI 助手从单一功能工具向高度可定制智能体转型的趋势。

Community Posts

View all posts