Claude Code 雲端自動化升級:睡夢中也能幫你寫程式

BBetter Stack
Computing/SoftwareTelecommutingInternet Technology

Transcript

00:00:00几个月前,我做了一个关于 Superpowers 的视频,这是一个 Claude Code 插件,
00:00:05在我看来,它在规划功能方面比内置的计划模式做得更好。
00:00:11但现在团队发布了 UltraPlan,它的工作原理是将计划从 CLI
00:00:15移动到网页版的 Claude Code,它会在云端环境中克隆你的仓库并编写
00:00:20一份详细的计划,供你在云端或回到本地机器上执行。
00:00:25这听起来非常酷,所以请点击订阅,让我们看看我是否认为这种新的规划方式
00:00:29比使用 Superpowers 更好,也比玩宝可梦更好。
00:00:33[音乐]
00:00:37令人恼火的是,在录制这段视频时,Claude 团队刚刚发布了 Claude Routines,
00:00:42并且他们还重新设计了 Claude Code 桌面应用。
00:00:44Anthropic,你们为什么要跑得这么快?
00:00:46不管怎样,这段视频是关于 UltraPlan 功能的,所以让我们直接进入正题。
00:00:50这次演示的重点是为这个产品编写计划,这是我正在开发的一个
00:00:56用于胶片模拟的 CLI 工具,如果你感兴趣,我会在描述中添加链接。
00:01:01但这个计划的重点是构建一个发布流水线。
00:01:04我将首先使用新的 UltraPlan 功能,然后对计划进行对比。
00:01:08为了使用 UltraPlan,你至少需要这个版本的 Claude Code,
00:01:12你可以使用 /ultraplan 命令,或者直接输入 UltraPlan,这会产生
00:01:17这种漂亮的彩虹效果,类似于 UltraThink。
00:01:21然后我要粘贴一段用于构建发布流水线的提示词。
00:01:24我还告诉它不要使用 superpower 技能,以便它可以专注于只使用
00:01:29Claude UltraPlan 功能。
00:01:31但在我按下回车键之前,让我们先看看我的使用率百分比,你可以看到在
00:01:36Claude 进行任何规划之前,它被设置为零。
00:01:38现在如果我按下回车,它会询问我是否要在网页上运行交互式计划,
00:01:43我会选择“是”,看起来 UltraPlan 的创建在使用了大约 4% 时失败了。
00:01:48所以我要在调试模式下运行同样的提示词,现在它给了我这个
00:01:52在浏览器中查看的链接。
00:01:54但我实际上打算在重新设计的 Claude Code 格式中查看它,我要
00:01:58关闭侧边栏,我们可以看到它首先设置了一个云端容器,然后
00:02:02克隆了仓库。
00:02:03我忘了提到,要使用 UltraPlan,你的项目仓库需要托管在 GitHub 上,因为
00:02:08它会创建一个云端会话,并需要克隆仓库来理解代码。
00:02:12一旦完成,它会在云端启动 Claude Code,运行 bash 工具来读取
00:02:16仓库的上下文,然后运行其他几个命令。
00:02:19这里它询问了一些关于计划的问题。
00:02:21大约 2 到 3 分钟后,我在终端收到一条通知,告诉我 UltraPlan 已完成
00:02:26并准备好进行评审。
00:02:27这就是计划。
00:02:28我打算缩小一点以便阅读,并在再次放大一点之前
00:02:33展开这个侧边栏。
00:02:35首先,它告诉我仓库是空的,没有提交也没有代码,这不对。
00:02:40仓库绝对不是空的。
00:02:41不过它掌握了变更的轮廓,看起来不错。
00:02:44它包含了构建脚本和一个精简的 CLI,流水线可以用它进行冒烟测试。
00:02:49这看起来非常全面,而且它在 2 到 3 分钟内就完成了,这让我
00:02:53觉得可能使用了某些子智能体来快速完成任务。
00:02:57但在这一步,我可以选择部分文本,如果我想的话可以添加注释。
00:03:00就像这里,我可以问它:你指的是哪个仓库,你有权访问它吗?
00:03:05从这里开始,Claude 可以修改计划。
00:03:07但在我继续之前,让我们看看新的令牌使用百分比,它已经从
00:03:11由于调试问题的 4% 一路飙升到了 19%。
00:03:15所以制定这个计划使用了我 15% 的令牌。
00:03:18我想这还不算太糟。
00:03:21让我们继续修改这个计划。
00:03:22现在它克隆了正确的仓库。
00:03:24我不知道为什么第一次它没这么做。
00:03:27大约一分钟后,Claude 提出了一个新的计划。
00:03:30如果我们在这里把它展开,可以看到它在理解项目内容方面
00:03:35做得好得多,并且创建了一个流程图,列出了需要修改的
00:03:41确切文件,并改进了用于发布的 GitHub Action。
00:03:45但更新计划的整个过程使使用量从 19% 增加到了 37%,这意味着
00:03:51这整个计划使用了大约 33% 的额度,对于一个计划来说这非常多。
00:03:56现在,我要接受这个计划,它开始在远程执行计划。
00:04:00我敢肯定有办法让它在 CLI 中执行,而不是在
00:04:04云端执行。
00:04:05但那个选项并不是很明显。
00:04:07大约五分钟后,它完成了实施。
00:04:10但由于这个环境中没有 GitHub 凭证,我必须手动创建
00:04:14一个新分支并创建 PR,这倒也不算太麻烦。
00:04:17我确信如果我添加了 GitHub 凭证,如果我有一个私有仓库,它将能够
00:04:21将其拉取并添加到沙盒中以创建计划。
00:04:25但由于这次演示的范围只是评审计划,我们将
00:04:28在这里结束,不再深入研究具体实施。
00:04:32现在让我们看看用 Superpowers 制定的同一个计划。
00:04:35为了节省时间,我已经提前在 Claude Code 中执行过了,
00:04:39这样我们可以直接过一遍。
00:04:41相比 UltraPlan,我更喜欢 Superpowers 的一点是它提问的
00:04:45数量。
00:04:46UltraPlan 问了三个问题,但你可以在这里看到 Superpowers 给出了六个问题,
00:04:50整整两倍。
00:04:51我相信正因如此,它给出了一个更透彻的计划。
00:04:54而且因为它是在本地运行的,它不需要克隆我的仓库,因为它
00:04:58可以直接访问代码。
00:05:00从这里开始,它起草了计划,给出了 CI 流程并概述了所有内容的
00:05:04工作方式。
00:05:05现在 Superpowers 实际上有两个规划阶段。
00:05:08捕获问题和需求的设计计划,以及将设计
00:05:13拆分为易于处理的块的实施计划。
00:05:16这就是 Superpowers 的最终实施计划,它包含目标架构
00:05:21和技术栈,我非常喜欢这一点。
00:05:23还有发布流水线的文件结构以及需要实施的任务列表,
00:05:27包括源代码,这与 UltraPlan 提供的类似。
00:05:31但 UltraPlan 没有提供测试用例,而这正是 Superpowers 的强项。
00:05:35它让模型先编写测试,然后再编写实施代码。
00:05:38在这里我们可以看到关于版本控制的测试。
00:05:42然后你在实际实施版本标志之前运行测试以观察其是否失败。
00:05:46这个过程贯穿了每一个任务。
00:05:50整个计划大约有 833 行,而来自 UltraPlan 的计划
00:05:55大约只有 195 行。
00:05:56值得注意的一点是,创建 Superpowers 设计和实施计划的
00:06:01整个会话消耗了大约 7.51 万个令牌。
00:06:04其中消息传递占了 5.7 万,技能占了 1.9 万,这也是 Superpowers 主要
00:06:10使用的部分。
00:06:11所以如果你认为 Pro 版 5 小时的限制大约是 4.4 万个令牌,那么创建一个 Superpowers
00:06:16计划消耗的要多得多,尽管我不确定限制是否真的是 4.4 万个令牌。
00:06:21而且这还不包括提示词缓存,它在重用现有令牌方面起了很大作用。
00:06:26现在你可能会从那个演示中得到一个印象,就是我更喜欢使用 Superpowers 而不是
00:06:30UltraPlan 来规划功能,你没猜错。
00:06:33但 UltraPlan 也有它的用武之地。
00:06:35例如,如果我知道我将长时间离开我的机器,
00:06:39比如在通勤、坐飞机或在机场等地方,我可能想在我的笔记本电脑上
00:06:44开始一个功能,合上它,关机,然后在手机、平板电脑或其他任何地方继续,
00:06:50并受益于我的代码在云端并能创建 PR,只要我已经在
00:06:55仓库中安装了 Claude 应用,虽然我在这次演示中忘了做。
00:06:58哎呀。
00:06:59现在,如果我选择在本地工作(我 90% 的时间都在本地),那么我可能会
00:07:04使用 Superpowers,因为我所有的代码都在本地,还有我的技能、MCP 工具等一切,
00:07:10而且我可以得到一个更详尽的计划。
00:07:12当然,这并不是说更详尽的计划就意味着更好的执行。
00:07:17这只是我更喜欢的工作方式,因为我在规划事情时
00:07:21可以与模型进行真正的对话。
00:07:22目前 UltraPlan 功能仅通过 Claude Code CLI 提供,也就是
00:07:27终端,并且需要 Pro 或 Max 订阅,因为它有网页版 Claude Code 的链接,但
00:07:32也许在未来,他们会将其推广到不同的订阅计划和不同的
00:07:36平台。
00:07:37所以也许你可以直接从网页版 Claude Code 发起 UltraPlan 会话。

Key Takeaway

本地开发时使用 Superpowers 能通过更详尽的提问生成包含测试用例的长篇计划,而 UltraPlan 则利用云端容器实现脱离本地机器的异步规划与 PR 生成。

Highlights

UltraPlan 通过 /ultraplan 命令在网页版 Claude Code 中创建云端环境并克隆 GitHub 仓库进行规划。

制定一个 UltraPlan 计划消耗了约 33% 的 Pro 订阅额度,生成了 195 行计划内容。

Superpowers 插件通过 6 个针对性提问生成的实施计划长达 833 行,包含了具体的技术栈架构和测试用例。

UltraPlan 在云端完成任务并生成 PR,适合在通勤或只有手机、平板等非开发环境时进行异步开发。

Superpowers 采用先写测试再写代码的模式,提供比 UltraPlan 更详尽的任务分解和流程说明。

使用 UltraPlan 必须确保项目托管在 GitHub 上,以便系统创建云端容器和会话。

Timeline

UltraPlan 的功能定位与初始设置

  • UltraPlan 将规划功能从 CLI 转移到网页版 Claude Code 的云端环境。
  • 使用该功能需要 Pro 或 Max 订阅以及托管在 GitHub 上的项目仓库。
  • 通过 /ultraplan 命令启动后,系统会自动克隆仓库并配置云端容器。

UltraPlan 旨在提供比内置计划模式更强大的规划能力。由于它在云端运行,系统必须能够访问 GitHub 上的源代码来理解项目上下文。启动过程中会出现类似 UltraThink 的彩虹视觉效果,标志着云端会话的开启。

UltraPlan 规划流程与资源消耗

  • 初步规划和一次修改总共消耗了 Pro 订阅约 37% 的令牌额度。
  • 系统生成的流程图列出了确切的修改文件并改进了 GitHub Action 配置。
  • 完成规划后,Claude 在云端沙盒中直接执行任务并准备 PR。

UltraPlan 在 2 到 3 分钟内即可完成初步计划,推测其背后使用了多个子智能体协作。虽然规划消耗的额度较高,但它能提供直观的网页端交互界面。在执行阶段,由于云端环境缺乏预设的 GitHub 凭证,通常需要手动处理分支和 PR 的最终提交。

Superpowers 与 UltraPlan 的深度对比

  • Superpowers 通过 6 个提问收集需求,其生成的 833 行计划远比 UltraPlan 的 195 行详尽。
  • Superpowers 强制执行先写测试后写代码的逻辑,确保每个功能模块都有验证步骤。
  • 本地运行的 Superpowers 可以直接访问代码和 MCP 工具,无需克隆仓库。

对比显示 Superpowers 的规划更为彻底,涵盖了目标架构、技术栈以及详细的文件结构列表。尽管其消息传递和技能调用消耗了超过 7.5 万个令牌,但在处理复杂逻辑和本地开发流程时表现更优。UltraPlan 的优势在于它不依赖本地环境,适合在移动办公场景下使用。

不同场景下的工具选择策略

  • 本地开发优先选择 Superpowers 以获取更深度的对话反馈和详尽计划。
  • 移动办公或长途通勤时利用 UltraPlan 在手机或平板上继续云端任务。
  • UltraPlan 未来可能支持直接从网页端发起会话,而不仅限于 CLI 触发。

工具的选择取决于开发者的物理位置和对计划细致度的需求。Superpowers 适合 90% 的本地工作流程,提供更强的掌控感。UltraPlan 则填补了远程办公的空白,允许开发者在合上笔记本后通过其他设备监控云端代码的实施进度。

Community Posts

View all posts