构建完整 Claude 操作系统的蓝图

中文العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Português Русский

Computing/SoftwareInternet Technology

Transcript

00:00:00想象一下你是中世纪的国王。你要管理整个王国，但你却什么

00:00:04都不想做，只想让别人帮你处理。问题是你做不到，因为你的员工习惯了

00:00:10事事依赖你。你真正需要的是一个能自动运转整个王国的系统，

00:00:15而这正是 Claude Code 所实现的功能。自从 Anthropic 不断推出

00:00:19更新以来，它已经不再仅仅是一个编码代理，而是变成了一个完整的操作系统，一个可以

00:00:25协调你机器上一切任务的系统。但动态工作流才是真正将这一切串联起来的关键。

00:00:30所以在我们的国王把整个王国交给一个代理之前，让我们看看它是如何运作的。

00:00:35自从 Anthropic 开始推出让我们消耗 Token 的新方式（这其实只是他们

00:00:40从 Claude Code 赚更多钱的借口）以来，它已经不仅仅是一个编码代理了。它

00:00:44基本上已经是一个完整的操作系统。正如操作系统是每一个

00:00:50任务的基础，并协调你在机器上所做的一切一样，Claude Code 现在也扮演着同样的角色。它协调

00:00:55并控制你在机器上所做的一切。但在深入了解动态工作流如何完善这一

00:01:00系统之前，你需要了解其他组件。计算机操作系统与

00:01:04Claude Code 操作系统的唯一区别在于，你不需要在安装上

00:01:08花费那么多精力，除非你是在用 Arch Linux。而且不，你不需要安装

00:01:12一大堆驱动程序，仅仅为了让麦克风工作，好让你能像个“氛围大师”一样使用语音提示。

00:01:17就像一个真正的操作系统一样，它由多个部分组成。每一个部分都很重要，缺少任何一个

00:01:22系统就不完整。在操作系统中，内核是最重要的一层，构成了核心并

00:01:28控制所有操作。Claude Code 的等价物就是 Claude.md 文件和你的上下文文件。

00:01:33我们已经制作了一个完整的视频，专门讲解如何构建 Claude.md 文件，以便让你的代理

00:01:39发挥出最佳性能。这之所以重要，是因为内核是整个代理的驱动程序。

00:01:44如果它没有设置好，代理就无法弄清楚你的项目到底想要什么。而其他

00:01:48部分也会随之崩溃。就像你结婚后整个生活都随之崩溃一样。接着是

00:01:53驱动程序，即允许系统与外部设备交互的组件。Claude Code 中的等价物

00:01:58是 MCP。所以每当 Claude 需要一个外部工具时，它就会通过 MCP 获取该工具并

00:02:04调用它来完成工作。接下来是日常程序，在 Claude Code 中就是技能和

00:02:09其他命令。它们包含了可重复任务的结构化指令，你可以在任何时候调用它们。

00:02:14每个操作系统也需要一个调度程序或定时任务，在预定时间运行特定任务。

00:02:20同样，Claude Code 最近添加了循环和例程。这些基本上就是它的定时任务，

00:02:25它们消除了你通过任务进行监控的需要。它们会自动处理你原本需要

00:02:29手动完成的重复性工作。因此，即使你的系统离线，任务也会继续独立运行。所以你可以

00:02:34安稳地睡觉，因为你知道你那个根本没人用的 B2B SaaS 应用程序

00:02:40正在被照看。最后也是最重要的一点，有一件东西将所有组件连接成一个

00:02:45完整的操作系统。那部分就是动态工作流，这是 Opus 4.8 随附的新功能。

00:02:50你可能已经知道 Claude Code 有动态工作流。基本上，它们是 Anthropic

00:02:55简化长时间运行任务的另一种尝试。它们作为可重复的指令，生成多个

00:03:01代理来执行它们被设计要完成的任务。那么它与其他你已经拥有的架构有什么不同呢？

00:03:06为了对比，第一个也是最简单的就是“技能”。技能是针对需要引导步骤的

00:03:11任务的重复性指令。但是一个技能是由一个代理生成的，并且同一个代理从中读取

00:03:17指令。它只是引导代理以更好的方式完成它已经知道的任务，并不能帮助完成

00:03:22长时间运行的任务。这只是一个代理在完成整个事情。接下来是“目标”命令。它

00:03:27朝预定义的最终目标进行迭代，代理会一直循环直到达到结束条件。这是

00:03:32改善长时间运行任务的一次非凡尝试。自从它发布以来，我们一直在自己的工作流中频繁使用它。

00:03:38目标和工作流都可以协调多个代理，但它们是不同的。

00:03:43区分它们的核心点是确定性。目标是非确定性的，意味着系统决定

00:03:48接下来做什么。工作流是确定性的，代码决定了到底发生什么。你通过

00:03:54使用关键字“workflow”来创建你的第一个工作流。从你提示词中的那个词，Claude 会识别出

00:03:59任务所需的动态工作流，但这是一个我们经常在提示词中使用的词，所以你可能

00:04:04会认为它每次都会触发。但它不会，除非提示词真正表达了

00:04:09创建工作流的意图。这就是工作流真正不同的地方。它不使用其他人使用的常见 Markdown，

00:04:14而是创建 JavaScript 代码。它位于 .claude 文件夹内的工作流目录中，

00:04:19它使用整个脚本来控制整个事情。所以你的计划不再仅仅存在于

00:04:23上下文窗口中，而是以代码的形式写下来，一步步定义子代理如何工作。

00:04:28它定义了严格的 Schema（模式），本质上是子代理的表单，以便它们能以

00:04:33严格的格式输出结果。每个代理都会带着提示词和必须满足的表单被调用。它会一直工作，

00:04:39直到输出匹配该模式，然后返回其发现。你通过带有工作流名称的斜杠

00:04:44命令来调用它们，然后你可以把想要压力测试的计划交给它。它在

00:04:49后台运行，这样你就可以继续做你自己的工作，再给它一个提示词，好让你的项目经理

00:04:53为你的人工智能生产力感到骄傲。要检查进度，你只需运行工作流

00:04:58命令。在那里你可以看到每个工作流的每一个阶段，以及每个代理调用的所有模型，

00:05:03还能看到每个任务消耗了多少 Token。如果你的会话在工作流运行期间结束了，

00:05:08你不必担心丢失进度。它在你运行 resume（恢复）命令后会持续存在。每个工作流

00:05:14保留自己的 ID。当你恢复时，它会从内存中拉取所有缓存的代理工作，并从

00:05:19中断的地方继续。与我奶奶不同，它不会忘记支付 Claude AI 的账单，而且确实

00:05:24记得它需要做什么。在你使用工作流之前，有一点需要注意。由于这处于研究

00:05:29预览阶段，动态工作流消耗的 Token 比典型的 Claude Code 会话多得多。这是因为

00:05:35它们在底层使用了多个子代理，每个子代理都在自己的独立上下文窗口中运行。你需要

00:05:40仔细考虑你什么时候真正需要它们，否则你会在几小时内用完你的 200 美元额度。

00:05:45有几个关键指标可以告诉你工作流是否是最佳选择。第一个

00:05:50是任务可以被拆分成独立的单元。如果代理依赖彼此的工作，

00:05:55它们最终会互相等待，那么生成工作流就没有意义，因为你会失去所有的

00:06:00并行性。这就是为什么如果任务之间的依赖性较小，你会获得更好的并行性和

00:06:05更快的产出。这点你们的初创公司应该学学，因为它现在还依赖父母的钱

00:06:10来生存。使用动态工作流的下一个原因是任务需要的上下文

00:06:15窗口超过一个，并且需要分块运行。工作流使用多个子代理，每个都有

00:06:21自己的上下文窗口，所以任务规模要足够大，才能真正需要那些单独的窗口。否则，

00:06:26你只是在浪费时间和 Token。每个子代理在各自全新的上下文中运行，并且只返回

00:06:31结果。它们其余的推理过程留在代码文件中，除非你需要，否则不会进入主上下文窗口。

00:06:36下一个原因是任务值得验证。当错误答案的代价足够大，以至于在继续之前需要交叉验证时，使用工作流。

00:06:41这包括安全发现、Bug 声明和迁移等事项。

00:06:46但这种验证需要额外的代理，会燃烧掉 Token 和时间。

00:06:52所以要确保任务是值得的，你不是仅仅因为最近听到某 AI 科技公司 CEO 说“更多 Token 等于更多钱”而生成了五个代理。

00:06:57最后一个原因是你的任务是确定性的。工作流使用代码以固定结构调用代理。

00:07:03所以如果任务是确定性的，那就用吧。

00:07:09如果任务不是确定性的，且需要代理在运行时评估下一个任务是什么，那就不适合用工作流。

00:07:14接下来的任务是什么，工作流并不适用于这种情况。所以在选择工作流还是

00:07:20目标模式时，要考虑任务的形态。任务可以是广度优先或深度优先的。广度意味着可以拆分为多个

00:07:25可以同时运行的子任务。深意味着一次一个任务，一步步深入其中。

00:07:32工作流是宽的，所以它不深入，而是调用代理并让它们迭代。对于深层

00:07:37任务，目标命令一次处理一个任务，不会像工作流那样并行运行。

00:07:43只有在任务确实合适时才去尝试工作流，这样你就不会浪费 Token。

00:07:48Claude Code 自带一个内置的动态工作流叫“深度研究”。它基本上就是

00:07:53我们过去通过多个上下文文件和 Claude.md 手动构建的多步研究流水线。现在

00:07:58它只是一个你可以在任何项目中调用的工作流。这项研究构成了你所构建的整个操作系统的重要部分。

00:08:04它确保了该系统背后的信息来源是可信的，这样你妈就没法用她 Facebook 中老年群里的假信息来喂你，

00:08:09然后在你查证她时责骂你。它分五个

00:08:14部分运行，每一部分都引导至下一部分。首先，它搜索信息，然后获取找到的来源细节。

00:08:19之后是对抗性验证来交叉核对这些主张，

00:08:24然后它将幸存下来的信息合成一份最终文档。你可以通过

00:08:29workflows 命令观看它的工作过程，其中每个子代理都继承了父代理的工具，这真的是非常消耗

00:08:34Token 的，所以它很快就能烧掉你的全部限额。这一次运行在一个小话题上就花了一百万 Token。

00:08:39除了多步研究，你还可以构建其他成为你的研究系统一部分的研究工作流。

00:08:45我们为自己做的一个工作流会研究竞争对手，检查他们的表现，

00:08:49并找出他们的竞争优势。如果你是一个产品构建者，这是一个重要的部分。你

00:08:54需要知道你的竞争对手在市场上的表现，以便你能打造出更好的产品。

00:08:59这个工作流像研究工作流一样被分成四个阶段，一旦完成，它就会报告

00:09:04回调查结果。我们的运行使用了 679,000 个 Token 和 34 个代理，并写出了一份带有其发现的完整 Markdown 报告。

00:09:11它也会随着运行不断自我优化。当遇到问题时，它会应用修复程序，所以下次你运行时，

00:09:17它就不会再遇到第一次遇到的那些问题。报告随附有明确定义的

00:09:21比较指标和所有研究结果，所以当你构建产品时，你可以将它作为在发布前分析市场的来源。

00:09:26另外，如果你喜欢我们的内容，请考虑按下

00:09:30“赞”按钮，因为它有助于我们创作更多类似内容并触达更多人。

00:09:35每个操作系统都需要它的内核、驱动程序以及使其完整的组件。总之，

00:09:41它们让你无需输入即可运行它。这种系统的一个例子是“第二大脑”设置。这绝对

00:09:45有用，尤其是当你的第一大脑像我们的那样，自从我们的设备被大模型“祝福”之后就完全废掉的时候。

00:09:50这个第二大脑的内核就是你的 Claude.md，

00:09:55它包含了如何导航整个系统的信息。日常程序，那些可重复的

00:10:01事情就是你的技能。它们承载了你反复执行的任务说明。这里是设置

00:10:06它的最佳方式。当你深陷一个长会话并意识到这是你经常要做的事情时，

00:10:11只需让 Claude 将该会话的经验整合为一个技能。这个操作系统的记忆就是你

00:10:16在知识库中创建和维护的所有文件。它们记录了你做什么以及你怎么做。

00:10:21这意味着它比你更了解你自己，它们为 Claude 提供了你正在从事的每一件事的上下文。

00:10:25我们经常需要第二大脑访问外部来源，所以我们配置了

00:10:29Google 日历和 Notion MCP。这样它就可以访问 Notion 中的项目文件并同步数据，

00:10:35读取日历上的日程，并创建和更新条目，以便它能在你已经忙碌的日程中挤出时间让你“接触大自然”。

00:10:41我们在 Claude.md 中记录了它应该遵循的确切格式，

00:10:46而最重要部分是为你的设置创建工作流。这些允许你并行化

00:10:51你的重复性任务并将其交给子代理。我们构建的晨报工作流会生成子代理

00:10:57从多个来源收集信息并返回一份报告来开始我们的一天。一旦所有这些都设置

00:11:02好了，你只需要给它一个提示词。它会加载正确的技能和上下文，在正确的地方创建文件，

00:11:07并自行将信息连接到相关部分。如果你一直在使用第二大脑

00:11:12一段时间，你应该建立一个审计工作流。它会检查断链并暴露设置中的每一个问题

00:11:17并报告它们。从那里你可以运行修复程序，让你的第二大脑保持最佳

00:11:22状态，但考虑到你是什么样的人，你下周大概就要为它的心理咨询买单了。

00:11:27类似于你可以为非编码项目设置整个操作系统，你也可以为

00:11:32你的编码项目做同样的事。你将 Claude.md 设置为内核，并将所有项目

00:11:37信息放入其中。你为你的项目配置代理，它们充当你的日常程序。

00:11:42你还可以为不同情况设置钩子，比如在代理完成编辑后格式化文件，

00:11:46这样在你称为关系和代码的那团“烂摊子”之间，至少有一件事是有组织的。

00:11:51你为不同的任务创建技能，比如添加一个新的端点。这样每个端点都

00:11:56遵循你想要的精确 Schema，并且你可以为诸如在发布前审查更改、迁移代码库或数据库、

00:12:01以及运行端到端测试以确认整个应用程序工作正常等事情创建工作流。

00:12:07不用担心凌晨 2 点经理打来电话说你的生产环境又挂了，

00:12:12这个操作系统的上下文变成了你的文档文件夹中的文件和代码本身。工作流对

00:12:17项目迁移非常有帮助。你可以构建一个将你的整个项目从一个库转换为

00:12:22另一个库，并让各个代理处理转换。我们之前测试过，没有

00:12:27工作流它花了一个多小时，但有了工作流它只花了 21 分钟。所以节省的时间

00:12:32可以投入到更重要的事情上，比如滚动浏览 Dario 的不当深伪视频。

00:12:37这就是我们的操作系统如何扩展到编码用例的，所以当你构建项目时，

00:12:43你不必凡事亲力亲为。你让操作系统为你处理。如果你想

00:12:47创办下一家大型 AI B2B SaaS 公司但不知道从哪里开始，你应该加入 AI Labs Pro。

00:12:53在那里你可以找到视频中使用的工作流，以及所有其他资源、

00:12:57指南和好东西。你还将见到一群志同道合的极客，

00:13:01包括我们的团队。链接在描述中，你可以去看看。

00:13:05这就是本视频的结尾。如果你想支持频道并帮助我们继续制作

00:13:09类似的视频，你可以通过下方的“超级感谢”按钮进行支持。像往常一样，感谢

00:13:14观看，我们下个视频再见。

Key Takeaway

通过将 Claude Code 配置为集成内核 (Claude.md)、技能程序与确定性动态工作流的完整操作系统，用户可实现任务并行化并大幅缩短复杂编码与研究流程的执行时间。

Highlights

Claude Code 演变为完整操作系统，通过内核、驱动程序、日常程序和动态工作流协调机器任务。
动态工作流利用确定性代码定义子代理的执行逻辑，将长时任务拆分为并行处理单元以提升效率。
项目代码库迁移任务在使用动态工作流后，处理时间从 60 分钟缩短至 21 分钟。
研究工作流通过多阶段（搜索、获取、对抗性验证、合成）自动生成完整的 Markdown 研究报告。
动态工作流作为研究预览功能，因涉及多个并行子代理，在处理特定议题时消耗高达 100 万个 Token。
第二大脑设置通过配置 MCP（如 Notion 和 Google 日历）实现自动化数据同步与任务管理。

Timeline

Claude Code 操作系统架构

系统核心由 Claude.md 上下文文件构成，负责驱动代理行为。
MCP 组件充当驱动程序，负责与外部工具进行交互。
技能和循环程序处理结构化的重复性任务。
自动例程消除对任务手动监控的需求。

Claude Code 已从单一编码工具转变为协调机器一切任务的操作系统。内核 (Claude.md) 控制所有操作，缺失则导致代理无法理解项目需求。外部交互依赖 MCP 获取工具，日常重复任务则通过结构化指令（技能）执行。新增的循环和例程功能允许系统在离线状态下持续处理任务。

动态工作流机制与逻辑

工作流通过 JavaScript 代码而非 Markdown 定义，确保子代理执行的确定性。
任务拆分为独立单元可获得最佳并行性与产出速度。
工作流适合长时任务、需分块处理的大上下文项目及高风险的交叉验证任务。

动态工作流由 Opus 4.8 引入，通过代码定义严格的 Schema 和子代理逻辑。与非确定性的“目标”模式不同，工作流具有确定性。使用时需注意 Token 消耗，因为每个子代理在独立上下文窗口运行。若任务依赖性过强或不可拆分，使用工作流会丧失并行优势并导致效率低下。

深度研究与自动化应用

深度研究工作流通过五阶段流水线自动验证并合成可信信息。
自动化审计工作流可定期检查设置中的断链与错误。
通过将项目文档与代码库集成，编码项目可实现自动化审查与数据库迁移。

内置的深度研究工作流可自动化进行信息搜索、来源核对与合成。此外，通过将 Claude.md 作为内核构建“第二大脑”，用户可将 Notion 和日历等工具集成以管理日常事务。在编码领域，此架构支持自动执行发布前审查、库迁移和测试，极大减少手动操作。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video