你不再需要复杂的 Claude Code 工作流了

AAI LABS
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00我们是否已经超越了单纯的管理代理,开始把这个角色也交给 AI 了呢?
00:00:03自从 AI 进入代理领域并开始与各种工具交互以来,
00:00:07一切都发生了变化。现在我们让 AI 代表我们与工具交互,
00:00:11利用像 Claude Code 这样的代理系统来替我们完成工作。我们的角色已经转变为仅仅
00:00:15将任务委托给代理,并让它们处理执行。但我们已经在超越
00:00:20这种委托模式。Claude 推出了一个新更新,它处理任务的方式与以往
00:00:25大不相同:它接管了大部分委派工作,并将其直接集成到了
00:00:30产品中。这增加了一层抽象,改变了我们的工作方式。这正是这位
00:00:35初创公司创始人在他的文章中提到的。现在,Claude 的新更新听起来可能并不
00:00:40那么有冲击力,因为它听起来只是多了些待办事项,但实际上这是一个巨大的更新。
00:00:44“代理集群(agent swarm)”背后的核心思想是让多个 AI 代理协同处理复杂任务,
00:00:50生成子代理并并行管理依赖关系。这意味着它们可以接收用户的一个复杂任务,
00:00:55并将其分解为多个子任务分配给 AI 代理,让它们独立工作。
00:01:00所以现在你和 Claude 对话就像在和项目经理沟通,给它一个宏观任务,
00:01:05Claude 就会自动完成拆解和分派。有了这个更新,你的任务可以
00:01:10在 clear 命令之后,甚至在会话重启后继续保留。稍后我们会详细解释
00:01:14它的工作原理。在这一任务系统出现之前,在使用 Claude 时,我们不得不频繁
00:01:19点击压缩(compact),因为即便它拆分了任务,归根结底还是一个大脑在尝试用它
00:01:24狭小且受限的上下文窗口来维持复杂的流程。在处理大型任务时这变得更加烦人,
00:01:30因为它经常丢失上下文,我们不得不利用结构化笔记创建工作流,
00:01:34以免频繁丢失背景信息。现在我们注意到,在使用 Claude 时,
00:01:39我们不再需要像以前那样频繁点击压缩了。我们以前手动在 Claude.md 或
00:01:44其他引导文件中记录的内容,现在他们已经整合到了产品中。这些代理
00:01:50并不共用同一个上下文窗口。实际上每个代理都有自己独立的窗口。正如我们之前
00:01:55提到的,你与主 Claude 交互,它充当任务协调员。这个协调员会创建一个
00:02:00任务图,识别并将工作分解为较小的任务。然后它会确定
00:02:06每个任务的类型,是顺序任务(即前一个任务完成后才能开始
00:02:10下一个),还是非顺序或并行任务(即没有依赖关系,可以
00:02:15同时运行)。每个任务都遵循完整的调研、计划和实施流程,每个
00:02:20阶段都受到前一阶段的制约。一旦任务图创建完成,它就会生成代理,并根据任务
00:02:26复杂度指派不同的模型。有些任务,比如浏览文件夹,不需要 Opus 4.5 的强大
00:02:32推理能力,Haiku 或 Sonnet 模型就能胜任。每个代理都能获得全新的 200k
00:02:38上下文窗口,且与其他进程隔离。这与 Claude 之前的工作方式截然不同,
00:02:43以前它依赖单一的窗口,容易出问题。而有了这套系统,每个代理
00:02:48都能专注于一件事。你可能已经注意到我们在视频中做了很多演示。
00:02:53所有的提示词、代码、模板,就是那些你通常需要暂停视频从屏幕上复制的东西,
00:02:58都在我们的社区里。本期视频以及之前的每一期视频都有。链接就在简介里。
00:03:02刚才详细解释了新任务系统的工作原理,起初听起来可能
00:03:08没什么大不了。以前,它会将任务写在上下文窗口里,一旦窗口填满,
00:03:13就必须进行压缩,这会导致待办事项在过程中变得混乱。现在,任务不仅仅
00:03:18存在于上下文窗口中。他们在主 main.claud 文件夹下添加了一个新的任务文件夹,
00:03:23每个会话都有一个以 Session ID 命名的子文件夹。在每个文件夹内,有一组
00:03:29代表系统任务的 JSON 文档。这些 JSON 文件通过 ID 识别,并
00:03:34包含名称、描述和状态。需要关注的两个关键键值是 blocks 和 blocked by。blocks
00:03:41键列出了被当前任务阻塞的任务,而 blocked by 包含了所有
00:03:46阻塞当前任务的任务,只有在它们执行后,当前任务才能继续。这种设置
00:03:51确保了正确的顺序,因为它创建了一个依赖图,显示了哪些任务依赖
00:03:56其他任务,哪些任务被阻塞。基本上,这引导了 Claude,使其在必需任务
00:04:01完成前无法跳过后续任务。如果没有这个图谱功能,每次你
00:04:06想使用 clear 命令时,都必须重新向 Claude 解释一遍,但现在不需要了。这种逻辑已被
00:04:11外部化到文件结构中,即使会话结束,系统也能保留其状态,
00:04:16无论你多久之后再回来。这样一来,Claude 就不必纠结
00:04:20哪些任务需要重做。图谱不会遗忘,也不会偏离目标。目前的文件夹名
00:04:26只是会话的随机 ID,但如果你设置一个自定义名称的环境变量,
00:04:31它就会通过该名称识别会话。这确保了即使关闭终端,任务也不会丢失,
00:04:36Claude 可以无缝继续会话。通过这次更新,Anthropic 终于
00:04:41终结了原本旨在重新锚定任务系统的 Ralph 循环。现在,Claude
00:04:45可以自动处理这一切。另外,如果你喜欢我们的内容,请考虑点个赞,
00:04:50因为这能帮助我们创作更多内容,让更多人看到。之所以
00:04:55这种方法很重要,是因为它通过有效地管理并行和顺序步骤,赋予了 Claude 并行处理的自由度。
00:05:01Claude 会识别出哪些可以并行运行,哪些不能,
00:05:06并基于此节省完成任务的时间。例如,
00:05:11它发现任务 1 和任务 2 没有依赖关系,就会同时启动两个。在下一层,
00:05:16它识别到任务 3 和任务 4 被任务 1 阻塞,因此会等待任务 1 完成后再
00:05:22开始后续任务。通过这种方式,最后一个任务仅需三个周期即可完成。以前,
00:05:27这 5 个步骤需要 5 个波次,每个波次都要按顺序等待上一个完成。但
00:05:32采用这种方法,通过同时运行任务减少了执行时间。这不仅
00:05:38节省了时间,还降低了成本,因为模型会根据任务匹配资源,不会在
00:05:42小任务上浪费额外的 token。但在看实际操作之前,先听听我们赞助商
00:05:47Lovart 的介绍。看到这些设计,你可能会觉得是专业机构做的,但这是
00:05:52首个具备真正创意直觉的 AI 设计代理。使用 Lovart 设计更简单,因为它能帮你
00:05:57即时可视化任何概念。从复杂的包装和室内布局到独特的珠宝
00:06:02系列,它是能交付专业创意成果、搞定工作的设计代理。
00:06:07其真正的威力在于独家的编辑功能。通常 AI 生成的文本很乱,
00:06:12但通过 TextEdit,我只需输入文字就能完美重写标题。有了 Lovart AI,
00:06:17你可以为工作生成惊艳的海报,并使用编辑元素来移动、调整或更换单个
00:06:22图层,或使用触摸编辑来精确更换物体而不破坏风格。这能让你
00:06:27不费吹灰之力地产出更多高质量帖子。你甚至可以一键将最终的静态
00:06:32视觉稿变成视频。点击置顶评论中的链接即可免费开始设计。
00:06:38我们的团队在 Claude Code 和 Co-Work 的多个场景中测试了这种集群模式。
00:06:42对于不了解的人,Co-Work 基本上就是面向非开发者的 Claude Code。这个想法
00:06:47源于一个事实:他们最初开发 Claude Code 时,只打算给开发者用。
00:06:52但他们意识到它几乎对任何事情都有用。Co-Work 比 Claude Code 有更多的
00:06:57护栏,因为它不是针对开发者的。这有助于防止代理意外
00:07:02删除或破坏它不该碰的东西,对非技术用户友好得多。
00:07:07我们的团队也一直在用它处理非开发任务,比如调研、规划,甚至通过
00:07:13连接 Notion 来管理频道的内容构思过程。所以 Anthropic 将其简化并发布了
00:07:18Co-Work,它本质上能做 Claude Code 能做的所有事,与文件系统交互并
00:07:23根据需要进行修改。如果你想整理文件夹或在其中进行更改,Co-Work 非常好用。
00:07:28我们一直在大量使用 Co-Work 来处理这类事务。我们有一个包含很多
00:07:32项目的文件夹,大部分是为了测试,我们在查找以前项目中用过的特定
00:07:37技能时遇到了困难。于是我们让它创建一个文档,详细列出每个
00:07:42项目包含的内容。我们还让它查看 Claude.md 和我们创建的可重用命令,
00:07:47并以此为据进行区分。它首先探索了我们连接的文件夹并创建了
00:07:52待办事项。然后,它使用了我们之前提到的与 Claude Code 相同的代理集群方法。它生成了
00:07:58多个代理分批读取文件,并为每个项目的内容编写文档。
00:08:03最后,每个项目都有了一个总结其功能的预览文件,这使得导航
00:08:08和寻找所需内容变得容易得多。我们还用 Co-Work 为正在开发的一个 App 做了
00:08:13可行性和市场研究,它生成了一份包含所有调查结果的正式文档。就像
00:08:18Claude Code 一样,它提出问题,并根据答案生成一份综合报告。它把
00:08:23报告保存到了我们连接 Co-Work 的文件夹里。你也可以用 Claude Chat 做类似的事,
00:08:27但现在它实际上可以访问文件夹内的文档,这有助于更有效地
00:08:32引导研究。生成的报告格式也很规范,因为 Co-Work 配备了
00:08:37比以前更专业的文档创建技能。当研究和 PRD 文档通过 Co-Work 完成后,
00:08:42我们就转到 Claude Code 进行实际的实施部分。
00:08:48我们让 Claude Code 查看文件夹内的文档(即之前引导 Co-Work 调研的
00:08:53项目构思文档),并将其分解为不同的组件,专注于 PRD 的某一个方面。它分析出
00:08:57PRD 包含多个部分,并意识到这些部分彼此独立,可以并行处理。
00:09:03于是,它生成了多个代理同时编写代码,每个代理独立工作。
00:09:08如果没有这种并行机制,原本需要 16 个连续步骤才能完成的工作,由于
00:09:13并行化被缩减到了一个步骤,从而显著加快了进程。现在,Claude 会自动
00:09:18分解复杂任务,但有时它不会,因为它觉得请求不够复杂,不需要拆解。
00:09:23如果不拆解,你可以用类似“请将其拆分为带有依赖关系的任务”之类的提示词来要求它。
00:09:28然后它就会创建依赖图并用它来管理工作流。
00:09:34你甚至可以通过按下 Ctrl+T 来查看待办事项。由于这是一个长期项目,我们将
00:09:38CLI 标志设置为了项目名称,以便以后可以返回。本期视频到这里就结束了。
00:09:44如果你想支持本频道并帮助我们继续制作这样的视频,可以通过加入
00:09:49AI Labs Pro 来实现。一如既往,感谢观看,我们下期再见。
00:09:53AI Labs Pro. As always, thank you for watching, and I'll see you in the next one.

Key Takeaway

Claude 通过引入自动化的代理集群与外部化任务管理系统,彻底简化了复杂工作流并极大提升了大规模任务的处理效率。

Highlights

Claude 推出了全新的“代理集群(Agent Swarm)”工作流,实现了从单纯委托到自动化管理的转变。

系统通过生成独立上下文窗口(200k)的子代理,解决了单一上下文窗口易丢失信息和混乱的问题。

新架构引入了基于 JSON 文件的外部化任务依赖图,支持任务的并行执行与跨会话状态保留。

Anthropic 推出了针对非开发者的工具 Co-Work,具备更强的安全护栏并能处理文件系统交互。

通过并行处理机制,复杂的 16 步任务可以缩减至 1 个周期完成,显著提升效率并降低 Token 成本。

Timeline

从委托到代理集群的演进

视频开篇探讨了人类角色如何从工具使用者转变为任务委托者,并进一步向 AI 自动化管理迈进。演讲者指出 Claude 的新更新将复杂的委派工作直接集成到产品内部,形成了一种全新的抽象层。代理集群的核心思想是让多个 AI 代理协同工作,主代理像项目经理一样将宏观任务拆解为子任务。这种模式允许系统自动并行管理依赖关系,使用户不再需要手动干预复杂的执行流程。通过 clear 命令或重启会话,任务状态依然能够得到保留,标志着工作方式的根本性变革。

解决上下文限制与任务压缩问题

在引入新系统之前,用户在处理大型任务时必须频繁使用压缩命令,以应对受限的上下文窗口。过去单一的“大脑”很难在有限空间内维持复杂流程,导致背景信息丢失,用户不得不依赖结构化笔记来手动维护状态。现在,每个生成的子代理都拥有独立的 200k 上下文窗口,它们相互隔离且专注于特定任务。主协调员会创建任务图,根据任务复杂度(如简单文件夹浏览或深度推理)指派不同的模型如 Haiku 或 Opus。这种分布式架构彻底告别了对单一窗口的依赖,极大地增强了系统的鲁棒性。

基于文件结构的任务持久化机制

视频详细解释了任务系统在文件层面的运作原理,即在主文件夹下创建以 Session ID 命名的 JSON 任务文档。这些 JSON 文件通过 blocks 和 blocked by 键值对定义了任务间的先后顺序和依赖关系,确保逻辑严密。这种逻辑被外部化到文件结构中,意味着即使关闭终端或长时间离开,Claude 也不会遗忘项目进度或偏离目标。用户可以通过设置环境变量来自定义会话名称,实现无缝的任务衔接。这一更新标志着传统的 Ralph 循环(旨在重新锚定任务系统)被更高效的自动化流程所取代。

并行处理带来的效率与成本优势

演讲者通过具体示例展示了并行执行如何节省时间,例如将原本需要 5 个周期的顺序任务缩减至 3 个周期。系统会自动识别哪些任务可以同时启动,哪些任务必须等待前置条件完成,从而最大化资源利用率。这种方法不仅显著缩短了执行时间,还通过精准匹配模型资源(避免在简单任务上使用高成本模型)降低了 Token 消耗。此外,视频中间插播了赞助商 Lovart 的介绍,强调其作为 AI 设计代理在创意视觉生成和精准编辑方面的强大功能。这些技术的结合展示了 AI 代理在缩短专业工作流程方面的巨大潜力。

Co-Work 与 Claude Code 的实战应用

团队分享了针对非开发者设计的 Co-Work 工具的测试心得,该工具具备更多护栏以防止意外删除文件。在实际场景中,Co-Work 被用于自动整理乱七八糟的项目文件夹,并为每个项目生成预览总结文档。在进行市场可行性研究时,它能根据用户回答生成专业的报告,并直接存储在本地文件夹中。随后,这些调研成果被喂给 Claude Code,后者自动将其拆解并指派多个代理并行编写代码。通过这种协同模式,复杂的 16 步实施过程被大幅简化,用户还可以使用 Ctrl+T 快捷键实时监控任务图的执行进度。

Community Posts

View all posts