00:00:00我们是否已经超越了单纯的管理代理,开始把这个角色也交给 AI 了呢?
00:00:03自从 AI 进入代理领域并开始与各种工具交互以来,
00:00:07一切都发生了变化。现在我们让 AI 代表我们与工具交互,
00:00:11利用像 Claude Code 这样的代理系统来替我们完成工作。我们的角色已经转变为仅仅
00:00:15将任务委托给代理,并让它们处理执行。但我们已经在超越
00:00:20这种委托模式。Claude 推出了一个新更新,它处理任务的方式与以往
00:00:25大不相同:它接管了大部分委派工作,并将其直接集成到了
00:00:30产品中。这增加了一层抽象,改变了我们的工作方式。这正是这位
00:00:35初创公司创始人在他的文章中提到的。现在,Claude 的新更新听起来可能并不
00:00:40那么有冲击力,因为它听起来只是多了些待办事项,但实际上这是一个巨大的更新。
00:00:44“代理集群(agent swarm)”背后的核心思想是让多个 AI 代理协同处理复杂任务,
00:00:50生成子代理并并行管理依赖关系。这意味着它们可以接收用户的一个复杂任务,
00:00:55并将其分解为多个子任务分配给 AI 代理,让它们独立工作。
00:01:00所以现在你和 Claude 对话就像在和项目经理沟通,给它一个宏观任务,
00:01:05Claude 就会自动完成拆解和分派。有了这个更新,你的任务可以
00:01:10在 clear 命令之后,甚至在会话重启后继续保留。稍后我们会详细解释
00:01:14它的工作原理。在这一任务系统出现之前,在使用 Claude 时,我们不得不频繁
00:01:19点击压缩(compact),因为即便它拆分了任务,归根结底还是一个大脑在尝试用它
00:01:24狭小且受限的上下文窗口来维持复杂的流程。在处理大型任务时这变得更加烦人,
00:01:30因为它经常丢失上下文,我们不得不利用结构化笔记创建工作流,
00:01:34以免频繁丢失背景信息。现在我们注意到,在使用 Claude 时,
00:01:39我们不再需要像以前那样频繁点击压缩了。我们以前手动在 Claude.md 或
00:01:44其他引导文件中记录的内容,现在他们已经整合到了产品中。这些代理
00:01:50并不共用同一个上下文窗口。实际上每个代理都有自己独立的窗口。正如我们之前
00:01:55提到的,你与主 Claude 交互,它充当任务协调员。这个协调员会创建一个
00:02:00任务图,识别并将工作分解为较小的任务。然后它会确定
00:02:06每个任务的类型,是顺序任务(即前一个任务完成后才能开始
00:02:10下一个),还是非顺序或并行任务(即没有依赖关系,可以
00:02:15同时运行)。每个任务都遵循完整的调研、计划和实施流程,每个
00:02:20阶段都受到前一阶段的制约。一旦任务图创建完成,它就会生成代理,并根据任务
00:02:26复杂度指派不同的模型。有些任务,比如浏览文件夹,不需要 Opus 4.5 的强大
00:02:32推理能力,Haiku 或 Sonnet 模型就能胜任。每个代理都能获得全新的 200k
00:02:38上下文窗口,且与其他进程隔离。这与 Claude 之前的工作方式截然不同,
00:02:43以前它依赖单一的窗口,容易出问题。而有了这套系统,每个代理
00:02:48都能专注于一件事。你可能已经注意到我们在视频中做了很多演示。
00:02:53所有的提示词、代码、模板,就是那些你通常需要暂停视频从屏幕上复制的东西,
00:02:58都在我们的社区里。本期视频以及之前的每一期视频都有。链接就在简介里。
00:03:02刚才详细解释了新任务系统的工作原理,起初听起来可能
00:03:08没什么大不了。以前,它会将任务写在上下文窗口里,一旦窗口填满,
00:03:13就必须进行压缩,这会导致待办事项在过程中变得混乱。现在,任务不仅仅
00:03:18存在于上下文窗口中。他们在主 main.claud 文件夹下添加了一个新的任务文件夹,
00:03:23每个会话都有一个以 Session ID 命名的子文件夹。在每个文件夹内,有一组
00:03:29代表系统任务的 JSON 文档。这些 JSON 文件通过 ID 识别,并
00:03:34包含名称、描述和状态。需要关注的两个关键键值是 blocks 和 blocked by。blocks
00:03:41键列出了被当前任务阻塞的任务,而 blocked by 包含了所有
00:03:46阻塞当前任务的任务,只有在它们执行后,当前任务才能继续。这种设置
00:03:51确保了正确的顺序,因为它创建了一个依赖图,显示了哪些任务依赖
00:03:56其他任务,哪些任务被阻塞。基本上,这引导了 Claude,使其在必需任务
00:04:01完成前无法跳过后续任务。如果没有这个图谱功能,每次你
00:04:06想使用 clear 命令时,都必须重新向 Claude 解释一遍,但现在不需要了。这种逻辑已被
00:04:11外部化到文件结构中,即使会话结束,系统也能保留其状态,
00:04:16无论你多久之后再回来。这样一来,Claude 就不必纠结
00:04:20哪些任务需要重做。图谱不会遗忘,也不会偏离目标。目前的文件夹名
00:04:26只是会话的随机 ID,但如果你设置一个自定义名称的环境变量,
00:04:31它就会通过该名称识别会话。这确保了即使关闭终端,任务也不会丢失,
00:04:36Claude 可以无缝继续会话。通过这次更新,Anthropic 终于
00:04:41终结了原本旨在重新锚定任务系统的 Ralph 循环。现在,Claude
00:04:45可以自动处理这一切。另外,如果你喜欢我们的内容,请考虑点个赞,
00:04:50因为这能帮助我们创作更多内容,让更多人看到。之所以
00:04:55这种方法很重要,是因为它通过有效地管理并行和顺序步骤,赋予了 Claude 并行处理的自由度。
00:05:01Claude 会识别出哪些可以并行运行,哪些不能,
00:05:06并基于此节省完成任务的时间。例如,
00:05:11它发现任务 1 和任务 2 没有依赖关系,就会同时启动两个。在下一层,
00:05:16它识别到任务 3 和任务 4 被任务 1 阻塞,因此会等待任务 1 完成后再
00:05:22开始后续任务。通过这种方式,最后一个任务仅需三个周期即可完成。以前,
00:05:27这 5 个步骤需要 5 个波次,每个波次都要按顺序等待上一个完成。但
00:05:32采用这种方法,通过同时运行任务减少了执行时间。这不仅
00:05:38节省了时间,还降低了成本,因为模型会根据任务匹配资源,不会在
00:05:42小任务上浪费额外的 token。但在看实际操作之前,先听听我们赞助商
00:05:47Lovart 的介绍。看到这些设计,你可能会觉得是专业机构做的,但这是
00:05:52首个具备真正创意直觉的 AI 设计代理。使用 Lovart 设计更简单,因为它能帮你
00:05:57即时可视化任何概念。从复杂的包装和室内布局到独特的珠宝
00:06:02系列,它是能交付专业创意成果、搞定工作的设计代理。
00:06:07其真正的威力在于独家的编辑功能。通常 AI 生成的文本很乱,
00:06:12但通过 TextEdit,我只需输入文字就能完美重写标题。有了 Lovart AI,
00:06:17你可以为工作生成惊艳的海报,并使用编辑元素来移动、调整或更换单个
00:06:22图层,或使用触摸编辑来精确更换物体而不破坏风格。这能让你
00:06:27不费吹灰之力地产出更多高质量帖子。你甚至可以一键将最终的静态
00:06:32视觉稿变成视频。点击置顶评论中的链接即可免费开始设计。
00:06:38我们的团队在 Claude Code 和 Co-Work 的多个场景中测试了这种集群模式。
00:06:42对于不了解的人,Co-Work 基本上就是面向非开发者的 Claude Code。这个想法
00:06:47源于一个事实:他们最初开发 Claude Code 时,只打算给开发者用。
00:06:52但他们意识到它几乎对任何事情都有用。Co-Work 比 Claude Code 有更多的
00:06:57护栏,因为它不是针对开发者的。这有助于防止代理意外
00:07:02删除或破坏它不该碰的东西,对非技术用户友好得多。
00:07:07我们的团队也一直在用它处理非开发任务,比如调研、规划,甚至通过
00:07:13连接 Notion 来管理频道的内容构思过程。所以 Anthropic 将其简化并发布了
00:07:18Co-Work,它本质上能做 Claude Code 能做的所有事,与文件系统交互并
00:07:23根据需要进行修改。如果你想整理文件夹或在其中进行更改,Co-Work 非常好用。
00:07:28我们一直在大量使用 Co-Work 来处理这类事务。我们有一个包含很多
00:07:32项目的文件夹,大部分是为了测试,我们在查找以前项目中用过的特定
00:07:37技能时遇到了困难。于是我们让它创建一个文档,详细列出每个
00:07:42项目包含的内容。我们还让它查看 Claude.md 和我们创建的可重用命令,
00:07:47并以此为据进行区分。它首先探索了我们连接的文件夹并创建了
00:07:52待办事项。然后,它使用了我们之前提到的与 Claude Code 相同的代理集群方法。它生成了
00:07:58多个代理分批读取文件,并为每个项目的内容编写文档。
00:08:03最后,每个项目都有了一个总结其功能的预览文件,这使得导航
00:08:08和寻找所需内容变得容易得多。我们还用 Co-Work 为正在开发的一个 App 做了
00:08:13可行性和市场研究,它生成了一份包含所有调查结果的正式文档。就像
00:08:18Claude Code 一样,它提出问题,并根据答案生成一份综合报告。它把
00:08:23报告保存到了我们连接 Co-Work 的文件夹里。你也可以用 Claude Chat 做类似的事,
00:08:27但现在它实际上可以访问文件夹内的文档,这有助于更有效地
00:08:32引导研究。生成的报告格式也很规范,因为 Co-Work 配备了
00:08:37比以前更专业的文档创建技能。当研究和 PRD 文档通过 Co-Work 完成后,
00:08:42我们就转到 Claude Code 进行实际的实施部分。
00:08:48我们让 Claude Code 查看文件夹内的文档(即之前引导 Co-Work 调研的
00:08:53项目构思文档),并将其分解为不同的组件,专注于 PRD 的某一个方面。它分析出
00:08:57PRD 包含多个部分,并意识到这些部分彼此独立,可以并行处理。
00:09:03于是,它生成了多个代理同时编写代码,每个代理独立工作。
00:09:08如果没有这种并行机制,原本需要 16 个连续步骤才能完成的工作,由于
00:09:13并行化被缩减到了一个步骤,从而显著加快了进程。现在,Claude 会自动
00:09:18分解复杂任务,但有时它不会,因为它觉得请求不够复杂,不需要拆解。
00:09:23如果不拆解,你可以用类似“请将其拆分为带有依赖关系的任务”之类的提示词来要求它。
00:09:28然后它就会创建依赖图并用它来管理工作流。
00:09:34你甚至可以通过按下 Ctrl+T 来查看待办事项。由于这是一个长期项目,我们将
00:09:38CLI 标志设置为了项目名称,以便以后可以返回。本期视频到这里就结束了。
00:09:44如果你想支持本频道并帮助我们继续制作这样的视频,可以通过加入
00:09:49AI Labs Pro 来实现。一如既往,感谢观看,我们下期再见。
00:09:53AI Labs Pro. As always, thank you for watching, and I'll see you in the next one.