Claude Code's HIDDEN Agent Swarm (Better Than Kimi K2.5?)

BBetter Stack
컴퓨터/소프트웨어경제 뉴스AI/미래기술

Transcript

00:00:00最近 Kimi 2.5 彻底火了。这是一个开源模型,在某些基准测试上
00:00:05甚至超越了 Opus,还拥有一个极其精妙的智能体集群(Agent Swarm)模式,编排器可以为复杂任务
00:00:11生成多达 100 个专门的智能体。但你知道吗?Claude 的代码中也潜藏着这个功能,
00:00:17虽然被隐藏在了一个开关后面,但还是被一名推特用户发现了。他是怎么发现的?
00:00:23Anthropic 是抄袭了 Kimi 的创意吗?点个关注,我们这就来深度解析。Anthropic 其实在去年 7 月
00:00:30就宣布了自定义子智能体功能,从那时起,大家就开始用它们来处理各种
00:00:35专业化任务。当时我们也专门做过视频。但子智能体本身
00:00:41只能获取全局上下文的一小部分,因为它们是为特定任务设计的。所以它们在完成任务、
00:00:48返回数据后,记忆就会清零。因此,人们不得不通过让子智能体
00:00:54将结果输出到 Markdown 文件,并更新主上下文文件的方式来手动实现“记忆”。
00:01:01这样,当同一个或另一个子智能体被要求更新时,就能通过读取这些文件
00:01:06来衔接之前的进度。但你仍然需要手动创建子智能体,
00:01:12为其分配角色、特定技能、工具和权限等等。这就是为什么 Kimi 的新功能
00:01:19“智能体集群”将效率提升到了新高度,因为编排器可以根据特定任务
00:01:25动态创建专门的子智能体,无需你亲自动手。这些子智能体
00:01:31可以并行协作完成总目标,当它们完成各自的部分后,会将结果交给编排器,
00:01:36由编排器决定是否需要根据这些数据生成新的子智能体
00:01:42来继续推进复杂任务。虽然 Kimi 的集群模式还是个研究项目,但与
00:01:48单智能体工作流相比,已经展现出了巨大的进步。看看这张图表,任务越复杂,
00:01:53处理速度却能保持一致,这就是多个智能体并行工作的威力。
00:01:58说实话,在 Claude Code 里你其实也能实现类似的效果,
00:02:04利用那个较新的任务功能,你可以创建任务清单并分发给各个
00:02:10子智能体。问题在于这些子智能体是通用的,并非针对特定任务进行过优化。
00:02:15而且我不确定 Claude 是否能自动将任务分配给最合适的
00:02:21自定义子智能体。如果你试过这个功能,欢迎在评论区分享。但看起来
00:02:25Claude 团队一直在研发一种让编排器根据任务即时自动创建
00:02:31子智能体的方法,这个功能被隐藏在了一个标识位后面,被 Mike Kelly 发现了。
00:02:37他在推文中展示了运作方式,并分享了一个名为“Claude Sneak Peek”的代码库链接,它是 CC Mirror 的分支。
00:02:42让我们来试试。这是一份由 AI 编写的计划书,目标是为一个名为 XDL 的工具制作网页前端,
00:02:48这个工具可以让你在终端下载 X(原推特)上的视频。我已经安装并运行了 Claude Sneak Peek,
00:02:55它看起来就像一个极简版的 Claude Code。我要让它读取 plan.md 文件,并创建
00:03:00可由智能体集群执行的任务。分配完任务后,现在它已经完成了,
00:03:05我要让它利用子智能体来执行这些任务。在开始之前,
00:03:11为了确认目前没有预设任何子智能体,我会运行 agent 命令,
00:03:16你可以看到没有任何专门或自定义的子智能体存在。现在开始
00:03:21执行任务,你可以看到它自动添加了一个“前端构建智能体”来处理前端任务。
00:03:26点击查看团队,我们可以看到已经有五个
00:03:32智能体就位了:一个团队负责人、一名 QA 测试员、一名后端构建员、一名组件构建员以及一名前端构建员,
00:03:37它们正在同步处理任务。我们还能实时查看团队中每个智能体的动态。
00:03:42比如 QA 测试员正在搜索模式,后端构建员也在执行同样的搜索
00:03:48并读取文件,组件构建员和前端构建员也是如此。如果
00:03:53想查看某个智能体的具体动作,只需按下回车进入智能体视图,
00:03:57我们甚至能看到它的系统提示词。返回主界面,智能体已经增加到了 8 个:多了一个组件创建员、
00:04:02一个 API 服务器人员、一个负责 Vite 配置的人员、一个负责 API 集成的人员,
00:04:07现在又多了一个负责 CSS 的人员,我们的智能体团队似乎在不断壮大。点击进入“团队负责人”,
00:04:13就会回到主 Claude Code 视图,也就是说团队负责人就是主 Claude Code 编排器。
00:04:18在主视图中,每个子智能体都会向我们汇报当前状态。
00:04:24如果我稍微缩小并向上滚动,就能看到之前所有
00:04:29不同智能体发送的消息。当所有任务完成后,我们会得到一个“集群项目完成文件”,
00:04:34记录了所有操作,还会生成一份“集群执行报告”,
00:04:41显示了所使用的专业智能体数量、它们的角色以及是否完成了任务。
00:04:47我们还可以向下滚动查看每个智能体工作的详细信息。考虑到 Claude 团队
00:04:52已经在该功能上投入的精力,我不认为他们抄袭了 Kimi。我觉得他们是看到了
00:04:59网络上像 Agents 和 BeMad 这样的实现方式,想在 Claude Code 中加入原生支持,
00:05:04但我完全理解他们为什么还没正式发布。首先,我不认为这个功能经历了像
00:05:10Kimi 2.5 编排器那样长时间的训练;其次,对于那些已经拥有
00:05:16一些甚至许多子智能体的用户来说,情况会变得非常复杂。例如,当用户想要完成一个复杂
00:05:22任务时,编排器如何判断是该创建一个全新的前端子智能体,
00:05:28还是调用用户现有的子智能体?它依据什么指标或数据来做出判断?
00:05:35此外,技能(Skills)也增加了复杂性。如果用户已经下载了一堆技能,编排器
00:05:42该如何决定是让新智能体使用这些技能,还是下载它认为
00:05:49更适合当前任务的新技能?也就是说,如果 Anthropic 发布这个功能,
00:05:56编排器在决定是否需要创建子智能体以及该分配什么资源之前,
00:06:02必须先扫描大量的用户既有数据、智能体、工具和技能。我其实不知道团队
00:06:10现在是否还在研发这个功能,或者他们已经觉得太复杂而决定放弃了。谁知道呢。
00:06:16说到功能,如果你正在利用 AI 或人工快速为项目增加功能,并
00:06:22想确保系统稳定不崩溃,那么你一定要试试 Betastack,它能够
00:06:28监控服务器日志,并利用异常检测在问题发生前向你发出预警。
00:06:33它还拥有原生 AI 错误追踪功能,能让你掌握前端的任何异样。
00:06:38所以,今天就去试试 Betastack 吧。
00:06:44on your front end. So go and check out Betastack today.

Key Takeaway

本文深入解析了 Claude Code 中隐藏的智能体集群功能,探讨了其如何通过动态创建专业子智能体来对标 Kimi 2.5 的编排模式并提升复杂任务的处理效率。

Highlights

  • Kimi 2.5 开源模型因其强大的智能体集群(Agent Swarm)模式而备受关注

  • Claude Code 中被发现隐藏了一个类似的子智能体自动编排功能

  • 传统的子智能体面临记忆清零和需要手动分配角色的局限性

  • 演示显示 Claude 隐藏功能可根据任务清单动态生成多个专业智能体

  • 编排器(Team Lead)充当主控角色,能够实时监控各子智能体的进度

  • 该功能尚未正式发布,可能由于处理用户既有技能和数据的逻辑极其复杂

  • 智能体集群模式在处理复杂任务时,能通过并行工作保持高效的处理速度

Timeline

Kimi 2.5 的崛起与传统智能体瓶颈

视频开头介绍了近期爆火的 Kimi 2.5 开源模型,强调其智能体集群模式在基准测试中表现优异。演讲者指出,虽然 Anthropic 早在去年就推出了自定义子智能体,但其存在明显的局限性。这些子智能体通常只能获取局部上下文,且在完成任务后记忆会清零,无法实现自动化的连续协作。为了解决这个问题,用户过去往往需要手动利用 Markdown 文件来充当子智能体的“外部记忆库”。这一段落为后文对比 Claude 的隐藏新功能奠定了技术背景。

智能体集群模式的核心优势

演讲者详细解释了为什么 Kimi 的“智能体集群”能将生产力提升到新高度,核心在于其编排器能动态创建智能体。这些动态生成的子智能体可以并行处理复杂目标的不同部分,并将结果反馈给编排器进行汇总。通过图表展示可以看出,随着任务复杂度的增加,集群模式由于具备并行处理能力,其处理速度能够保持相对一致。相比之下,现有的 Claude Code 虽然有任务功能,但子智能体往往是通用的,缺乏针对特定任务的深度优化。这部分内容揭示了自动化编排取代手动配置是未来 AI 工作流的必然趋势。

实测 Claude 隐藏的集群功能

本段重点展示了被推特用户发现的隐藏在 Claude 代码标识位后的“Sneak Peek”功能。演讲者演示了一个为 XDL 工具构建网页前端的项目,展示了系统如何从零开始自动生成前端、后端、测试等多个角色。通过运行命令可以看到,系统实时增加了多达 8 个专业智能体,每个智能体都有明确的系统提示词和工具权限。主编排器作为团队负责人,会汇总所有子智能体的消息,并在任务结束时生成详尽的执行报告。这种全自动的团队协作模式证明了 Anthropic 在智能体编排领域的技术储备。

发布延迟的深层原因与总结

视频最后探讨了为何 Anthropic 尚未正式发布这一令人兴奋的功能。演讲者认为,将自动化编排器与用户已有的自定义子智能体、技能和工具进行整合是非常棘手的挑战。编排器需要极其智能的判断力,才能决定是创建新智能体还是调用用户现有的资源,这涉及海量数据的预扫描。此外,这种复杂的逻辑可能还需要更长时间的微调训练才能达到商业化水平。视频最后还顺带推荐了 Betastack 工具,用于监控 AI 生成代码可能带来的服务器风险。这部分内容为开发者提供了关于 AI 智能体未来发展的现实思考。

Community Posts

View all posts