Claude Code 近几个月最强功能发布,竟然无人问津

CChase AI
컴퓨터/소프트웨어AI/미래기술

Transcript

00:00:00这是数月来 Claude Code 最强大的更新,却鲜有人提及。
00:00:04UltraCode 让 Claude Code 能够通过启动一支智能体大军
00:00:10来处理极其庞大且复杂的任务。我指的不仅仅是少数几个,而是可能数百个
00:00:14智能体,它们可以分工协作,一气呵成。但 UltraCode 真正的威力
00:00:20不在于它能生成的智能体数量,而在于它能即时为你的特定任务
00:00:24构建一套定制化的工作框架。通常,Claude Code 采用的是一种一刀切的
00:00:29方式来解决问题。但有了这个全新功能,情况就不一样了。
00:00:34所以在本视频中,我将详细拆解其工作原理,让你能够立即开始利用
00:00:38这一新功能。那么,你为什么要关注 UltraCode 和动态工作流呢?原因
00:00:43很简单。这是 Claude Code 处理大型复杂任务的最佳方式。就是这样。
00:00:49而它实现这一点的方法就是通过定制化框架。这是一种高大上的说法,意味着它将
00:00:56创建一种新颖的方法来解决你试图解决的任何问题。一个很好的例子是它
00:01:02处理深度研究类任务的方式。如果你有一个相当复杂的问题,比如:我们应该迁移
00:01:08我们的结账服务到新的供应商吗?如果我只是像平时那样使用 Claude Code,我只要
00:01:14跳进提示词窗口并输入这个指令。那么,它会使用其默认的静态
00:01:20框架。它会处于单一会话中,对吧?我们将使用一个上下文窗口。
00:01:24它会进行几次网页搜索,获取最相关的结果,然后进行验证、
00:01:30总结,并给我们一份通用的研究报告。默认情况下,我们讨论的是静态框架。我们
00:01:34真正想说的是,你只是在单一上下文窗口中打开 Claude Code,而我们并没有
00:01:38要求它使用子智能体或进行任何形式的对抗性审查其原始思考
00:01:44过程。所以它相当简单。它使用的 Token 更少,最终得到的是一个通用的答案。注意,
00:01:51这对大多数问题来说没问题。我们今天讨论的是大型、复杂的任务。相比之下,如果我们使用
00:01:57动态工作流中的 UltraCode(我稍后会讲这两者的区别),我们会得到一个
00:02:02专为该问题打造的定制框架。我们将会有处理该问题的不同方式。
00:02:09我们不仅会待在一个上下文窗口里。我们会引入不同的智能体,而这些不同的
00:02:12智能体会做不同的事情,同样,这取决于具体任务。所以在这个例子中,
00:02:17我说,嘿,我们是否应该将结账服务迁移到新的供应商?与其只是做
00:02:22一些网页搜索并得出一个总结,通过动态工作流,它更像是
00:02:26好,我们的结账服务是什么?所以它会读取我们的计费代码。它实际上
00:02:30会深入了解我们的实际运作方式。从那里,它会针对新供应商的文档
00:02:35核对功能。它会评估我们的交易量定价。它会有一个
00:02:40实际的“魔鬼代言人”智能体来提出质疑,嗯,这真的合理吗?最终,我们会得到一份
00:02:47具体的建议,而不是通用的建议。所以动态工作流的重点是,再次强调,我们得出答案的过程
00:02:55是不一样的。它是定制的,并且取决于我们提出的问题。通过这样做,
00:03:02我们可以获得更好的结果。这就是你为什么要关注它的原因。现在,在我们讨论 UltraCode 如何
00:03:07发挥作用之前,先插入一个来自今天赞助商的广告,也就是我自己。不久前,我刚发布了一个 Claude
00:03:13Code 大师课,这是从零成为 AI 开发者的第一途径,特别是如果你没有
00:03:19技术背景的话。我每周都会更新这个课程。最近我还添加了 Codex 大师课模块。
00:03:24如果你想获取这些内容,可以在 Chase AI Plus 中找到它。我会把
00:03:29链接放在置顶评论里。
00:03:31那么什么是 UltraCode?他们一定很看重它,才会给你这个漂亮的图形,当你输入
00:03:35斜杠 effort 时。所以 UltraCode 与努力程度有关。如果你在
00:03:41Claude Code 中输入斜杠 effort,你会看到一个从低到 UltraCode 的光谱弹出来。
00:03:46通常在 Opus 4.8 上,我们默认是高努力程度,但 UltraCode 超越了最大值。嗯,
00:03:53算是吧。当你输入斜杠 UltraCode 时,会发生两件事。第一,
00:04:00我的努力程度从高变成了超高。我们不是处于最大值。我们只是跳到了超高。
00:04:05其次,我现在有了自动化的动态工作流编排。所以我们在这里谈论的是两件事,对吧?
00:04:11在本视频中,我们讨论了动态工作流,也就是这个想法:我们为任务做定制化的框架,
00:04:16并且我们拥有 UltraCode。好的,所以 UltraCode 会自动将努力程度更改
00:04:22为超高,并允许自动进行动态工作流编排。动态工作流也是
00:04:29Claude Code 内部的一个独立功能。所以如果我在 Claude Code 里,输入像
00:04:34斜杠 workflows,我就是在强制 Claude Code 为我给出的任何提示词创建一个工作流,
00:04:42比如插入任务。但如果我们处于 UltraCode 中,Claude Code 会自动
00:04:48决定,嘿,这是否需要动态工作流?我们可以选择总是调用
00:04:55动态工作流,如果直接输入斜杠 workflow,或者如果我说,嘿,使用
00:04:59工作流。所以它几乎像是我可以调用的技能。或者 UltraCode 允许
00:05:06Claude Code 在这方面表现得更聪明。它会根据提示词,
00:05:10有时我们只会使用静态框架。我们并不总是需要发疯。或者如果它足够复杂,
00:05:15嘿,我会使用动态工作流。这就是 UltraCode 的用武之地。它像是一个自动化的
00:05:20层。你无需思考。如果它需要动态工作流,它就会执行。你不需要
00:05:23动脑子,对吧?这很棒。既然如此,为了真正最大化利用 UltraCode,
00:05:30我们需要深入研究动态工作流,因为你理解了为什么 UltraCode 优于
00:05:34动态工作流。现在,让我们谈谈这个。
00:05:39而且 Claude Code 实际上,Anthropic 写了一整篇关于这个的博客。所以这篇博客,大约
00:05:44一周前发布,题目是“为每个任务构建框架:Claude Code 中的动态工作流”。我们不会
00:05:48在这个视频中深入探讨整篇博客。我只会讲你需要知道的部分。
00:05:52我也把链接放在说明栏里。现在,我想强调的第一件事是
00:05:55为什么要动态工作流。我们在开头提到了。嘿,它更适合复杂任务。
00:05:59但为什么 Claude 通常不足以应付这种事情?好吧,那是因为 Claude
00:06:04在单一上下文窗口中处理复杂任务的时间越长,它的效果就越差。他们提到的三点
00:06:09都可以归类在“上下文腐化”的范畴下,也就是智能体惰性的概念。
00:06:16你知道,我们都遇到过这种情况,你让 Claude Code 做一件范围相当大的事情,
00:06:20它只是完成了一部分。我们还有自我偏好偏差,指 Claude
00:06:25倾向于偏好自己的结果或发现,尤其是在被要求针对一套准则进行验证或评判时
00:06:30的情况下。嘿,如果你还记得我几天前展示“grill me codex”的视频,
00:06:34把 Codex 引入方程,这也是我在那里谈到的事情,对吧?
00:06:38Claude 在评估自己的工作方面表现不佳,特别是如果你告诉它要评估
00:06:44同一会话内的工作。就像你在同一个上下文窗口里,它做得并不好。
00:06:49最后是目标漂移。再次强调,复杂任务,目标漂移
00:06:54将是一大问题。我们必须解决它。我们不能在同一个会话中做这些事。
00:06:57所以创建一个工作流,动态工作流有助于通过协调单独的
00:07:03Claude 子智能体,它们各自拥有上下文窗口和专注、隔离的目标来克服这些问题,对吧?听起来很熟悉?
00:07:10GSD,超能力,过去几个月的所有这些事情,都归结到这一核心点上:
00:07:16我们如何在有限的上下文窗口下处理大任务?这一切最终都回到了子智能体、
00:07:21全新的上下文窗口,这类事情。现在,我还要从这篇博客中触及的最后一件事是
00:07:26他们提到的一些工作流模式。这不是详尽的。有无数种工作流
00:07:30模式,但我认为当我们讨论定制框架和动态工作流时,能看到我们在说些什么,
00:07:35视觉上会很有帮助。他们给出的第一个例子是分类并执行。
00:07:40那是一种工作流模式,我们有一些任务。该任务涉及多个子任务,
00:07:45我们想把它们分给适当的子智能体。要做到这一点,我们需要一个分类器,并且使用
00:07:51动态工作流。Claude Code 已经知道,这是最关键的部分,Claude Code 已经知道
00:07:56这是你需要的那种工作流模式,对吧?它会自动为你设置好。
00:08:00另一个是分流并综合。想想深度研究。嘿,我想要你研究某件事。
00:08:05我需要你走出去,从各种不同来源获取海量信息,
00:08:09可能数百个来源。我需要你带回来。我不只是想要你总结。
00:08:13我想要你验证。我想要你实际交叉引用它,然后最后,
00:08:17我想要一份最终报告。同样,如果你让 Claude Code 使用 UltraCode 或使用动态工作流
00:08:22去做深度研究,这就是会采取的工作流。
00:08:27而且它延续了下去。对抗性验证、循环直至完成,一种锦标赛式的
00:08:32机制,你有一堆不同的想法和评委,最后,你得到一个最终赢家,
00:08:36生成并过滤。博客本身详细介绍了所有这些,但至少对我来说,
00:08:41能看到他们在谈论什么很有帮助。我在想,好的,定制框架,这到底
00:08:44是什么意思?好吧,这只是意味着找到解决方案有多种途径。而且有了定制的
00:08:50动态工作流,我们就有了所有这些选项。重点是它们将根据任务进行定制,
00:08:55而不是,你知道,静态框架,做一次网页搜索,问几个问题,总结。我们可以做得更好。
00:09:03最后,在我们进入演示之前,我强烈建议你花五分钟时间,
00:09:09去 Claude Code 文档阅读他们关于动态工作流的内容,这样你就能更好地了解
00:09:13它在幕后是如何工作的,与“智能体团队”之类相比。提示,它实际上是在运行时执行脚本
00:09:18以及如何保存工作流之类的东西,因为你可以重复使用它们。从某种意义上说,它们就像技能
00:09:24等等。他们在这里确实有一篇非常好的文章。
00:09:28在文章中,他们实际上告诉了我们一个随 Claude Code 预装的动态工作流。
00:09:34它实际上是一个深度研究工作流,类似于网络应用上存在已久的深度研究。
00:09:39所以我们将做两个演示。第一个我要给你展示的,这样你就可以了解这一切是如何工作的,是这个深度研究。
00:09:44如果你已经更新,它就在你的 Claude Code 里。你要做的就是输入斜杠 deep research。
00:09:48所以在 Claude Code 内部,我们将输入斜杠 deep research。
00:09:52然后我会给它一个提示词。嗯,其实这是一个元提示词。我们要让它对动态工作流
00:09:56和创建它们的最佳实践进行深度研究。
00:10:01你能对 Claude Code 里的全新动态工作流和 UltraCode 进行深度研究吗?我想要一份详细说明最佳实践的报告。
00:10:08关于定制框架有很多说法。
00:10:14通过动态工作流,我们如何确保使用它们构建的定制框架是工作的最佳选择?
00:10:17或者这只是用户层面我们需要预期的由 Claude Code 处理的事情?
00:10:22所以这就是它。当我们这样做时,你会看到我们收到了一些
00:10:28消息。正在运行深度研究工作流,主题足够清晰,继续,工作流,动态工作流,
00:10:32深度研究。然后它告诉我们在后台启动了工作流。它有五个阶段,
00:10:38范围、搜索、获取、验证和综合。我们有能力实时观看它。
00:10:43所以如果我输入斜杠 workflows,你可以在这里看到所有的智能体正在实时发生的事情。
00:10:49所以对于范围,我们只有一个智能体。对于搜索,我们将有五个智能体。
00:10:57一旦他们开始工作,我们实际上可以,哎呀,一旦他们开始工作,我们就可以
00:11:02实际看到他们的 Token 使用量。因为这是成本的一大来源,对吧?你可以在这里看到。
00:11:07在使用动态工作流和 UltraCode 时,我们需要考虑的一个大成本是 Token 成本。
00:11:13它是重度 Token 使用。当然,肯定有论点认为我们只是在前端支付成本。
00:11:17并且凭借我们从 UltraCode 和动态工作流获得更有效的结果,我们可能在长期节省 Token。
00:11:23但别感到惊讶,特别是如果你使用动态工作流的话,我开头没开玩笑,确实在使用 100
00:11:30个以上的智能体。别对最终产生巨大的 Token 成本感到惊讶。我们可以在这里看到我们
00:11:35五个正在搜索的智能体。他们每个使用了约 25 万个 Token。范围阶段本身花了
00:11:41约 4 万。然后这边的获取阶段看起来可能有 12 个子智能体。然后我们还有一个列表,
00:11:46就在这,22 个智能体中的 4 个,已经过去两分钟。最后我也将参考我的
00:11:53总周使用量以及我烧掉了多少。所以 101 个智能体,370 万个 Token
00:11:59和 11 分钟后,工作流完成。在我的每周最大计划使用量方面,
00:12:06是 4%,而我使用的是每月 200 美元的最高计划。所以,Token 使用量,这真不是开玩笑。就像,
00:12:12你必须知道什么时候应用它。然后我不得不将报告转成这里看到的 HTML
00:12:18资产。这几乎重申了我们在 Claude Code 文档中看到的许多内容。
00:12:25涉及动态工作流的内容。那么动态工作流和 UltraCode 还有哪些其他用例?好吧,Anthropic 实际上为我们指出了。
00:12:30诸如基于代码的全面漏洞搜寻、大规模迁移,以及需要复核的关键工作。
00:12:35Anthropic 提到的另一个例子是用动态工作流重写 Bun,他们实际上在过去一周使用此功能将 Bun 从 Zig 移植到了 Rust。
00:12:42让我们用漏洞搜寻来测试一下。我所在的目录是我 AI 代理网站的目录,它在后端也兼作管理界面。
00:12:46它有点像我的内容创作指挥中心。所以我们将让它运行动态工作流来进行一次漏洞搜寻。
00:12:52你能在这个目录中使用动态工作流来运行一次漏洞搜寻,看看我们当前目录中有什么样的漏洞吗?
00:13:00创建报告后,将其变成一份 HTML 报告并在我的浏览器中打开它。
00:13:05所以你可以看到就在这儿调用工作流命令集并行漏洞搜寻跨 Next.js 应用。
00:13:11对抗性验证每个发现并合成一份按严重程度排名的报告。
00:13:18它在后台运行。像往常一样,我们可以输入斜杠 workflows 来看一下。所以对于这个漏洞报告,它运行在
00:13:26大约一半的时间,用的 Token 只有深度研究的一半。我们有 34 个已确认的漏洞。它有 7 个漏洞是误报。
00:13:33而在那 34 个中,2 个是高危,9 个是中危,23 个是低危。
00:13:38有点击它们的能力。它向我显示了哪里错了,证据,修复,然后
00:13:45还有那个说,嘿,这确实是一个漏洞的对抗性验证器。这是问题所在。
00:13:51它几乎为它们中的每一个提供了报告,问题在哪里,它将其定义为什么样的错误,出了什么问题,证据,修复,对抗性验证器。
00:14:04所以在它实际发现的东西方面,它是相当深入的。我认为这部分最好的是对抗性验证器。
00:14:10因为再一次,Claude Code 处理复杂任务时的重大问题之一是:你能确认
00:14:15它是否真的做了它应该做的事?所以这就是我在这个视频中要离开你的地方。
00:14:21我们讨论了为什么要关注动态工作流中的 UltraCode,它们如何工作,
00:14:26并过了一遍几个例子。我认为这是一个很棒的功能。我认为它非常
00:14:30强大。是的,它是极度 Token 密集的,但有时我们确实需要重型武器,特别是
00:14:34对于我们真正关心的任务。而在以前,这很难,对吧?我们做了一些
00:14:38黑客手段。我们引入了外部编排层。而现在一切都准备就绪,就在
00:14:43Claude Code 本身内部。所以一如既往,让我知道你的想法。确保查看 Chase
00:14:47AI Plus,如果你想获取我的 Claude Code 大师课,我们回头见。
00:14:53对于我们非常在意的任务来说,确实如此。在此之前,这其实很难实现,对吧?
00:14:58我们曾用过一些临时方案,还得引入外部编排层。
00:15:03而现在,这一切都可以在 Claude Code 内部直接搞定了。一如既往,请让我知道你的想法。
00:15:08如果你想学习我的 Claude Code 大师课,记得查看 Chase AI Plus,我们回头见。

Key Takeaway

Claude Code 的 UltraCode 功能通过动态工作流编排大量子智能体,利用定制化框架解决了传统单一上下文窗口在处理深度研究或漏洞搜寻等复杂任务时的性能瓶颈。

Highlights

  • Claude Code 引入的 UltraCode 功能可通过自动化编排数百个子智能体,为特定复杂任务即时构建定制化工作框架。

  • 在 UltraCode 模式下,Claude Code 的 effort 等级从“高”自动跳升至“超高”,并激活动态工作流编排。

  • 深度研究工作流在实验中耗时 11 分钟,动用 101 个智能体并消耗约 370 万个 Token。

  • 动态工作流通过协调拥有独立上下文窗口和专注目标的子智能体,有效解决了单一会话处理大型任务时的“上下文腐化”和目标漂移问题。

  • 漏洞搜寻任务中,动态工作流在一次运行中识别出 34 个漏洞,其中包括 2 个高危漏洞,并附带了对抗性验证报告。

Timeline

UltraCode 与动态工作流核心机制

  • UltraCode 实现了针对特定任务的定制化工作框架构建。
  • 动态工作流允许 Claude Code 突破单一上下文窗口的限制,通过子智能体协作处理任务。
  • 输入 /effort 可切换努力程度,UltraCode 模式会自动触发超高努力等级及动态工作流编排。

传统 Claude Code 采用静态框架,在处理复杂任务时因上下文窗口限制容易产生逻辑惰性或目标漂移。UltraCode 通过动态创建子智能体处理不同子任务,如读取计费代码、核对文档和执行“魔鬼代言人”式的质疑,从而产出更具针对性的结果。该功能是 Claude Code 处理大型复杂任务的专用解决方案。

动态工作流解决上下文腐化

  • 单一会话中处理长任务会导致上下文腐化、自我偏好偏差及目标漂移。
  • 动态工作流将任务拆解给多个隔离的子智能体,每个智能体拥有独立的上下文窗口。
  • 常见工作流模式包括分类执行、分流综合、对抗性验证及循环直至完成。

Claude 在单一会话内评估自身表现时往往效果不佳,且处理范围较大的任务时容易遗漏细节。通过将任务拆分为分类、验证、合成等独立步骤,动态工作流确保了每个环节的专注度。这种结构化的工作流能够有效缓解智能体自我评估失准的问题。

深度研究与漏洞搜寻实战演示

  • 深度研究工作流包含范围确定、搜索、获取、验证和综合五个阶段。
  • 动态工作流在处理深度研究时可能消耗数百万 Token,使用前需权衡成本与任务重要性。
  • 漏洞搜寻工作流能够提供按严重程度分类的报告,并包含具体的证据和修复建议。

演示显示,深度研究任务调用了 101 个智能体并耗费 370 万 Token,证明了该功能的高资源占用特性。在漏洞搜寻演示中,工作流在 Next.js 应用中定位了 34 个漏洞,并自动执行了对抗性验证,展示了其在代码质量检查中的实用性。该功能现已完全集成于 Claude Code 内部,无需外部编排层。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video