00:00:00Anthropic 刚刚发布了顾问策略 (Advisor Strategy),
00:00:02这让我们不仅能获得更好的性能
00:00:05来自我们的 Anthropic 模型, 还能降低成本。
00:00:09它的工作原理非常简单。
00:00:10它将 Opus 作为顾问 (Advisor)
00:00:12与 Sonnet 或 Haiku 作为执行者 (Executor) 配对。
00:00:15所以 Opus 负责制定计划,
00:00:17而较便宜的模型负责完成所有工作。
00:00:19这与我们在使用 Claude Code
00:00:22并让 Opus 运行计划模式时非常相似,
00:00:24但实际的执行过程会转交给 Sonnet。
00:00:27不同之处在于, 通过顾问策略,
00:00:30这一切都是通过 API 自动完成的。
00:00:32所以如果你在 Claude Code 之外
00:00:34进行开发, 这将非常完美。
00:00:35如果你有任何类型的 Web 应用程序
00:00:38在底层使用 Anthropic API,
00:00:41这绝对是不二之选。
00:00:42你会以更低的成本获得更有效的输出。
00:00:46而且它实际上比我们在 Claude Code 中
00:00:48让 Opus 规划、Sonnet 执行
00:00:50的操作要更复杂一些。
00:00:52因为这种顾问与执行者的关系
00:00:55是不断变化的, 而不是一次性的
00:00:58即 Opus 建议一次, 然后 Sonnet 执行。
00:01:01它实际上是来回交互的。
00:01:02正如这里所述, 当执行者
00:01:04(即 Sonnet 或 Haiku) 遇到一个
00:01:06它无法合理解决的决策时,
00:01:08它会咨询 Opus 作为顾问提供指导。
00:01:11Opus 拥有 Sonnet 正在执行任务的完整上下文。
00:01:15所以这不仅仅像计划模式
00:01:16给它一个策略然后就开始跑。
00:01:19就像即使你这么做了, Sonnet 尝试去执行,
00:01:22如果遇到障碍, 它会再次返回向 Opus 咨询。
00:01:24所以这是一个持续的反复过程。
00:01:26此外, 为了保持低成本,
00:01:28Opus 在任何时候都不会进行工具调用。
00:01:30所有的工具调用都由较小的 LLM 完成,
00:01:34在这种情况下就是 Sonnet 或 Haiku。
00:01:35但 Opus 确实保留了完整的共享上下文。
00:01:39就像我在开头提到的,
00:01:40这让我们能花更少的钱获得更好的结果。
00:01:43在这里, 它对比了开启 Opus 顾问的
00:01:46Sonnet 3.5 (High) 与单独的 Sonnet 3.5 (High)。
00:01:50Sonnet 在 SWE-bench 上的得分更高, 为 74.8 对 72.1,
00:01:55而且成本更低。
00:01:56每个代理任务的费用略高于 96 美分,
00:02:00而之前几乎是 1.09 美元, 这个差距很显著。
00:02:03你在其他基准测试中也能看到同样的结果,
00:02:06比如 BrowseComp 和 TerminalBench。
00:02:08得分是 60.4 对 58.1, 而且更便宜。
00:02:12价格更便宜这一点很棒, 因为众所周知,
00:02:14Anthropic 的 API 虽然很棒,
00:02:16但真的太贵了。
00:02:19很多时候你觉得需要一种
00:02:21介于 Sonnet 和 Opus 之间的模型, 但那并不存在。
00:02:24所以这给了我们一个中间地带,
00:02:26性能处于 Sonnet 和 Opus 之间,
00:02:28但成本甚至比普通的 Sonnet 还要便宜。
00:02:31所以有什么理由不喜欢它呢?
00:02:32正如我之前所说, 这是一个 API 层面的功能,
00:02:33不一定局限于 Claude Code。
00:02:35要使用它, 你只需要调整你的代码
00:02:38以及它是如何发起 API 调用。
00:02:41具体来说, 你需要将类型 (Type) 指定为 "advisor",
00:02:45并设置最大使用次数 (Max Uses)。
00:02:47这里的最大使用次数是指
00:02:48它针对特定问题返回向 Opus
00:02:50寻求建议的次数。
00:02:52总而言之, 这是一个了不起的升级。
00:02:54如果你是在 Claude Code 生态系统之外的
00:02:56实际项目中使用 Anthropic API 的人,
00:03:00我们正在以更低的价格获得更好的结果。
00:03:03因为如你所知, 绝大多数情况下
00:03:06使用 Opus 实在是杀鸡用牛刀,
00:03:08但有时你又希望 Sonnet 能表现得更好一点。
00:03:10现在好了, 这就是完美的中间方案。