00:00:00Anthropicがアドバイザー戦略を発表しました
00:00:02これにより Anthropicモデルの
00:00:05パフォーマンスを向上させつつ 低コスト化も可能です
00:00:09仕組みは極めてシンプルです
00:00:10Opusをアドバイザーとして
00:00:12SonnetやHaikuを実行役として組み合わせます
00:00:15Opusが計画を立て
00:00:17安価なモデルが実際の作業を行います
00:00:19これは Claude Codeを使って
00:00:22Opusでプランニング・モードを実行し
00:00:24実際の実行をSonnetに任せるのと似ています
00:00:27違いは このアドバイザー戦略は
00:00:30すべてAPI経由で自動的に行われる点です
00:00:32そのため Claude Code以外の環境で
00:00:34作業している場合に最適です
00:00:35AnthropicのAPIを内部で利用している
00:00:38あらゆるウェブアプリケーションにとって
00:00:41これは迷う必要のない選択肢です
00:00:42より安く より効果的な出力が得られるからです
00:00:46実は Claude CodeでOpusが計画して
00:00:48Sonnetが実行する仕組みよりも
00:00:50少し洗練されています
00:00:52なぜなら このアドバイザーと実行役の関係は
00:00:55常に変化し 一回限りではないからです
00:00:58Opusが一度助言してSonnetが実行して終わりではなく
00:01:01実際にはやり取りが往復します
00:01:02ここに記載がある通り 実行役である
00:01:04SonnetやHaikuが自力で解決できない
00:01:06判断ポイントに直面した際
00:01:08アドバイザーであるOpusに指示を仰ぎます
00:01:11OpusはSonnetが何をしているか
00:01:15その全コンテキストを把握しています
00:01:16単に一つの戦略を与えて実行させる
00:01:19プランニング・モードとは異なります
00:01:22実行中に壁にぶつかったら Opusに戻るのです
00:01:24つまり 絶え間ないやり取りが発生します
00:01:26さらに コストを抑えるために
00:01:28Opusはいかなるツール呼び出しも行いません
00:01:30ツールの呼び出しはすべて 小型LLMである
00:01:34SonnetやHaikuが行います
00:01:35しかしOpusは共有された全コンテキストを保持します
00:01:39冒頭で述べた通り これにより
00:01:40より少ないコストで 優れた結果が得られます
00:01:43ここでは Sonnet 3.5 (High)を単体で使う場合と
00:01:46Opusをアドバイザーにして使う場合を比較しています
00:01:50SWE-benchのスコアは72.1に対し74.8と向上し
00:01:55しかも安価になりました
00:01:56エージェント的なタスク1件あたり 約1.09ドルから
00:02:000.96ドル強へと下がっており これは大きな差です
00:02:03BrowseCompやTerminalBenchといった
00:02:06他のベンチマークでも同様の傾向が見られます
00:02:0858.1に対し60.4を記録し ついでに安くなっています
00:02:12安くなるのは素晴らしいことです ご存知の通り
00:02:14AnthropicのAPIは素晴らしいのですが
00:02:16とにかく料金が高いのが難点でした
00:02:19SonnetとOpusの中間くらいのモデルが
00:02:21欲しいと思っても 存在しませんでした
00:02:24この手法は パフォーマンス面では
00:02:26SonnetとOpusの中間地点を提供しつつ
00:02:28コストは通常のSonnetよりも安く済みます
00:02:31文句の付け所がありませんね
00:02:32先ほど言ったように これはAPIの機能であり
00:02:33必ずしも Claude Code専用ではありません
00:02:35利用するには 実際のAPI呼び出しを行う
00:02:38コードを少し調整する必要があります
00:02:41具体的には typeを "advisor" に指定し
00:02:45max_usesを設定する必要があります
00:02:47max_usesとは 特定の問題に対して
00:02:48Opusにアドバイスを求めに戻る
00:02:50回数の上限のことです
00:02:52まとめると これは素晴らしいアップグレードです
00:02:54Claude Codeのエコシステム以外で
00:02:56AnthropicのAPIをプロジェクトで使っているなら
00:03:00より安く より良い結果が得られます
00:03:03多くの作業にとって Opusは過剰スペックですが
00:03:06かといってSonnetでは
00:03:08少し物足りない場面もあります
00:03:10そんな時のための 完璧な妥協案がこれです