Claude CodeのMCPツールが10倍高速化

日本語العربية Deutsch English Español Français हिन्दी Bahasa Indonesia 한국어 Português Русский 中文

Computing/SoftwareInternet Technology

Transcript

00:00:00CloscoチームがMCPの最大の問題を解決しました。ツール検索機能を追加することで、

00:00:05コンテキストを最大95%削減できるようになったのです。使用前にツール名を検索するだけで、

00:00:10利用可能なすべてのツールを事前にコンテキストに読み込む必要がなくなりました。従来は、

00:00:15最初のプロンプトを書く前に数万トークンも消費していたのです。

00:00:18しかし、なぜ以前はこの方式ではなかったのでしょうか?

00:00:21そして、この技術はCloudflareから盗んだのでしょうか?

00:00:24チャンネル登録して、詳しく見ていきましょう。

00:00:26MCPサーバーはあらゆる場所に存在します。GitHub用、

00:00:29Docker用、

00:00:30Notion用があり、

00:00:32本当に優れていると評判のBetter Stack用まであります。

00:00:35そして、

00:00:36人々がClawed CodeとLLMをコード以外のあらゆる用途で使用していることから、

00:00:41MCPは当分なくなりそうにありません。

00:00:43しかし、

00:00:44MCPには問題があります。名前の衝突、

00:00:46コマンドインジェクション、

00:00:47そして最大の問題であるトークン非効率です。接続されたサーバーからのすべてのツールが通常、

00:00:52モデルのコンテキストウィンドウに事前読み込みされ、

00:00:55モデルに完全な可視性を与えるためです。

00:00:57つまり、

00:00:57ツール名、

00:00:58ツールの説明、

00:00:59オプションと必須パラメータ、

00:01:01その型、

00:01:02制約を含む完全なJSONスキーマドキュメント、

00:01:05基本的に大量のデータです。

00:01:07Redisチームは4つの異なるサーバーから167個のツールを使用し、プロンプトを書く前に6万トークン以上を消費しました。

00:01:15Opusの20万トークンのコンテキストウィンドウのほぼ半分です。しかもこれはスキルやプラグインの外側での話です。

00:01:21つまり、サーバーが多数ある場合、かなりの量のトークンを消費する可能性があります。

00:01:25はい、

00:01:26Geminiのように100万トークンのウィンドウを持つモデルがあることは知っています。しかし、

00:01:30コンテキストに追加するものが多いほど、

00:01:32モデルのパフォーマンスは低下する傾向があります。

00:01:35では、これを修正する最善の方法は何でしょうか?

00:01:37オンラインで2つの人気のあるアプローチを見てきました。Cloudflareが採用したプログラマティックアプローチと、

00:01:43Clawed Codeチームが採用した検索アプローチです。

00:01:46プログラマティックアプローチについては後で説明しますが、まず検索プロセスについて説明します。これは次のように機能します。

00:01:53まず、Clawedは事前読み込みされたMCPツールがコンテキストの10%以上を占めているかをチェックします。

00:01:59つまり、コンテキストウィンドウが20万トークンの場合、2万トークンです。

00:02:04そうでなければ、変更は行われず、モデルは通常通りMCPツールを使用します。

00:02:10しかし、

00:02:11そうであれば、

00:02:12Clawedは自然言語を使用して正しいツールを動的に発見し、

00:02:17プロンプトに基づいて最も関連性の高い3〜5個のツールを読み込みます。

00:02:22これらのツールだけを完全にコンテキストに読み込み、モデルが通常通り使用できるようにします。

00:02:27これは実際にGitHubで最もリクエストされていた機能で、

00:02:31AgentSkillsと同様に機能します。AgentSkillsはスキル名と説明のみをコンテキストに読み込み、

00:02:37関連性があると判断したスキル、

00:02:39またはプロンプトで言及されたスキルを見つけると、

00:02:42その特定のスキルをすべてコンテキストウィンドウに読み込みます。

00:02:46要するに、段階的な開示です。

00:02:47AnthropicとCursorの両方が、MCPツールにこのアプローチを使用することで大きなメリットを得ています。

00:02:53では、プログラマティックアプローチはどうでしょうか?

00:02:55これは、API呼び出しを行う代わりに、モデルがコードを通じてツールをオーケストレーションすることで機能します。

00:03:01前のレスポンスに基づいて順番に動作する必要があるこれら3つのツールについて、

00:03:05個別のAPIツール呼び出しを行う代わりに、

00:03:08特にClawedはこのオーケストレーションをすべて行うPythonスクリプトを書き、

00:03:13コードを実行してその結果をモデルに返すことができます。

00:03:16Cloudflareはこれをさらに一歩進め、

00:03:19利用可能なすべてのツールのTypeScript定義をモデルに書かせ、

00:03:23通常はワーカーであるサンドボックスでコードを実行しています。

00:03:27Clawed Codeチームは実際にプログラマティックアプローチを試しましたが、

00:03:31検索の方がうまく機能することを発見しました。Clawedがコードを書くのが非常に得意であることを考えると、

00:03:36これは本当に信じがたいことです。

00:03:38また、

00:03:38VercelがリリースしたエージェントブラウザのヘッドレスChromium CLI機能もClaude Codeで非常にうまく動作しています。MCPorterのようなツールを使ってすべてのMCPツールをCLIコマンドに変換できれば、

00:03:52コンテキストに読み込むよりも、

00:03:54特定のCLIコマンドを実行する方がモデルにとってはるかに簡単で効率的だと思いますが、

00:03:59まあ、

00:04:00これは私の個人的な意見です。

00:04:01全体として、

00:04:02MCPサーバーの問題が検討されているのは嬉しいことで、

00:04:05もしかしたら複数のサーバーをインストールしてみようという気になるかもしれません。

Key Takeaway

Claude CodeのMCPツール検索機能は、必要なツールのみを動的に読み込むことで、コンテキスト使用量を最大95%削減し、トークン非効率というMCPの最大の問題を解決した。

Highlights

MCPツール検索機能により、コンテキスト使用量を最大95%削減可能

従来のMCPは数万トークンを事前読み込みし、コンテキストウィンドウの大部分を消費していた

Claude Codeは10%以上のコンテキストを占める場合、自然言語検索で3-5個の関連ツールのみを読み込む

CloudflareのプログラマティックアプローチとClaude Codeの検索アプローチの2つの解決策が存在

Claude Codeチームは両方のアプローチをテストし、検索の方が効果的であることを発見

AgentSkillsと同様の段階的開示メカニズムを採用

Redisチームの事例では167個のツールで6万トークン以上を消費していた

Timeline

MCPツール検索機能の導入と問題の解決

ClaudeチームがMCPの最大の問題であるトークン非効率を解決するツール検索機能を発表しました。この新機能により、コンテキストを最大95%削減できるようになり、使用前にツール名を検索するだけで、利用可能なすべてのツールを事前にコンテキストに読み込む必要がなくなりました。従来の方式では、最初のプロンプトを書く前に数万トークンも消費していたという深刻な問題がありました。この改善により、MCPサーバーの使用がより効率的になることが期待されます。

MCPの普及状況と主要な問題点

MCPサーバーはGitHub、Docker、Notion、Better Stackなど、あらゆる場所に存在し、Claude CodeとLLMがコード以外のあらゆる用途で使用されていることから、MCPは当分なくなる見込みがありません。しかし、MCPには名前の衝突、コマンドインジェクション、そして最大の問題であるトークン非効率という3つの主要な問題があります。接続されたサーバーからのすべてのツールが通常モデルのコンテキストウィンドウに事前読み込みされ、ツール名、説明、パラメータ、型、制約を含む完全なJSONスキーマドキュメントという大量のデータを消費します。

トークン消費の具体的な問題と影響

Redisチームの実例では、4つの異なるサーバーから167個のツールを使用し、プロンプトを書く前に6万トークン以上を消費していました。これはOpusの20万トークンのコンテキストウィンドウのほぼ半分に相当し、しかもスキルやプラグインの外側での消費量です。つまり、サーバーが多数ある場合、かなりの量のトークンを消費する可能性があります。Geminiのように100万トークンのウィンドウを持つモデルが存在しますが、コンテキストに追加するものが多いほど、モデルのパフォーマンスは低下する傾向があるという問題も指摘されています。

2つの解決アプローチ:検索とプログラマティック

この問題を修正する2つの人気のあるアプローチが紹介されています。Cloudflareが採用したプログラマティックアプローチと、Claude Codeチームが採用した検索アプローチです。検索プロセスは次のように機能します。まず、Claudeは事前読み込みされたMCPツールがコンテキストの10%以上を占めているかをチェックします。コンテキストウィンドウが20万トークンの場合、2万トークンが基準となります。10%未満であれば変更は行われず、モデルは通常通りMCPツールを使用します。

検索アプローチの詳細とAgentSkillsとの類似性

コンテキストの10%以上を占める場合、Claudeは自然言語を使用して正しいツールを動的に発見し、プロンプトに基づいて最も関連性の高い3-5個のツールのみを読み込みます。これらのツールだけを完全にコンテキストに読み込み、モデルが通常通り使用できるようにします。この機能はGitHubで最もリクエストされていたもので、AgentSkillsと同様に機能します。AgentSkillsはスキル名と説明のみをコンテキストに読み込み、関連性があると判断したスキル、またはプロンプトで言及されたスキルを見つけると、その特定のスキルをすべてコンテキストウィンドウに読み込む段階的開示のメカニズムを採用しています。AnthropicとCursorの両方が、MCPツールにこのアプローチを使用することで大きなメリットを得ています。

プログラマティックアプローチの説明とCloudflareの実装

プログラマティックアプローチは、API呼び出しを行う代わりに、モデルがコードを通じてツールをオーケストレーションすることで機能します。前のレスポンスに基づいて順番に動作する必要がある3つのツールについて、個別のAPIツール呼び出しを行う代わりに、Claudeはこのオーケストレーションをすべて行うPythonスクリプトを書き、コードを実行してその結果をモデルに返すことができます。Cloudflareはこれをさらに一歩進め、利用可能なすべてのツールのTypeScript定義をモデルに書かせ、通常はワーカーであるサンドボックスでコードを実行しています。しかし、Claude Codeチームは実際にプログラマティックアプローチを試しましたが、検索の方がうまく機能することを発見しました。Claudeがコードを書くのが非常に得意であることを考えると、これは本当に信じがたい結果です。

将来の可能性と結論

VercelがリリースしたエージェントブラウザのヘッドレスChromium CLI機能もClaude Codeで非常にうまく動作しています。MCPorterのようなツールを使ってすべてのMCPツールをCLIコマンドに変換できれば、コンテキストに読み込むよりも特定のCLIコマンドを実行する方がモデルにとってはるかに簡単で効率的だと話者は考えています。ただし、これは個人的な意見であると補足されています。全体として、MCPサーバーの問題が検討されているのは嬉しいことで、もしかしたら複数のサーバーをインストールしてみようという気になるかもしれないと結論付けています。

Community Posts

No posts yet. Be the first to write about this video!

Write about this video