00:00:00CloscoチームがMCPの最大の問題を解決しました。ツール検索機能を追加することで、
00:00:05コンテキストを最大95%削減できるようになったのです。使用前にツール名を検索するだけで、
00:00:10利用可能なすべてのツールを事前にコンテキストに読み込む必要がなくなりました。従来は、
00:00:15最初のプロンプトを書く前に数万トークンも消費していたのです。
00:00:18しかし、なぜ以前はこの方式ではなかったのでしょうか?
00:00:21そして、この技術はCloudflareから盗んだのでしょうか?
00:00:24チャンネル登録して、詳しく見ていきましょう。
00:00:26MCPサーバーはあらゆる場所に存在します。GitHub用、
00:00:29Docker用、
00:00:30Notion用があり、
00:00:32本当に優れていると評判のBetter Stack用まであります。
00:00:35そして、
00:00:36人々がClawed CodeとLLMをコード以外のあらゆる用途で使用していることから、
00:00:41MCPは当分なくなりそうにありません。
00:00:43しかし、
00:00:44MCPには問題があります。名前の衝突、
00:00:46コマンドインジェクション、
00:00:47そして最大の問題であるトークン非効率です。接続されたサーバーからのすべてのツールが通常、
00:00:52モデルのコンテキストウィンドウに事前読み込みされ、
00:00:55モデルに完全な可視性を与えるためです。
00:00:57つまり、
00:00:57ツール名、
00:00:58ツールの説明、
00:00:59オプションと必須パラメータ、
00:01:01その型、
00:01:02制約を含む完全なJSONスキーマドキュメント、
00:01:05基本的に大量のデータです。
00:01:07Redisチームは4つの異なるサーバーから167個のツールを使用し、プロンプトを書く前に6万トークン以上を消費しました。
00:01:15Opusの20万トークンのコンテキストウィンドウのほぼ半分です。しかもこれはスキルやプラグインの外側での話です。
00:01:21つまり、サーバーが多数ある場合、かなりの量のトークンを消費する可能性があります。
00:01:25はい、
00:01:26Geminiのように100万トークンのウィンドウを持つモデルがあることは知っています。しかし、
00:01:30コンテキストに追加するものが多いほど、
00:01:32モデルのパフォーマンスは低下する傾向があります。
00:01:35では、これを修正する最善の方法は何でしょうか?
00:01:37オンラインで2つの人気のあるアプローチを見てきました。Cloudflareが採用したプログラマティックアプローチと、
00:01:43Clawed Codeチームが採用した検索アプローチです。
00:01:46プログラマティックアプローチについては後で説明しますが、まず検索プロセスについて説明します。これは次のように機能します。
00:01:53まず、Clawedは事前読み込みされたMCPツールがコンテキストの10%以上を占めているかをチェックします。
00:01:59つまり、コンテキストウィンドウが20万トークンの場合、2万トークンです。
00:02:04そうでなければ、変更は行われず、モデルは通常通りMCPツールを使用します。
00:02:10しかし、
00:02:11そうであれば、
00:02:12Clawedは自然言語を使用して正しいツールを動的に発見し、
00:02:17プロンプトに基づいて最も関連性の高い3〜5個のツールを読み込みます。
00:02:22これらのツールだけを完全にコンテキストに読み込み、モデルが通常通り使用できるようにします。
00:02:27これは実際にGitHubで最もリクエストされていた機能で、
00:02:31AgentSkillsと同様に機能します。AgentSkillsはスキル名と説明のみをコンテキストに読み込み、
00:02:37関連性があると判断したスキル、
00:02:39またはプロンプトで言及されたスキルを見つけると、
00:02:42その特定のスキルをすべてコンテキストウィンドウに読み込みます。
00:02:46要するに、段階的な開示です。
00:02:47AnthropicとCursorの両方が、MCPツールにこのアプローチを使用することで大きなメリットを得ています。
00:02:53では、プログラマティックアプローチはどうでしょうか?
00:02:55これは、API呼び出しを行う代わりに、モデルがコードを通じてツールをオーケストレーションすることで機能します。
00:03:01前のレスポンスに基づいて順番に動作する必要があるこれら3つのツールについて、
00:03:05個別のAPIツール呼び出しを行う代わりに、
00:03:08特にClawedはこのオーケストレーションをすべて行うPythonスクリプトを書き、
00:03:13コードを実行してその結果をモデルに返すことができます。
00:03:16Cloudflareはこれをさらに一歩進め、
00:03:19利用可能なすべてのツールのTypeScript定義をモデルに書かせ、
00:03:23通常はワーカーであるサンドボックスでコードを実行しています。
00:03:27Clawed Codeチームは実際にプログラマティックアプローチを試しましたが、
00:03:31検索の方がうまく機能することを発見しました。Clawedがコードを書くのが非常に得意であることを考えると、
00:03:36これは本当に信じがたいことです。
00:03:38また、
00:03:38VercelがリリースしたエージェントブラウザのヘッドレスChromium CLI機能もClaude Codeで非常にうまく動作しています。MCPorterのようなツールを使ってすべてのMCPツールをCLIコマンドに変換できれば、
00:03:52コンテキストに読み込むよりも、
00:03:54特定のCLIコマンドを実行する方がモデルにとってはるかに簡単で効率的だと思いますが、
00:03:59まあ、
00:04:00これは私の個人的な意見です。
00:04:01全体として、
00:04:02MCPサーバーの問題が検討されているのは嬉しいことで、
00:04:05もしかしたら複数のサーバーをインストールしてみようという気になるかもしれません。