Claude Code में MCP Tools अब 10 गुना तेज हो गए

BBetter Stack
Computing/SoftwareInternet Technology

Transcript

00:00:00Closco टीम ने MCP की सबसे बड़ी समस्या को ठीक कर दिया है,
00:00:03टूल सर्च जोड़कर संदर्भ को 95% तक कम किया जा सकता है,
00:00:07बस उपयोग से पहले टूल का नाम खोजकर,
00:00:09बजाय इसके कि सभी उपलब्ध टूल को संदर्भ में पहले से लोड किया जाए,
00:00:14जो आपके पहले प्रॉम्प्ट लिखने से पहले ही हजारों टोकन खर्च कर सकता है।
00:00:18लेकिन पहले यह इस तरह क्यों नहीं काम करता था?
00:00:21और क्या उन्होंने यह तकनीक Cloudflare से चुराई?
00:00:24सब्सक्राइब करें और आइए इसमें गहराई से जानते हैं।
00:00:26MCP सर्वर हर जगह हैं,
00:00:28GitHub,
00:00:28Docker,
00:00:29Notion के लिए भी,
00:00:30यहां तक कि एक बेहतर स्टैक वाला भी है जो मैंने सुना है कि वास्तव में अच्छा है।
00:00:35और जब लोग Claude Code और LLM का उपयोग कोड के अलावा हर चीज़ के लिए कर रहे हैं,
00:00:40तो ऐसा लगता है कि MCP जल्द ही कहीं नहीं जा रहा है।
00:00:43लेकिन इसकी अपनी समस्याएं हैं,
00:00:45नाम टकराव,
00:00:46कमांड इंजेक्शन,
00:00:47और सबसे बड़ी टोकन अक्षमता,
00:00:49क्योंकि एक जुड़े सर्वर के सभी टूल आमतौर पर मॉडल के संदर्भ विंडो में पहले से लोड हो जाते हैं ताकि मॉडल को पूरी दृश्यता मिल सके।
00:00:57तो टूल के नाम,
00:00:58टूल विवरण,
00:00:58पूरा JSON स्कीमा दस्तावेज़ीकरण जिसमें वैकल्पिक और आवश्यक पैरामीटर,
00:01:03उनके प्रकार,
00:01:04कोई बाधाएं शामिल हैं,
00:01:05मूल रूप से बहुत सारा डेटा।
00:01:07Redis टीम ने चार अलग-अलग सर्वर से 167 टूल का उपयोग किया,
00:01:11जिसने प्रॉम्प्ट लिखने से पहले ही 60,
00:01:13000 से अधिक टोकन खर्च कर दिए।
00:01:15Opus की 200k संदर्भ विंडो का लगभग आधा,
00:01:18और यह स्किल्स और प्लगइन्स के बाहर भी है।
00:01:21तो अगर आपके पास बहुत सारे सर्वर हैं,
00:01:23तो यह काफी मात्रा में टोकन ले सकता है।
00:01:25हां,
00:01:26मुझे पता है कि Gemini जैसे मॉडल हैं,
00:01:28जिनकी 1 मिलियन टोकन विंडो है,
00:01:30लेकिन जितनी अधिक चीजें आप उनके संदर्भ में जोड़ते हैं,
00:01:33मॉडल उतना ही खराब प्रदर्शन करते हैं।
00:01:35तो इसे ठीक करने का सबसे अच्छा तरीका क्या है?
00:01:37खैर,
00:01:37मैंने ऑनलाइन दो लोकप्रिय तरीके देखे हैं,
00:01:40प्रोग्रामेटिक दृष्टिकोण,
00:01:41जो Cloudflare ने किया है,
00:01:43और सर्च दृष्टिकोण,
00:01:44जो Claude Code टीम ने किया है।
00:01:46मैं प्रोग्रामेटिक दृष्टिकोण के बारे में बाद में बात करूंगा,
00:01:49लेकिन पहले,
00:01:50आइए सर्च प्रक्रिया के बारे में बात करें,
00:01:52जो इस तरह काम करती है।
00:01:53सबसे पहले,
00:01:54Claude जांचता है कि पहले से लोड किए गए MCP टूल संदर्भ के 10% से अधिक हैं या नहीं।
00:01:59तो यह 20k टोकन है अगर संदर्भ विंडो 200k टोकन की है।
00:02:04यदि नहीं,
00:02:05तो कोई बदलाव नहीं होता है,
00:02:07और मॉडल MCP टूल का सामान्य रूप से उपयोग करता है।
00:02:10लेकिन अगर हां,
00:02:11तो Claude प्राकृतिक भाषा का उपयोग करके सही टूल को गतिशील रूप से खोजता है और प्रॉम्प्ट के आधार पर तीन से पांच सबसे प्रासंगिक टूल लोड करता है।
00:02:22यह केवल इन टूल को पूरी तरह से संदर्भ में लोड करेगा ताकि मॉडल सामान्य रूप से उपयोग कर सके।
00:02:27यह वास्तव में GitHub पर उनकी सबसे अधिक मांग वाली सुविधा थी,
00:02:31और यह AgentSkills के समान काम करती है,
00:02:33जो केवल स्किल के नाम और विवरण को संदर्भ में लोड करती है,
00:02:37और जब उसे कोई स्किल प्रासंगिक लगती है या प्रॉम्प्ट में उल्लेखित कोई स्किल मिलती है,
00:02:42तो वह उस विशिष्ट स्किल को संदर्भ विंडो में लोड करती है।
00:02:46संक्षेप में प्रोग्रेसिव डिस्क्लोजर।
00:02:47Anthropic और Cursor दोनों ने MCP टूल के लिए इस दृष्टिकोण का उपयोग करने में बड़े लाभ देखे हैं।
00:02:53लेकिन प्रोग्रामेटिक दृष्टिकोण के बारे में क्या?
00:02:55यह मॉडल द्वारा API कॉल करने के बजाय कोड के माध्यम से टूल को व्यवस्थित करके काम करता है।
00:03:01तो इन तीन टूल के लिए जो पिछली प्रतिक्रिया के आधार पर एक के बाद एक काम करने की आवश्यकता है,
00:03:06व्यक्तिगत API टूल कॉल करने के बजाय,
00:03:08Claude विशेष रूप से इस सभी व्यवस्था को करने के लिए एक Python स्क्रिप्ट लिख सकता है,
00:03:12फिर कोड निष्पादित कर सकता है और परिणाम वापस मॉडल को प्रस्तुत कर सकता है।
00:03:16Cloudflare ने इसे एक कदम आगे बढ़ाया है,
00:03:19मॉडल से सभी उपलब्ध टूल के लिए TypeScript परिभाषाएं लिखवाकर और फिर सैंडबॉक्स में कोड चलाकर जो आमतौर पर एक वर्कर होता है।
00:03:27Claude Code टीम ने वास्तव में प्रोग्रामेटिक दृष्टिकोण की कोशिश की लेकिन सर्च को बेहतर पाया,
00:03:32जिस पर मुझे विश्वास करना बहुत मुश्किल लगता है क्योंकि Claude कोड लिखने में बहुत अच्छा है।
00:03:38और साथ ही,
00:03:38Vacel द्वारा जारी किया गया एजेंट ब्राउज़र CLI हेडलेस क्रोमियम चीज़ Clawed code में बहुत अच्छी तरह से काम करती है और मुझे यकीन है कि अगर आप सभी MCP टूल्स को MCPorter जैसी किसी चीज़ का उपयोग करके CLI कमांड्स में बदल सकें,
00:03:51तो मॉडल्स के लिए चीज़ों को context में लोड करने के बजाय किसी टूल के लिए एक विशिष्ट CLI कमांड चलाना बहुत आसान और context के लिहाज से कुशल होगा,
00:03:59लेकिन अरे,
00:04:00यह सिर्फ मेरी राय है।
00:04:01कुल मिलाकर,
00:04:02मुझे खुशी है कि MCP सर्वर्स के साथ होने वाली समस्याओं पर ध्यान दिया जा रहा है और शायद यह मुझे एक से अधिक सर्वर इंस्टॉल करने के लिए राजी कर दे।

Key Takeaway

Claude Code ने MCP टूल सर्च फीचर जोड़कर टोकन उपयोग को 95% तक कम कर दिया है, जो केवल प्रासंगिक टूल को गतिशील रूप से लोड करता है बजाय सभी टूल को पहले से संदर्भ में लोड करने के।

Highlights

MCP टूल सर्च फीचर से संदर्भ उपयोग 95% तक कम हो सकता है

167 टूल्स ने पहले 60,000+ टोकन खर्च किए थे जो Opus की 200k विंडो का लगभग आधा है

Claude Code अब 10% थ्रेशोल्ड के आधार पर गतिशील रूप से टूल खोजता और लोड करता है

प्रोग्रामेटिक दृष्टिकोण (Cloudflare का तरीका) बनाम सर्च दृष्टिकोण (Claude Code का तरीका)

Claude Code टीम ने प्रोग्रामेटिक दृष्टिकोण की कोशिश की लेकिन सर्च को बेहतर पाया

AgentSkills जैसे प्रोग्रेसिव डिस्क्लोजर की तकनीक का उपयोग किया गया है

MCP की मुख्य समस्याएं: नाम टकराव, कमांड इंजेक्शन, और टोकन अक्षमता

Timeline

MCP की टोकन समस्या और समाधान का परिचय

Claude Code टीम ने MCP (Model Context Protocol) की सबसे बड़ी समस्या को हल किया है जो टोकन की अक्षमता थी। नया टूल सर्च फीचर संदर्भ उपयोग को 95% तक कम कर सकता है क्योंकि यह सभी उपलब्ध टूल को पहले से लोड करने के बजाय केवल आवश्यक टूल को खोजकर उपयोग करता है। पुराने तरीके में सभी टूल पहले से संदर्भ में लोड होते थे, जो उपयोगकर्ता द्वारा पहला प्रॉम्प्ट लिखने से पहले ही हजारों टोकन खर्च कर देता था। वीडियो यह भी पूछता है कि पहले यह इस तरह क्यों काम नहीं करता था और क्या यह तकनीक Cloudflare से ली गई है।

MCP सर्वर की लोकप्रियता और मुख्य समस्याएं

MCP सर्वर अब हर जगह उपलब्ध हैं - GitHub, Docker, Notion और यहां तक कि बेहतर स्टैक के लिए भी। लोग Claude Code और LLM का उपयोग कोड के अलावा हर चीज़ के लिए कर रहे हैं, इसलिए MCP जल्द ही कहीं नहीं जा रहा है। हालांकि, MCP की तीन मुख्य समस्याएं हैं: नाम टकराव, कमांड इंजेक्शन, और सबसे महत्वपूर्ण टोकन अक्षमता। टोकन अक्षमता की समस्या इसलिए होती है क्योंकि एक जुड़े सर्वर के सभी टूल आमतौर पर मॉडल के संदर्भ विंडो में पहले से लोड हो जाते हैं, जिसमें टूल के नाम, विवरण, पूरा JSON स्कीमा दस्तावेज़ीकरण, पैरामीटर, प्रकार और बाधाएं शामिल होती हैं - मूल रूप से बहुत सारा डेटा।

टोकन उपयोग का वास्तविक उदाहरण और समस्या की गंभीरता

Redis टीम का एक वास्तविक उदाहरण दिया गया है जिसमें चार अलग-अलग सर्वर से 167 टूल का उपयोग किया गया था। इस सेटअप ने प्रॉम्प्ट लिखने से पहले ही 60,000 से अधिक टोकन खर्च कर दिए, जो Opus की 200k संदर्भ विंडो का लगभग आधा है। यह संख्या स्किल्स और प्लगइन्स के बाहर की है, इसलिए अगर आपके पास बहुत सारे सर्वर हैं तो यह काफी मात्रा में टोकन ले सकता है। हालांकि Gemini जैसे मॉडल 1 मिलियन टोकन विंडो प्रदान करते हैं, लेकिन जितनी अधिक चीजें संदर्भ में जोड़ी जाती हैं, मॉडल उतना ही खराब प्रदर्शन करते हैं। यह समस्या की गंभीरता को दर्शाता है और बेहतर समाधान की आवश्यकता को स्पष्ट करता है।

दो लोकप्रिय समाधान: प्रोग्रामेटिक और सर्च दृष्टिकोण

इस समस्या को ठीक करने के लिए दो लोकप्रिय तरीके हैं: प्रोग्रामेटिक दृष्टिकोण (Cloudflare द्वारा उपयोग किया गया) और सर्च दृष्टिकोण (Claude Code टीम द्वारा उपयोग किया गया)। सर्च प्रक्रिया इस तरह काम करती है: सबसे पहले, Claude जांचता है कि पहले से लोड किए गए MCP टूल संदर्भ के 10% से अधिक हैं या नहीं। यह 200k टोकन की संदर्भ विंडो के लिए 20k टोकन है। यदि नहीं, तो कोई बदलाव नहीं होता है और मॉडल MCP टूल का सामान्य रूप से उपयोग करता है। लेकिन अगर 10% से अधिक है, तो Claude प्राकृतिक भाषा का उपयोग करके सही टूल को गतिशील रूप से खोजता है।

सर्च दृष्टिकोण का विस्तृत कार्य और AgentSkills से तुलना

जब 10% थ्रेशोल्ड पार हो जाता है, तो Claude प्रॉम्प्ट के आधार पर तीन से पांच सबसे प्रासंगिक टूल लोड करता है। यह केवल इन टूल को पूरी तरह से संदर्भ में लोड करता है ताकि मॉडल सामान्य रूप से उपयोग कर सके। यह वास्तव में GitHub पर सबसे अधिक मांग वाली सुविधा थी। यह दृष्टिकोण AgentSkills के समान काम करता है, जो केवल स्किल के नाम और विवरण को संदर्भ में लोड करती है, और जब कोई स्किल प्रासंगिक लगती है या प्रॉम्प्ट में उल्लेखित मिलती है, तो वह उस विशिष्ट स्किल को संदर्भ विंडो में लोड करती है। यह प्रोग्रेसिव डिस्क्लोजर की तकनीक है, और Anthropic और Cursor दोनों ने MCP टूल के लिए इस दृष्टिकोण में बड़े लाभ देखे हैं।

प्रोग्रामेटिक दृष्टिकोण और Cloudflare का कार्यान्वयन

प्रोग्रामेटिक दृष्टिकोण मॉडल द्वारा API कॉल करने के बजाय कोड के माध्यम से टूल को व्यवस्थित करके काम करता है। उदाहरण के लिए, तीन टूल के लिए जो पिछली प्रतिक्रिया के आधार पर एक के बाद एक काम करने की आवश्यकता है, व्यक्तिगत API टूल कॉल करने के बजाय, Claude विशेष रूप से इस सभी व्यवस्था को करने के लिए एक Python स्क्रिप्ट लिख सकता है। फिर कोड निष्पादित करके परिणाम वापस मॉडल को प्रस्तुत किया जाता है। Cloudflare ने इसे एक कदम आगे बढ़ाया है - मॉडल से सभी उपलब्ध टूल के लिए TypeScript परिभाषाएं लिखवाकर और फिर सैंडबॉक्स में कोड चलाकर जो आमतौर पर एक वर्कर होता है। Claude Code टीम ने वास्तव में प्रोग्रामेटिक दृष्टिकोण की कोशिश की लेकिन सर्च को बेहतर पाया।

विश्लेषण, वैकल्पिक विचार और निष्कर्ष

वीडियो निर्माता को Claude Code टीम का यह निर्णय विश्वास करना मुश्किल लगता है कि सर्च दृष्टिकोण बेहतर है, क्योंकि Claude कोड लिखने में बहुत अच्छा है। Vacel द्वारा जारी किया गया एजेंट ब्राउज़र CLI (हेडलेस क्रोमियम) Claude Code में बहुत अच्छी तरह से काम करता है। वीडियो निर्माता का मानना है कि अगर सभी MCP टूल्स को MCPorter जैसी किसी चीज़ का उपयोग करके CLI कमांड्स में बदला जा सके, तो मॉडल्स के लिए चीज़ों को context में लोड करने के बजाय किसी टूल के लिए एक विशिष्ट CLI कमांड चलाना बहुत आसान और context के लिहाज से कुशल होगा। कुल मिलाकर, वीडियो निर्माता खुश है कि MCP सर्वर्स की समस्याओं पर ध्यान दिया जा रहा है और शायद यह उन्हें एक से अधिक सर्वर इंस्टॉल करने के लिए राजी कर दे।

Community Posts

No posts yet. Be the first to write about this video!

Write about this video