00:00:00Closco टीम ने MCP की सबसे बड़ी समस्या को ठीक कर दिया है,
00:00:03टूल सर्च जोड़कर संदर्भ को 95% तक कम किया जा सकता है,
00:00:07बस उपयोग से पहले टूल का नाम खोजकर,
00:00:09बजाय इसके कि सभी उपलब्ध टूल को संदर्भ में पहले से लोड किया जाए,
00:00:14जो आपके पहले प्रॉम्प्ट लिखने से पहले ही हजारों टोकन खर्च कर सकता है।
00:00:18लेकिन पहले यह इस तरह क्यों नहीं काम करता था?
00:00:21और क्या उन्होंने यह तकनीक Cloudflare से चुराई?
00:00:24सब्सक्राइब करें और आइए इसमें गहराई से जानते हैं।
00:00:26MCP सर्वर हर जगह हैं,
00:00:28GitHub,
00:00:28Docker,
00:00:29Notion के लिए भी,
00:00:30यहां तक कि एक बेहतर स्टैक वाला भी है जो मैंने सुना है कि वास्तव में अच्छा है।
00:00:35और जब लोग Claude Code और LLM का उपयोग कोड के अलावा हर चीज़ के लिए कर रहे हैं,
00:00:40तो ऐसा लगता है कि MCP जल्द ही कहीं नहीं जा रहा है।
00:00:43लेकिन इसकी अपनी समस्याएं हैं,
00:00:45नाम टकराव,
00:00:46कमांड इंजेक्शन,
00:00:47और सबसे बड़ी टोकन अक्षमता,
00:00:49क्योंकि एक जुड़े सर्वर के सभी टूल आमतौर पर मॉडल के संदर्भ विंडो में पहले से लोड हो जाते हैं ताकि मॉडल को पूरी दृश्यता मिल सके।
00:00:57तो टूल के नाम,
00:00:58टूल विवरण,
00:00:58पूरा JSON स्कीमा दस्तावेज़ीकरण जिसमें वैकल्पिक और आवश्यक पैरामीटर,
00:01:03उनके प्रकार,
00:01:04कोई बाधाएं शामिल हैं,
00:01:05मूल रूप से बहुत सारा डेटा।
00:01:07Redis टीम ने चार अलग-अलग सर्वर से 167 टूल का उपयोग किया,
00:01:11जिसने प्रॉम्प्ट लिखने से पहले ही 60,
00:01:13000 से अधिक टोकन खर्च कर दिए।
00:01:15Opus की 200k संदर्भ विंडो का लगभग आधा,
00:01:18और यह स्किल्स और प्लगइन्स के बाहर भी है।
00:01:21तो अगर आपके पास बहुत सारे सर्वर हैं,
00:01:23तो यह काफी मात्रा में टोकन ले सकता है।
00:01:25हां,
00:01:26मुझे पता है कि Gemini जैसे मॉडल हैं,
00:01:28जिनकी 1 मिलियन टोकन विंडो है,
00:01:30लेकिन जितनी अधिक चीजें आप उनके संदर्भ में जोड़ते हैं,
00:01:33मॉडल उतना ही खराब प्रदर्शन करते हैं।
00:01:35तो इसे ठीक करने का सबसे अच्छा तरीका क्या है?
00:01:37खैर,
00:01:37मैंने ऑनलाइन दो लोकप्रिय तरीके देखे हैं,
00:01:40प्रोग्रामेटिक दृष्टिकोण,
00:01:41जो Cloudflare ने किया है,
00:01:43और सर्च दृष्टिकोण,
00:01:44जो Claude Code टीम ने किया है।
00:01:46मैं प्रोग्रामेटिक दृष्टिकोण के बारे में बाद में बात करूंगा,
00:01:49लेकिन पहले,
00:01:50आइए सर्च प्रक्रिया के बारे में बात करें,
00:01:52जो इस तरह काम करती है।
00:01:53सबसे पहले,
00:01:54Claude जांचता है कि पहले से लोड किए गए MCP टूल संदर्भ के 10% से अधिक हैं या नहीं।
00:01:59तो यह 20k टोकन है अगर संदर्भ विंडो 200k टोकन की है।
00:02:04यदि नहीं,
00:02:05तो कोई बदलाव नहीं होता है,
00:02:07और मॉडल MCP टूल का सामान्य रूप से उपयोग करता है।
00:02:10लेकिन अगर हां,
00:02:11तो Claude प्राकृतिक भाषा का उपयोग करके सही टूल को गतिशील रूप से खोजता है और प्रॉम्प्ट के आधार पर तीन से पांच सबसे प्रासंगिक टूल लोड करता है।
00:02:22यह केवल इन टूल को पूरी तरह से संदर्भ में लोड करेगा ताकि मॉडल सामान्य रूप से उपयोग कर सके।
00:02:27यह वास्तव में GitHub पर उनकी सबसे अधिक मांग वाली सुविधा थी,
00:02:31और यह AgentSkills के समान काम करती है,
00:02:33जो केवल स्किल के नाम और विवरण को संदर्भ में लोड करती है,
00:02:37और जब उसे कोई स्किल प्रासंगिक लगती है या प्रॉम्प्ट में उल्लेखित कोई स्किल मिलती है,
00:02:42तो वह उस विशिष्ट स्किल को संदर्भ विंडो में लोड करती है।
00:02:46संक्षेप में प्रोग्रेसिव डिस्क्लोजर।
00:02:47Anthropic और Cursor दोनों ने MCP टूल के लिए इस दृष्टिकोण का उपयोग करने में बड़े लाभ देखे हैं।
00:02:53लेकिन प्रोग्रामेटिक दृष्टिकोण के बारे में क्या?
00:02:55यह मॉडल द्वारा API कॉल करने के बजाय कोड के माध्यम से टूल को व्यवस्थित करके काम करता है।
00:03:01तो इन तीन टूल के लिए जो पिछली प्रतिक्रिया के आधार पर एक के बाद एक काम करने की आवश्यकता है,
00:03:06व्यक्तिगत API टूल कॉल करने के बजाय,
00:03:08Claude विशेष रूप से इस सभी व्यवस्था को करने के लिए एक Python स्क्रिप्ट लिख सकता है,
00:03:12फिर कोड निष्पादित कर सकता है और परिणाम वापस मॉडल को प्रस्तुत कर सकता है।
00:03:16Cloudflare ने इसे एक कदम आगे बढ़ाया है,
00:03:19मॉडल से सभी उपलब्ध टूल के लिए TypeScript परिभाषाएं लिखवाकर और फिर सैंडबॉक्स में कोड चलाकर जो आमतौर पर एक वर्कर होता है।
00:03:27Claude Code टीम ने वास्तव में प्रोग्रामेटिक दृष्टिकोण की कोशिश की लेकिन सर्च को बेहतर पाया,
00:03:32जिस पर मुझे विश्वास करना बहुत मुश्किल लगता है क्योंकि Claude कोड लिखने में बहुत अच्छा है।
00:03:38और साथ ही,
00:03:38Vacel द्वारा जारी किया गया एजेंट ब्राउज़र CLI हेडलेस क्रोमियम चीज़ Clawed code में बहुत अच्छी तरह से काम करती है और मुझे यकीन है कि अगर आप सभी MCP टूल्स को MCPorter जैसी किसी चीज़ का उपयोग करके CLI कमांड्स में बदल सकें,
00:03:51तो मॉडल्स के लिए चीज़ों को context में लोड करने के बजाय किसी टूल के लिए एक विशिष्ट CLI कमांड चलाना बहुत आसान और context के लिहाज से कुशल होगा,
00:03:59लेकिन अरे,
00:04:00यह सिर्फ मेरी राय है।
00:04:01कुल मिलाकर,
00:04:02मुझे खुशी है कि MCP सर्वर्स के साथ होने वाली समस्याओं पर ध्यान दिया जा रहा है और शायद यह मुझे एक से अधिक सर्वर इंस्टॉल करने के लिए राजी कर दे।