Claude Code महंगा है। यह MCP सर्वर इसे ठीक करता है (Context Mode)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00अगर आप Claude code में कोडिंग कर रहे हैं, तो आपने शायद कॉन्टेक्स्ट ब्लोट (context bloat) का अनुभव किया होगा।
00:00:05समस्या यह है कि Claude code में हर MCP टूल कॉल बहुत महंगा पड़ता है क्योंकि
00:00:11इनमें से हर एक कॉल अपना पूरा आउटपुट सीधे मॉडल के 200k कॉन्टेक्स्ट विंडो में डाल देता है।
00:00:17और आपके पास जितने ज़्यादा टूल होंगे, आपका कॉन्टेक्स्ट उतनी ही तेज़ी से खत्म होगा। कुछ खास स्थितियों में,
00:00:22सक्रिय एजेंट उपयोग के केवल 30 मिनट के भीतर ही आपका कॉन्टेक्स्ट भर जाता है।
00:00:28और तभी AI फाइलों, कामों और ज़रूरी फैसलों को भूलने लगता है। इसके अलावा,
00:00:34आप उन टोकन्स पर काफी पैसा भी खर्च कर रहे होते हैं। लेकिन एक ऐसा MCP सर्वर है जो इस समस्या को हल करता है।
00:00:40इसका नाम 'कॉन्टेक्स्ट मोड' (context mode) है। आज के वीडियो में, हम देखेंगे कि कॉन्टेक्स्ट मोड क्या करता है,
00:00:44यह कैसे काम करता है, और एक छोटे से डेमो के साथ खुद इसका परीक्षण करेंगे।
00:00:48इसमें बहुत मज़ा आने वाला है, तो चलिए शुरू करते हैं।
00:00:55ऐसा क्यों होता है यह समझने के लिए, आइए गणित पर गौर करें। एक वेब पेज का सिंगल Playwright स्नैपशॉट
00:01:00लगभग 56 किलोबाइट का होता है। 20 GitHub इश्यूज़ को पढ़ना 59 किलोबाइट का है। अगर हम
00:01:08प्लानिंग फेज़ के दौरान ये काम कई बार करते हैं, तो एजेंट के एक लाइन कोड लिखने से पहले ही आपकी 70% विंडो भर चुकी होती है।
00:01:14कॉन्टेक्स्ट मोड एक वर्चुअलाइजेशन लेयर (virtualization layer) की तरह काम करता है।
00:01:20AI सीधे आपके OS से बात करने के बजाय, एक सैंडबॉक्स से बात करता है। और भारी-भरकम आउटपुट देने के बजाय,
00:01:26कॉन्टेक्स्ट मोड उन्हें FTS5, यानी फुल टेक्स्ट सर्च का उपयोग करके एक लोकल SQLite डेटाबेस में इंडेक्स करता है।
00:01:34और इसका परिणाम काफी बड़ा है। उदाहरण के लिए, वह 56k का Playwright स्नैपशॉट घटकर केवल 299
00:01:41बाइट्स रह जाता है, जो कि 99% की कमी है। या फिर, यह एनालिटिक्स CSV फाइल घटकर 222 बाइट्स
00:01:49हो जाती है, जो लगभग 100% की कमी है। लेकिन टोकन बचाना तो समाधान का सिर्फ एक हिस्सा है।
00:01:56असली फायदा सेशन की निरंतरता (session continuity) में है। हम सबने देखा है कि कैसे एजेंट का इतिहास कंपैक्ट होता है
00:02:03और अचानक वह उस कोड को भूल जाता है जो उसने 10 मिनट पहले लिखा था। लेकिन कॉन्टेक्स्ट मोड हर फाइल एडिट,
00:02:09गिट ऑपरेशन और सब-एजेंट टास्क पर नज़र रखने के लिए हुक्स (hooks) का उपयोग करता है। जब आपकी बातचीत कंपैक्ट होती है,
00:02:15तो कॉन्टेक्स्ट मोड एक प्रायोरिटी टियर्ड स्नैपशॉट बनाता है, जो आमतौर पर 2 किलोबाइट से कम होता है, और उसे वापस जोड़ देता है।
00:02:22यह आपके कोडिंग सेशन के लिए एक 'सेव चेकपॉइंट' की तरह है। तो आप सैद्धांतिक रूप से अपने सेशन के समय को
00:02:2730 मिनट से बढ़ाकर लगभग 3 घंटे तक कर सकते हैं। यह फैसलों और गलतियों को भी ट्रैक करता है।
00:02:34मिसाल के तौर पर, अगर AI ने 20 मिनट पहले कोई सुधार आज़माया जो विफल रहा, तो कॉन्टेक्स्ट रीसेट होने के बाद भी वह उसे नहीं दोहराएगा।
00:02:40इसे इंस्टॉल करना बहुत आसान है। अगर आप Claude code पर हैं, तो पहले इस कमांड को चलाकर
00:02:46कॉन्टेक्स्ट मोड मार्केटप्लेस जोड़ें। और फिर प्लगइन इंस्टॉल कमांड चलाएँ। एक बार यह हो जाने पर,
00:02:53आप काम शुरू कर सकते हैं। इंस्टॉल होने के बाद, यह MCP सर्वर, हुक्स और
00:02:57राउटिंग निर्देशों को खुद ही संभाल लेता है। अगर आप Gemini CLI या VS Code Copilot का उपयोग कर रहे हैं,
00:03:03तो आप 'npm install context mode' चला सकते हैं और अपनी सेटिंग्स में कॉन्फ़िगरेशन जोड़ सकते हैं। अब चलिए इसे काम करते हुए देखते हैं।
00:03:10मेरे पास यहाँ एक साधारण पायथन कमांड है जो एक डमी एक्सेस लॉग फाइल बनाएगी जिसमें
00:03:15डमी API रिक्वेस्ट और उनके स्टेटस कोड की एक लंबी लिस्ट होगी। और हर सौवीं लाइन एक 500 एरर लॉग है।
00:03:22अब हम Claude शुरू कर सकते हैं और पूछ सकते हैं, “हे, access.log को इंडेक्स करने के लिए कॉन्टेक्स्ट मोड का उपयोग करो।
00:03:30मैं सभी 500 एरर पैटर्न्स को खोजना और उनसे जुड़े IP एड्रेस का सारांश चाहता हूँ।” और
00:03:36बैकग्राउंड में, कॉन्टेक्स्ट मोड access.log फाइल की 5,000 लाइनों को अपने SQLite
00:03:44FTS5 डेटाबेस में बाँट देता है। और Claude को केवल फाइल इंडेक्स होने की पुष्टि मिलती है, न कि पूरी 5,000 लाइनें।
00:03:51अब Claude पूरी फाइल को पार्स करने के बजाय कंटेंट के बारे में जानकारी लेने के लिए इंडेक्स डेटाबेस को समझदारी से सर्च कर सकता है।
00:03:57यहाँ हम Claude द्वारा मिले परिणाम देख सकते हैं। लेकिन इससे भी ज़रूरी बात यह है कि,
00:04:02आइए लागत की बचत देखें। हम 'context-mode --cts-stats' चलाकर ऐसा कर सकते हैं, और
00:04:09देख सकते हैं कि इस सेशन में कॉन्टेक्स्ट मोड ने कितना डेटा बचाया है। आप नतीजे
00:04:15यहीं देख सकते हैं। पूरी 20 किलोबाइट डेटा को बातचीत में डालने के बजाय, कॉन्टेक्स्ट मोड ने
00:04:21उस रॉ डेटा का लगभग 5 किलोबाइट सैंडबॉक्स में रखा। एक छोटी फाइल के लिए यह परिणाम काफी प्रभावशाली है।
00:04:27इसने लगभग 1,200 टोकन को कॉन्टेक्स्ट विंडो में जाने से रोक दिया। कुल मिलाकर, इस छोटे से टेस्ट में
00:04:34हमें 25% की अच्छी कमी मिली है। यह शायद सुनने में बहुत ज़्यादा न लगे, लेकिन याद रखें कि
00:04:41एक सामान्य Claude सेशन में, यह डेटा बस वहीं पड़ा रहता और आपके हर नए मैसेज के साथ बार-बार भेजा जाता।
00:04:47इसे सैंडबॉक्स में रखकर, हमने पहले ही इस सेशन की अवधि बढ़ानी शुरू कर दी है।
00:04:53यह डेमो फाइल काफी छोटी है, लेकिन अगर आप बड़ी फाइलों के साथ काम करते हैं,
00:04:58तो बचत बहुत बड़ी हो सकती है। अगर आप किसी विशाल रेपो रिसर्च प्रोजेक्ट पर काम कर रहे हैं या
00:05:03बड़े पैमाने के प्रोडक्शन लॉग्स का विश्लेषण कर रहे हैं, तो वह 1,200 टोकन की बचत आसानी से 1,00,000 टोकन में बदल सकती है।
00:05:11लेकिन लक्ष्य यहाँ सिर्फ API लागत पर पैसा बचाना नहीं है, हालाँकि वह एक अच्छा बोनस है।
00:05:18यह मॉडल की समझदारी (intelligence) को बनाए रखने के बारे में भी है। जब आप कॉन्टेक्स्ट विंडो से शोर को साफ़ कर देते हैं,
00:05:24तो आप वास्तविक तर्क (reasoning) के लिए अधिक जगह छोड़ रहे होते हैं। आप Claude को एक बेहतर इंजीनियर बनने के लिए ज़रूरी स्पेस दे रहे हैं।
00:05:30तो अगर आप AI एजेंट के साथ जटिल प्रोजेक्ट्स बना रहे हैं, तो इस टूल को आज़माएँ और देखें कि
00:05:35एजेंट के चीजें भूलने और कंपैक्ट होने से पहले आप अपने सेशन को कितना लंबा खींच सकते हैं।
00:05:41अगर आपको यह तकनीकी विश्लेषण पसंद आया, तो कृपया वीडियो के नीचे लाइक बटन दबाकर मुझे बताएं।
00:05:45और हमारे चैनल को सब्सक्राइब करना न भूलें। मैं Better Stack से एंडरिस हूँ,
00:05:50और मैं आपसे अगले वीडियो में मिलूँगा।

Key Takeaway

कॉन्टेक्स्ट मोड एक शक्तिशाली MCP सर्वर है जो डेटा को स्मार्ट तरीके से इंडेक्स करके Claude Code की कॉन्टेक्स्ट विंडो को बचाता है और AI की कार्यक्षमता को बढ़ाता है।

Highlights

Claude Code में 'कॉन्टेक्स्ट ब्लोट' एक बड़ी समस्या है, जहाँ टूल कॉल पूरे आउटपुट को 200k की कॉन्टेक्स्ट विंडो में भर देते हैं।

कॉन्टेक्स्ट मोड (Context Mode) एक वर्चुअलाइजेशन लेयर के रूप में काम करता है जो भारी डेटा को सीधे मॉडल में भेजने के बजाय SQLite डेटाबेस में इंडेक्स करता है।

यह तकनीक Playwright स्नैपशॉट जैसे डेटा को 99% तक कम कर सकती है, जिससे टोकन की भारी बचत होती है।

टोकन बचाने के अलावा, यह 'सेव चेकपॉइंट्स' बनाकर सेशन की निरंतरता बनाए रखता है, जिससे AI पुरानी गलतियों को नहीं दोहराता।

उपयोगकर्ता अपने कोडिंग सेशन के समय को 30 मिनट से बढ़ाकर लगभग 3 घंटे तक कर सकते हैं, जिससे मॉडल की तर्क क्षमता (reasoning) बेहतर होती है।

इसे Claude Code, Gemini CLI और VS Code Copilot जैसे विभिन्न टूल्स के साथ आसानी से इंस्टॉल और कॉन्फ़िगर किया जा सकता है।

Timeline

Claude Code में कॉन्टेक्स्ट ब्लोट की समस्या

वीडियो की शुरुआत Claude Code का उपयोग करते समय आने वाली मुख्य समस्या, 'कॉन्टेक्स्ट ब्लोट', के वर्णन से होती है। वक्ता बताते हैं कि कैसे हर टूल कॉल मॉडल की सीमित 200k कॉन्टेक्स्ट विंडो को बहुत तेज़ी से भर देता है। इसके कारण सक्रिय एजेंट उपयोग के मात्र 30 मिनट के भीतर ही AI ज़रूरी फाइलों और पिछले फैसलों को भूलने लगता है। यह न केवल प्रदर्शन को प्रभावित करता है, बल्कि उपयोगकर्ता के टोकन खर्च और पैसे को भी बढ़ाता है। अंत में, 'कॉन्टेक्स्ट मोड' नामक समाधान का परिचय दिया गया है जो इस समस्या को जड़ से खत्म करने का वादा करता है।

कॉन्टेक्स्ट मोड की कार्यप्रणाली और डेटा वर्चुअलाइजेशन

इस खंड में तकनीक के पीछे के गणित और कार्यप्रणाली को विस्तार से समझाया गया है। वक्ता बताते हैं कि कैसे Playwright स्नैपशॉट या GitHub इश्यूज़ जैसे भारी डेटा विंडो का 70% हिस्सा तुरंत भर सकते हैं। कॉन्टेक्स्ट मोड एक वर्चुअलाइजेशन लेयर की तरह काम करता है जो डेटा को सीधे भेजने के बजाय SQLite FTS5 का उपयोग करके इंडेक्स करता है। उदाहरण के तौर पर, 56kb का डेटा घटकर मात्र 299 बाइट्स रह जाता है, जो कि 99% की अविश्वसनीय कमी है। यह प्रक्रिया AI को बिना विंडो भरे विशाल जानकारी तक पहुँचने की अनुमति देती है।

सेशन की निरंतरता और चेकपॉइंट्स

यहाँ ध्यान टोकन बचाने से हटकर सेशन की गुणवत्ता और निरंतरता बनाए रखने पर दिया गया है। कॉन्टेक्स्ट मोड हर फाइल एडिट और गिट ऑपरेशन पर नज़र रखने के लिए विशेष 'हुक्स' का उपयोग करता है। जब बातचीत बहुत लंबी हो जाती है, तो यह एक छोटा 'प्रायोरिटी टियर्ड स्नैपशॉट' बनाता है जो एक सेव गेम पॉइंट की तरह काम करता है। इससे AI पिछली विफलताओं को याद रखता है और उन्हें दोबारा दोहराने की गलती नहीं करता है। इसके परिणामस्वरूप, एक कोडिंग सेशन की प्रभावी अवधि 30 मिनट से बढ़कर 3 घंटे तक हो सकती है।

इंस्टॉलेशन प्रक्रिया और सेटअप गाइड

वक्ता इस भाग में कॉन्टेक्स्ट मोड को विभिन्न वातावरणों में सेट करने का तरीका बताते हैं। Claude Code उपयोगकर्ताओं के लिए, इसे मार्केटप्लेस कमांड और प्लगइन इंस्टॉल कमांड के माध्यम से जोड़ना बहुत सरल है। यह टूल खुद ही MCP सर्वर, हुक्स और राउटिंग निर्देशों के प्रबंधन का काम संभाल लेता है। यदि आप Gemini CLI या VS Code Copilot का उपयोग कर रहे हैं, तो इसे npm के माध्यम से इंस्टॉल किया जा सकता है। यह लचीलापन इसे अलग-अलग डेवलपर्स के लिए एक सुलभ और अनिवार्य टूल बनाता है।

लाइव डेमो: लॉग फाइल इंडेक्सिंग और सांख्यिकी

एक व्यावहारिक प्रदर्शन के माध्यम से दिखाया गया है कि यह टूल वास्तविक समय में कैसे काम करता है। एक डमी एक्सेस लॉग फाइल बनाई जाती है जिसमें 5,000 लाइनें होती हैं, जिन्हें कॉन्टेक्स्ट मोड तुरंत इंडेक्स कर देता है। Claude को पूरी फाइल पढ़ने के बजाय केवल इंडेक्स डेटाबेस को सर्च करने की अनुमति मिलती है, जिससे वह सटीक परिणाम देता है। सांख्यिकी जाँच (stats check) से पता चलता है कि एक छोटे से टेस्ट में ही 1,200 टोकन और 25% डेटा की बचत हुई है। यह डेमो सिद्ध करता है कि बड़े प्रोजेक्ट्स में यह बचत लाखों टोकन तक पहुँच सकती है।

निष्कर्ष: लागत बचत और बेहतर तर्क क्षमता

अंतिम खंड में इस टूल के व्यापक लाभों पर चर्चा की गई है, जहाँ लक्ष्य केवल पैसा बचाना नहीं बल्कि AI की बुद्धिमत्ता को बनाए रखना है। वक्ता स्पष्ट करते हैं कि कॉन्टेक्स्ट विंडो से अनावश्यक 'शोर' हटाकर आप Claude को वास्तविक तर्क करने के लिए अधिक जगह देते हैं। यह बड़े पैमाने के प्रोडक्शन लॉग्स और विशाल कोड रिपॉजिटरी पर काम करने वाले इंजीनियरों के लिए अत्यंत लाभदायक है। वीडियो का अंत दर्शकों को इस टूल को आज़माने और बेहतर कोडिंग अनुभव के लिए चैनल को सब्सक्राइब करने के सुझाव के साथ होता है। एंडरिस इस तकनीकी विश्लेषण को एक सकारात्मक और उत्साहजनक टिप्पणी के साथ समाप्त करते हैं।

Community Posts

No posts yet. Be the first to write about this video!

Write about this video