00:00:00अगर आप Claude code में कोडिंग कर रहे हैं, तो आपने शायद कॉन्टेक्स्ट ब्लोट (context bloat) का अनुभव किया होगा।
00:00:05समस्या यह है कि Claude code में हर MCP टूल कॉल बहुत महंगा पड़ता है क्योंकि
00:00:11इनमें से हर एक कॉल अपना पूरा आउटपुट सीधे मॉडल के 200k कॉन्टेक्स्ट विंडो में डाल देता है।
00:00:17और आपके पास जितने ज़्यादा टूल होंगे, आपका कॉन्टेक्स्ट उतनी ही तेज़ी से खत्म होगा। कुछ खास स्थितियों में,
00:00:22सक्रिय एजेंट उपयोग के केवल 30 मिनट के भीतर ही आपका कॉन्टेक्स्ट भर जाता है।
00:00:28और तभी AI फाइलों, कामों और ज़रूरी फैसलों को भूलने लगता है। इसके अलावा,
00:00:34आप उन टोकन्स पर काफी पैसा भी खर्च कर रहे होते हैं। लेकिन एक ऐसा MCP सर्वर है जो इस समस्या को हल करता है।
00:00:40इसका नाम 'कॉन्टेक्स्ट मोड' (context mode) है। आज के वीडियो में, हम देखेंगे कि कॉन्टेक्स्ट मोड क्या करता है,
00:00:44यह कैसे काम करता है, और एक छोटे से डेमो के साथ खुद इसका परीक्षण करेंगे।
00:00:48इसमें बहुत मज़ा आने वाला है, तो चलिए शुरू करते हैं।
00:00:55ऐसा क्यों होता है यह समझने के लिए, आइए गणित पर गौर करें। एक वेब पेज का सिंगल Playwright स्नैपशॉट
00:01:00लगभग 56 किलोबाइट का होता है। 20 GitHub इश्यूज़ को पढ़ना 59 किलोबाइट का है। अगर हम
00:01:08प्लानिंग फेज़ के दौरान ये काम कई बार करते हैं, तो एजेंट के एक लाइन कोड लिखने से पहले ही आपकी 70% विंडो भर चुकी होती है।
00:01:14कॉन्टेक्स्ट मोड एक वर्चुअलाइजेशन लेयर (virtualization layer) की तरह काम करता है।
00:01:20AI सीधे आपके OS से बात करने के बजाय, एक सैंडबॉक्स से बात करता है। और भारी-भरकम आउटपुट देने के बजाय,
00:01:26कॉन्टेक्स्ट मोड उन्हें FTS5, यानी फुल टेक्स्ट सर्च का उपयोग करके एक लोकल SQLite डेटाबेस में इंडेक्स करता है।
00:01:34और इसका परिणाम काफी बड़ा है। उदाहरण के लिए, वह 56k का Playwright स्नैपशॉट घटकर केवल 299
00:01:41बाइट्स रह जाता है, जो कि 99% की कमी है। या फिर, यह एनालिटिक्स CSV फाइल घटकर 222 बाइट्स
00:01:49हो जाती है, जो लगभग 100% की कमी है। लेकिन टोकन बचाना तो समाधान का सिर्फ एक हिस्सा है।
00:01:56असली फायदा सेशन की निरंतरता (session continuity) में है। हम सबने देखा है कि कैसे एजेंट का इतिहास कंपैक्ट होता है
00:02:03और अचानक वह उस कोड को भूल जाता है जो उसने 10 मिनट पहले लिखा था। लेकिन कॉन्टेक्स्ट मोड हर फाइल एडिट,
00:02:09गिट ऑपरेशन और सब-एजेंट टास्क पर नज़र रखने के लिए हुक्स (hooks) का उपयोग करता है। जब आपकी बातचीत कंपैक्ट होती है,
00:02:15तो कॉन्टेक्स्ट मोड एक प्रायोरिटी टियर्ड स्नैपशॉट बनाता है, जो आमतौर पर 2 किलोबाइट से कम होता है, और उसे वापस जोड़ देता है।
00:02:22यह आपके कोडिंग सेशन के लिए एक 'सेव चेकपॉइंट' की तरह है। तो आप सैद्धांतिक रूप से अपने सेशन के समय को
00:02:2730 मिनट से बढ़ाकर लगभग 3 घंटे तक कर सकते हैं। यह फैसलों और गलतियों को भी ट्रैक करता है।
00:02:34मिसाल के तौर पर, अगर AI ने 20 मिनट पहले कोई सुधार आज़माया जो विफल रहा, तो कॉन्टेक्स्ट रीसेट होने के बाद भी वह उसे नहीं दोहराएगा।
00:02:40इसे इंस्टॉल करना बहुत आसान है। अगर आप Claude code पर हैं, तो पहले इस कमांड को चलाकर
00:02:46कॉन्टेक्स्ट मोड मार्केटप्लेस जोड़ें। और फिर प्लगइन इंस्टॉल कमांड चलाएँ। एक बार यह हो जाने पर,
00:02:53आप काम शुरू कर सकते हैं। इंस्टॉल होने के बाद, यह MCP सर्वर, हुक्स और
00:02:57राउटिंग निर्देशों को खुद ही संभाल लेता है। अगर आप Gemini CLI या VS Code Copilot का उपयोग कर रहे हैं,
00:03:03तो आप 'npm install context mode' चला सकते हैं और अपनी सेटिंग्स में कॉन्फ़िगरेशन जोड़ सकते हैं। अब चलिए इसे काम करते हुए देखते हैं।
00:03:10मेरे पास यहाँ एक साधारण पायथन कमांड है जो एक डमी एक्सेस लॉग फाइल बनाएगी जिसमें
00:03:15डमी API रिक्वेस्ट और उनके स्टेटस कोड की एक लंबी लिस्ट होगी। और हर सौवीं लाइन एक 500 एरर लॉग है।
00:03:22अब हम Claude शुरू कर सकते हैं और पूछ सकते हैं, “हे, access.log को इंडेक्स करने के लिए कॉन्टेक्स्ट मोड का उपयोग करो।
00:03:30मैं सभी 500 एरर पैटर्न्स को खोजना और उनसे जुड़े IP एड्रेस का सारांश चाहता हूँ।” और
00:03:36बैकग्राउंड में, कॉन्टेक्स्ट मोड access.log फाइल की 5,000 लाइनों को अपने SQLite
00:03:44FTS5 डेटाबेस में बाँट देता है। और Claude को केवल फाइल इंडेक्स होने की पुष्टि मिलती है, न कि पूरी 5,000 लाइनें।
00:03:51अब Claude पूरी फाइल को पार्स करने के बजाय कंटेंट के बारे में जानकारी लेने के लिए इंडेक्स डेटाबेस को समझदारी से सर्च कर सकता है।
00:03:57यहाँ हम Claude द्वारा मिले परिणाम देख सकते हैं। लेकिन इससे भी ज़रूरी बात यह है कि,
00:04:02आइए लागत की बचत देखें। हम 'context-mode --cts-stats' चलाकर ऐसा कर सकते हैं, और
00:04:09देख सकते हैं कि इस सेशन में कॉन्टेक्स्ट मोड ने कितना डेटा बचाया है। आप नतीजे
00:04:15यहीं देख सकते हैं। पूरी 20 किलोबाइट डेटा को बातचीत में डालने के बजाय, कॉन्टेक्स्ट मोड ने
00:04:21उस रॉ डेटा का लगभग 5 किलोबाइट सैंडबॉक्स में रखा। एक छोटी फाइल के लिए यह परिणाम काफी प्रभावशाली है।
00:04:27इसने लगभग 1,200 टोकन को कॉन्टेक्स्ट विंडो में जाने से रोक दिया। कुल मिलाकर, इस छोटे से टेस्ट में
00:04:34हमें 25% की अच्छी कमी मिली है। यह शायद सुनने में बहुत ज़्यादा न लगे, लेकिन याद रखें कि
00:04:41एक सामान्य Claude सेशन में, यह डेटा बस वहीं पड़ा रहता और आपके हर नए मैसेज के साथ बार-बार भेजा जाता।
00:04:47इसे सैंडबॉक्स में रखकर, हमने पहले ही इस सेशन की अवधि बढ़ानी शुरू कर दी है।
00:04:53यह डेमो फाइल काफी छोटी है, लेकिन अगर आप बड़ी फाइलों के साथ काम करते हैं,
00:04:58तो बचत बहुत बड़ी हो सकती है। अगर आप किसी विशाल रेपो रिसर्च प्रोजेक्ट पर काम कर रहे हैं या
00:05:03बड़े पैमाने के प्रोडक्शन लॉग्स का विश्लेषण कर रहे हैं, तो वह 1,200 टोकन की बचत आसानी से 1,00,000 टोकन में बदल सकती है।
00:05:11लेकिन लक्ष्य यहाँ सिर्फ API लागत पर पैसा बचाना नहीं है, हालाँकि वह एक अच्छा बोनस है।
00:05:18यह मॉडल की समझदारी (intelligence) को बनाए रखने के बारे में भी है। जब आप कॉन्टेक्स्ट विंडो से शोर को साफ़ कर देते हैं,
00:05:24तो आप वास्तविक तर्क (reasoning) के लिए अधिक जगह छोड़ रहे होते हैं। आप Claude को एक बेहतर इंजीनियर बनने के लिए ज़रूरी स्पेस दे रहे हैं।
00:05:30तो अगर आप AI एजेंट के साथ जटिल प्रोजेक्ट्स बना रहे हैं, तो इस टूल को आज़माएँ और देखें कि
00:05:35एजेंट के चीजें भूलने और कंपैक्ट होने से पहले आप अपने सेशन को कितना लंबा खींच सकते हैं।
00:05:41अगर आपको यह तकनीकी विश्लेषण पसंद आया, तो कृपया वीडियो के नीचे लाइक बटन दबाकर मुझे बताएं।
00:05:45और हमारे चैनल को सब्सक्राइब करना न भूलें। मैं Better Stack से एंडरिस हूँ,
00:05:50और मैं आपसे अगले वीडियो में मिलूँगा।