Claude Code की लिमिट की समस्या आखिरकार हल हो गई

AAI LABS
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Claude code पिछले कुछ समय से उतना अच्छा नहीं रहा है।
00:00:02हमारी टीम इसे हर दिन इस्तेमाल करती है और पिछले कुछ हफ़्तों से हम लिमिट्स से
00:00:06उम्मीद से कहीं ज़्यादा जल्दी बाहर हो रहे हैं।
00:00:071 मिलियन टोकन वाला कॉन्टेक्स्ट विंडो चीज़ों को बेहतर बनाने के लिए था, लेकिन इसने वास्तव में
00:00:12इसे और खराब कर दिया है।
00:00:13यही कारण है कि हमने उन ऑप्टिमाइज़ेशन पर रिसर्च की जिन्हें हम Claude code को लंबे समय तक चलाने के लिए ढूंढ सकते थे।
00:00:18इससे पहले कि हम इस पर आगे बढ़ें कि हम वास्तव में लिमिट्स का अधिकतम लाभ कैसे उठा सकते हैं, आइए पहले
00:00:22चर्चा करें कि Claude का प्लान और लिमिट्स सिस्टम वास्तव में कैसे काम करता है।
00:00:26यह सेक्शन सिर्फ उन लोगों को समझाने के लिए है जो इस बात से परिचित नहीं हैं कि लिमिट्स वास्तव में
00:00:30कैसे काम करती हैं।
00:00:31Claude के 2 पेड प्लान हैं जिनमें pro और max प्लान शामिल हैं।
00:00:34Max सबसे महंगा है और pro एक सस्ता प्लान है जो सिर्फ $20 मासिक है।
00:00:38दोनों प्लान्स में उन विभिन्न फीचर्स तक पहुँच है जो फ्री प्लान में उपलब्ध नहीं थे, जिनमें
00:00:43Claude code, co-work और अन्य शामिल हैं।
00:00:45लेकिन वे सभी एक ही नियम का पालन करते हैं।
00:00:46चाहे कोई भी प्लान हो, हर एक आपको मैसेज की एक सीमित संख्या देता है जिसे आप 5 घंटे की
00:00:51विंडो के भीतर भेज सकते हैं और एक बार जब वह विंडो समाप्त हो जाती है, तो आपका मैसेज काउंट रीसेट हो जाता है।
00:00:55आपको मिलने वाले मैसेज की संख्या प्लान के अनुसार अलग-अलग होती है।
00:00:575 घंटे की विंडो तब शुरू होती है जब आप अपना पहला मैसेज भेजते हैं, चाहे वह Claude डेस्कटॉप पर हो,
00:01:01वेब पर हो या किसी भी Claude इंटरफ़ेस पर।
00:01:03विंडो शुरू होने के बाद, आपके द्वारा भेजा गया प्रत्येक मैसेज आपके प्लान की निर्धारित सीमा के विरुद्ध गिना जाता है।
00:01:08अब आप उम्मीद कर सकते हैं कि विंडो केवल तभी गिनी जाएगी जब आप सक्रिय रूप से इसका उपयोग कर रहे हों।
00:01:11लेकिन भले ही आप बीच में खाली बैठें और फिर 5वें घंटे में इसका भारी उपयोग करें, फिर भी विंडो
00:01:15चल रही होती है और आपकी लिमिट रीसेट होने से पहले आपको पूरे 5 घंटे बीतने तक
00:01:20इंतज़ार करना होगा।
00:01:215 घंटे की विंडो आपके डिवाइस पर भी निर्भर नहीं है।
00:01:23इसलिए यदि आप एक ही अकाउंट के साथ एक से अधिक डिवाइस का उपयोग कर रहे हैं, तो सभी उपयोग
00:01:27उसी सीमा के भीतर गिने जाएंगे।
00:01:28अब pro प्लान के लिए, आपको प्रति 5 घंटे की विंडो में लगभग 45 मैसेज मिलते हैं।
00:01:32Max प्लान आपको 225 देता है और max 20 times प्लान, जो कि 100 डॉलर वाले
00:01:37प्लान से ज़्यादा महंगा है, आपको उसी विंडो में 900 मैसेज देता है।
00:01:41ये संख्याएँ आपके द्वारा उपयोग किए जाने वाले मॉडल के आधार पर भिन्न हो सकती हैं क्योंकि आपको Sonnet के साथ अधिक
00:01:46और Opus के साथ कम मैसेज मिलते हैं।
00:01:47अब आपको लग सकता है कि मैसेज की यह संख्या आपके उपयोग के लिए पर्याप्त से अधिक है।
00:01:51लेकिन यह सिर्फ एक अनुमानित संख्या है और अन्य कारक भी हैं जो इसे प्रभावित करते हैं।
00:01:54पहला वह मॉडल है जिसका आप उपयोग कर रहे हैं।
00:01:56Opus मॉडल उसी अनुरोध के लिए Sonnet की तुलना में लगभग 3 गुना अधिक टोकन की खपत करते हैं क्योंकि वे
00:02:01कहीं अधिक शक्तिशाली और कंप्यूट इंटेंसिव हैं।
00:02:03इसलिए यदि आप हर समय Opus का उपयोग कर रहे हैं, तो आपको अपनी 5 घंटे की विंडो में 45 मैसेज नहीं मिलेंगे
00:02:08और आपकी लिमिट बहुत तेज़ी से खत्म हो जाएगी।
00:02:10Pro प्लान की कुल लिमिट कम है।
00:02:12जहाँ तक max प्लान की बात है, जबकि एक अकेला व्यक्ति इसे संभाल सकता है, max आमतौर पर संगठनों द्वारा
00:02:16खरीदा जाता है और टीम के सदस्यों के बीच वितरित किया जाता है, इसलिए यह कई लोगों के
00:02:20साथ टिक नहीं पाएगा।
00:02:21हम AI labs में भी यही करते हैं, हमने एक max प्लान खरीदा है और उसे अपनी टीम में बाँट दिया है।
00:02:26इसके बावजूद, हमारी लिमिट अक्सर खत्म हो जाती है जिससे हमें इसे लंबे समय तक चलाने के
00:02:30तरीकों पर शोध करने के लिए मजबूर होना पड़ा।
00:02:31दूसरा कारक आपके द्वारा किए जा रहे कार्य का प्रकार है।
00:02:34कंप्यूट इंटेंसिव टास्क या ऐसे टास्क जिनमें कई टूल्स की आवश्यकता होती है, बहुत सारे टोकन की खपत करते हैं।
00:02:38इसलिए विंडो सामान्य से बहुत तेज़ी से खत्म हो जाएगी और हो सकता है कि आप pro प्लान पर 45
00:02:43मैसेज तक भी न पहुँच सकें।
00:02:44और इन सबके अलावा, Anthropic ने हाल ही में पीक वर्किंग घंटों के दौरान सेशन लिमिट को तेज़ी से कम कर दिया है,
00:02:48जब कई लोग एक साथ सेवा का भारी उपयोग कर रहे होते हैं।
00:02:52इसलिए आपका Claude प्लान आपके द्वारा कोई वास्तविक काम पूरा करने से पहले ही और तेज़ी से खत्म हो जाएगा।
00:02:56यही कारण है कि अपनी विंडो का अधिकतम लाभ उठाने और
00:03:00पूरे दिन प्रभावी ढंग से Claude का उपयोग करने के तरीके सीखने का यह सही समय है।
00:03:02लेकिन आगे बढ़ने से पहले, आइए हमारे प्रायोजक, Twin के बारे में कुछ शब्द सुनें।
00:03:05यदि आपने Zapier या N8N जैसे टूल के साथ ऑटोमेशन की कोशिश की है, तो आप जानते हैं कि क्या होता है।
00:03:09कठोर वर्कफ़्लो, लगातार खराबी और ऐप्स को जोड़ने में बर्बाद हुए घंटों।
00:03:13और Claudebot जैसे स्थानीय एजेंट सुरक्षा के लिए खतरा हैं और बहुत महंगे हैं।
00:03:17Twin उसे बदल देता है।
00:03:18यह एक नो-कोड AI एजेंट है जो आपके सोते समय वास्तव में आपके लिए काम करता है।
00:03:21यह टूल्स से API के माध्यम से जुड़ता है जब वे मौजूद होते हैं और जब नहीं होते हैं, तो यह तुरंत
00:03:26इंटीग्रेशन बनाता है, जिससे आपको एक अनंत इंटीग्रेशन लाइब्रेरी मिलती है।
00:03:29और अगर कोई API नहीं है, तो Twin बस एक इंसान की तरह ब्राउज़ और बातचीत कर सकता है।
00:03:33इसके अलावा, आपको Perplexity, Gamma, VO3 और Nanobanana जैसे टूल्स तक इन-बिल्ट पहुँच मिलती है।
00:03:38उन्होंने अभी-अभी Twin API लॉन्च किया है।
00:03:40तो आप कहीं से भी एजेंटों को ट्रिगर कर सकते हैं और उन्हें अपने मौजूदा वर्कफ़्लो में प्लग कर सकते हैं।
00:03:44और सबसे अच्छी बात?
00:03:45ये एजेंट सीखते हैं।
00:03:46वे कुछ टूटने पर खुद को ठीक करते हैं, समय के साथ सुधार करते हैं और 24/7 चलते हैं।
00:03:50टूटे हुए ऑटोमेशन की देखभाल करना बंद करें।
00:03:52पिंड कमेंट में दिए गए लिंक पर क्लिक करें और Twin को देखें।
00:03:55अब आप पहले से ही जानते होंगे कि Claude code का सोर्स कोड लीक हो गया था।
00:03:58और बहुत से लोगों ने पहचाना कि इसके अंदर कई समस्याएँ हैं जो लिमिट्स को
00:04:02इरादे से तेज़ी से खत्म कर सकती हैं।
00:04:04इनमें से एक कॉन्टेक्स्ट में रहने वाले ट्रंकेटेड (अधूरे) जवाब हैं।
00:04:07इसलिए यदि आपको रेट लिमिट पूरी होने जैसा कोई एरर मैसेज मिलता है, तो यह एक अधूरा
00:04:12जवाब बना सकता है।
00:04:13और उसके संबंध में, यह पिछले कॉन्टेक्स्ट और उस अधूरे
00:04:17एरर से भरे मैसेज को साथ रखते हुए फिर से कोशिश करता है।
00:04:18यह अनावश्यक जानकारी के साथ कॉन्टेक्स्ट को बढ़ा देता है और टोकन बर्बाद करता है।
00:04:22स्किल लिस्टिंग भी मुख्य रूप से तेज़ पहुँच के लिए डाली जाती है, भले ही वे
00:04:27ज़्यादा मूल्य प्रदान नहीं करती हैं क्योंकि स्किल टूल के माध्यम से तेज़ हैंडलिंग पहले से ही मौजूद है।
00:04:31इसी तरह की कुछ अन्य समस्याएँ भी हैं।
00:04:33इन सब की वजह से बहुत से लोग Claude लिमिट्स के उम्मीद से जल्दी खत्म होने की शिकायत कर रहे हैं।
00:04:38तो आधिकारिक सीमाओं और इन छिपे हुए टोकन ड्रेन्स दोनों का मुकाबला करने के लिए, आपको
00:04:43अपने प्रोडक्ट बनाते समय Claude code को लंबे समय तक चलाने के लिए कुछ उपाय करने होंगे।
00:04:47हम इस चैनल पर AI के साथ प्रोडक्ट बनाने के बारे में जो कुछ भी पाते हैं उसे साझा करते हैं।
00:04:51तो अगर आप इस पर और वीडियो चाहते हैं, तो सब्सक्राइब करें और भविष्य के वीडियो पर नज़र रखें।
00:04:55हम उन सुझावों से शुरू करेंगे जो आपने शायद हमसे पहले ही सुन लिए होंगे यदि आपने हमारे पिछले
00:04:59वीडियो देखे हैं।
00:05:00पहला clear कमांड है।
00:05:01इसका उपयोग तब करें जब आपने कोई कार्य पूरा कर लिया हो और आपको अब पिछले कॉन्टेक्स्ट की आवश्यकता न हो।
00:05:05उदाहरण के लिए, जब आप ऐप को लागू करना समाप्त कर लेते हैं और टेस्टिंग फेज में जाना चाहते हैं,
00:05:09तो आपको पहले के कॉन्टेक्स्ट की आवश्यकता नहीं होती है।
00:05:11इसलिए इसे रीसेट करना और ताज़ा कॉन्टेक्स्ट विंडो के साथ अगला कार्य शुरू करना बेहतर है।
00:05:15लेकिन कभी-कभी आप उस कॉन्टेक्स्ट के कुछ हिस्से को बनाए रखना चाहते हैं।
00:05:18उस स्थिति में, आप इसके बजाय compact कमांड चला सकते हैं।
00:05:21यह पूरी बातचीत का सारांश बनाता है और कॉन्टेक्स्ट में सारांश के साथ जगह खाली करता है।
00:05:25कारण यह है कि हम चाहते हैं कि आप इनका उपयोग करें क्योंकि हर बार जब Claude कोई मैसेज भेजता है, तो इसमें
00:05:29अब तक की पूरी बातचीत, सिस्टम प्रॉम्प्ट, आपके टूल्स और पिछली सभी
00:05:34बातचीत का इतिहास शामिल होता है।
00:05:35हर नए मैसेज के साथ, यह बढ़ता रहता है, जिसके परिणामस्वरूप कॉन्टेक्स्ट विंडो भारी हो जाती है और
00:05:40प्रति मैसेज टोकन का उपयोग अधिक होता है।
00:05:41अब कॉम्पैक्ट करने के बाद भी, यदि आप मुख्य विंडो में साइड सवाल पूछते हैं, तो आप अभी भी इसे
00:05:46असंबंधित सामग्री के साथ भारी कर रहे हैं।
00:05:47तो आप एक त्वरित साइड सवाल पूछने के लिए by the way कमांड का उपयोग कर सकते हैं।
00:05:50यह एक अलग सेशन कॉन्टेक्स्ट विंडो में जवाब देता है।
00:05:53यह साइड सवाल आपके द्वारा भेजे जाने वाले अगले मैसेज के साथ नहीं जाएगा, जिससे प्रति
00:05:57अनुरोध कम टोकन खर्च होंगे।
00:05:58अब भले ही प्लानिंग एक टोकन इंटेंसिव टास्क लग सकता है, आपको अपने
00:06:02प्रोजेक्ट्स की शुरुआत इसी से करनी चाहिए।
00:06:03ऐसा इसलिए है क्योंकि यदि आप प्लानिंग में समय नहीं बिताते हैं, तो आपको बाद में Claude को सही करना होगा
00:06:07जब इसका इम्प्लीमेंटेशन आपकी ज़रूरत के अनुरूप नहीं होगा।
00:06:10प्लानिंग पर शुरुआत में टोकन खर्च करना आपको भविष्य में सुधारों पर
00:06:14कहीं अधिक टोकन बर्बाद करने से बचाता है।
00:06:15कभी-कभी Claude आपके निर्देशों का पालन उस तरह से नहीं करता जैसा आप चाहते हैं।
00:06:18उन समयों में, हम अक्सर इसे इम्प्लीमेंटेशन के सही तरीके के साथ फिर से प्रॉम्प्ट करते हैं।
00:06:22लेकिन फिर से प्रॉम्प्ट करने के बजाय, आप बातचीत और कोड को उस मैसेज से पहले के
00:06:26पॉइंट पर वापस ले जाने के लिए rewind कमांड चला सकते हैं जहाँ Claude ने गलती की थी और प्रॉम्प्ट में
00:06:31सीधे बदलाव कर सकते हैं।
00:06:32आप ऐसा करने के लिए एस्केप की (escape key) को दो बार भी दबा सकते हैं।
00:06:35यह कॉन्टेक्स्ट विंडो से गलत इम्प्लीमेंटेशन को हटा देता है और गलत आउटपुट
00:06:39मॉडल को नहीं भेजे जाते हैं।
00:06:41अब ये सभी कमांड आपको एक सेशन के दौरान टोकन बचाने में मदद करते हैं।
00:06:44लेकिन बड़ा प्रभाव इस बात से पड़ता है कि आपका प्रोजेक्ट शुरू में कैसे संरचित है।
00:06:47आपने शायद Beemad, SpecKit जैसे विभिन्न फ्रेमवर्क का उपयोग करके
00:06:52अपने प्रोजेक्ट्स को पहले ही स्ट्रक्चर किया होगा।
00:06:53लेकिन इनमें से अधिकांश फ्रेमवर्क वास्तव में टोकन इंटेंसिव हैं।
00:06:56इसलिए यदि आप उन्हें अपने ऐप में उपयोग करते हैं, तो उम्मीद करें कि आपकी टोकन सीमा तेज़ी से पूरी हो जाएगी।
00:07:00जबकि ये फ्रेमवर्क max प्लान पर टिक सकते हैं, वे pro पर निश्चित रूप से नहीं टिकेंगे।
00:07:04अब भले ही आप फ्रेमवर्क का उपयोग नहीं कर रहे हों, आपने अपना खुद का सेटअप किया होगा।
00:07:07Claude.md फ़ाइल बनाने के लिए आपने init कमांड का उपयोग किया होगा जो आपके कोडबेस को स्कैन करता है
00:07:12और आपके लिए एक Claude.md फ़ाइल बनाता है।
00:07:14यह एक फ़ाइल बनाता तो है, लेकिन इसमें बहुत सारी समस्याएँ होती हैं।
00:07:17यह फ़ाइल AI एजेंट को मार्गदर्शन प्रदान करने के लिए होती है, लेकिन यह कुछ ऐसी चीज़ों को सूचीबद्ध करती है
00:07:20जो AI पहले से ही अपने आप जानता है।
00:07:22उदाहरण के लिए, यह जो कमांड दिखाता है वे हर देव सर्वर को चलाने के लिए उपयोग किए जाते हैं और Claude पहले से ही
00:07:27जानता है कि इसे कैसे करना है।
00:07:28जब तक आपके पास सर्वर चलाने के लिए कोई अलग रनिंग फ्लैग न हो, उन्हें
00:07:31जोड़ने की कोई आवश्यकता नहीं है।
00:07:32आर्किटेक्चर की तरह, Claude फ़ाइल के नामों को पढ़ सकता है और नाम के आधार पर यह अनुमान लगा सकता है कि प्रत्येक फ़ाइल किस बारे में है
00:07:37क्योंकि वह फ़ाइल सिस्टम को समझता है और इसका उपयोग नेविगेट करने के लिए करता है।
00:07:41इसलिए इस तरह के निर्देशों की वास्तव में कोई आवश्यकता नहीं है जब तक कि ऐसे विशिष्ट मामले न हों
00:07:45जहाँ अतिरिक्त मार्गदर्शन की आवश्यकता हो।
00:07:47यदि आप अपना खुद का Claude.md लिखने जा रहे हैं, तो यह आदर्श रूप से 300 लाइनों से कम होना चाहिए।
00:07:52फ़ाइल जितनी छोटी होगी, यह उतना ही बेहतर प्रदर्शन करेगी और Claude वास्तव में
00:07:56महत्वपूर्ण चीज़ों पर उतना ही केंद्रित रहेगा।
00:07:57इसे एक गाइडिंग फ़ाइल के रूप में कार्य करना चाहिए, न कि सब कुछ करने का तरीका समझाने वाले विस्तृत मैनुअल के रूप में।
00:08:01आप जो कुछ भी शामिल करते हैं वह पूरे प्रोजेक्ट में सामान्य रूप से लागू होना चाहिए, न कि हर हिस्से का
00:08:05विशिष्ट विवरण जो एक ही फ़ाइल में भरा हुआ हो।
00:08:08इसमें वह सब शामिल करें जो Claude को नहीं करना चाहिए, आपके कोई भी डेवलपमेंट प्रैक्टिस और अन्य समान निर्देश
00:08:13जो Claude को डिफ़ॉल्ट रूप से पता नहीं हैं, केवल Claude.md में ही डालें।
00:08:16आपको इस फ़ाइल को ठीक से कॉन्फ़िगर करने की आवश्यकता है क्योंकि यह फ़ाइल हर सेशन में एक बार
00:08:20कॉन्टेक्स्ट में लोड होती है और वहीं रहती है।
00:08:22इसलिए कॉन्टेक्स्ट विंडो में अनावश्यक जानकारी का मतलब है कि आप हर बार उन टोकन को बर्बाद कर रहे हैं
00:08:27जिनकी शुरुआत में आवश्यकता भी नहीं थी।
00:08:28प्रोजेक्ट के विशिष्ट पहलुओं जैसे डेटाबेस, स्कीमा या अन्य क्षेत्रों के लिए जहाँ अलग-अलग नियमों
00:08:33की आवश्यकता होती है, उन्हें अलग दस्तावेज़ों में विभाजित करें और उन्हें Claude.md फ़ाइल में लिंक करें।
00:08:37यह Claude को केवल उन दस्तावेज़ों को धीरे-धीरे खींचने की अनुमति देता है जिनकी उसे वास्तव में आवश्यकता है।
00:08:41हमने अपने पिछले वीडियो में भी इसका उल्लेख किया था, प्रोजेक्ट रूल्स बनाना जो कुछ
00:08:45पाथ्स के लिए विशिष्ट हों, Claude को केंद्रित रहने में मदद करता है।
00:08:48इस तरह, Claude के पास कॉन्टेक्स्ट में केवल प्रासंगिक जानकारी होती है और अनावश्यक टोकन उपयोग से बचा जाता है।
00:08:53इसलिए आपको एरिया-विशिष्ट लॉजिक के लिए नियमों की फाइलों को भी अलग करना चाहिए ताकि Claude केवल
00:08:57वही लोड कर सके जिसकी आवश्यकता है।
00:08:58आपको बार-बार होने वाले वर्कफ़्लो के लिए स्किल्स का उपयोग करने की भी आवश्यकता है और स्क्रिप्ट और संदर्भ जोड़ने की ताकि
00:09:03यह कार्यों को अधिक सटीक रूप से कर सके।
00:09:05स्किल्स केवल आवश्यक भाग को धीरे-धीरे लोड करके मदद करते हैं और इससे Claude कार्य के
00:09:10प्रासंगिक पहलू पर केंद्रित रहता है।
00:09:12स्क्रिप्ट के साथ बंडलिंग उन नियतात्मक कार्यों पर टोकन बर्बाद न करने में मदद करती है जिन्हें
00:09:16प्रोग्रामेटिक रूप से संभाला जा सकता है।
00:09:17फाइलों को अलग करने का कारण सरल है।
00:09:19यदि Claude एक हिस्से पर काम कर रहा है, तो उसे असंबंधित क्षेत्रों के बारे में जानकारी की आवश्यकता नहीं है।
00:09:24लेकिन अगर सब कुछ एक ही Claude.md फ़ाइल में रखा जाता है, तो यह सब हर बार लोड होगा,
00:09:29जिससे अनावश्यक टोकन उपयोग होगा।
00:09:30आप सीधे सिस्टम प्रॉम्प्ट में विशिष्ट निर्देश जोड़ने के लिए append system prompt फ्लैग का भी उपयोग कर सकते हैं।
00:09:35सब कुछ Claude.md फ़ाइल में डालने के बजाय सेशन उन
00:09:36निर्देशों के साथ शुरू होता है।
00:09:40ये निर्देश अस्थायी हैं और सेशन समाप्त होने के बाद हटा दिए जाएंगे।
00:09:41अब यह ऐसा लग सकता है जैसे यह कॉन्टेक्स्ट को बढ़ा रहा है, लेकिन यह वास्तव में
00:09:44Claude.md में एक बार के निर्देश डालने से अधिक कुशल है।
00:09:48यदि आप इसे वहां जोड़ते हैं, तो Claude इसे स्थायी रूप से कॉन्टेक्स्ट में रखता है, जिससे टोकन अनावश्यक रूप से बर्बाद होते हैं।
00:09:51अपेंडिंग के साथ, आप निर्देश ठीक उसी समय प्रदान करते हैं जब आपको उनकी आवश्यकता होती है।
00:09:56साथ ही, यदि आप हमारी सामग्री का आनंद ले रहे हैं, तो हाइप बटन दबाने पर विचार करें क्योंकि यह हमें
00:09:59इस तरह की और सामग्री बनाने और अधिक लोगों तक पहुँचने में मदद करता है।
00:10:03आपको अपने द्वारा उपयोग किए जा रहे मॉडल का एफर्ट लेवल (प्रयास स्तर) भी सेट करने की आवश्यकता है।
00:10:06यदि आप किसी ऐसे कार्य पर काम नहीं कर रहे हैं जिसमें बहुत अधिक सोचने की आवश्यकता है, तो इसे low पर सेट करें क्योंकि low
00:10:10सेटिंग टोकन बचाती है।
00:10:14डिफ़ॉल्ट रूप से, यह effort auto पर सेट होता है जिसका अर्थ है कि मॉडल तय करता है कि कितना
00:10:15प्रयास करना है लेकिन आप इसे मैन्युअल रूप से बदल सकते हैं।
00:10:20यदि आपका कार्य बहुत जटिल नहीं है, तो हाई एफर्ट सेटिंग का उपयोग करने की कोई आवश्यकता नहीं है।
00:10:21अब जैसा कि हमने पहले बताया, Opus सबसे अधिक टोकन खपत करने वाला मॉडल है।
00:10:25इसलिए यदि आप सीधे कार्यों पर काम कर रहे हैं, तो Haiku पर स्विच करें।
00:10:28यदि आपके कार्य के लिए उचित स्तर की सोच की आवश्यकता है, तो Sonnet का उपयोग करें।
00:10:31यह Opus जितना शक्तिशाली नहीं हो सकता है, लेकिन यह अभी भी कुशल है और अधिक टोकन बचाता है।
00:10:34यदि आपने किसी प्रोजेक्ट के लिए कई MCPs कॉन्फ़िगर किए हैं और आपको किसी विशेष की आवश्यकता नहीं है, तो बस उसे डिसेबल
00:10:39कर दें ताकि यह कॉन्टेक्स्ट विंडो में अनावश्यक जानकारी डालकर टोकन बर्बाद न करे।
00:10:43एक और महत्वपूर्ण कदम ऐसे हुक्स बनाना है जो उस सामग्री को फ़िल्टर करते हैं जो Claude के
00:10:48कॉन्टेक्स्ट विंडो से संबंधित नहीं होनी चाहिए।
00:10:52उदाहरण के लिए, मैंने अपने प्रोजेक्ट के लिए टेस्ट केस कॉन्फ़िगर किए हैं।
00:10:54जब हम उन्हें चलाते हैं, तो वे पास और फेल दोनों टेस्ट की रिपोर्ट करते हैं और वह सब
00:10:57कॉन्टेक्स्ट में लोड हो जाता है।
00:11:01लेकिन Claude की मुख्य चिंता फेल हुए टेस्ट हैं क्योंकि वे ही हैं जिन्हें ठीक करने की आवश्यकता है।
00:11:02तो आप एक हुक बना सकते हैं जो पास हुए टेस्ट केस को कॉन्टेक्स्ट विंडो में प्रवेश करने से
00:11:05रोकने के लिए एक स्क्रिप्ट का उपयोग करता है और केवल फेल हुए टेस्ट ही शामिल किए जाते हैं।
00:11:10यह सभी टेस्ट रिपोर्ट डालने की तुलना में काफी टोकन बचाता है।
00:11:13आप टोकन उपयोग को अनुकूलित करने के लिए इसी तरह से कई अन्य कार्यों के लिए हुक्स कॉन्फ़िगर कर सकते हैं।
00:11:17अब इन सबके अलावा, प्रदर्शन को बेहतर बनाने के लिए आपको अपने .claud
00:11:21फ़ोल्डर में कुछ कॉन्फ़िगरेशन करने की आवश्यकता है।
00:11:25पहला disable prompt caching को false पर सेट करना है।
00:11:27यह Claude को आपके सबसे अधिक उपयोग किए जाने वाले प्रीफ़िक्स को कैश करने के लिए मजबूर करता है, जो टोकन उपयोग को कम करता है।
00:11:30Anthropic आपसे उन हिस्सों के लिए शुल्क नहीं लेता है जो बार-बार भेजे जाते हैं, आप केवल नई
00:11:34सामग्री के लिए भुगतान करते हैं।
00:11:38आप उसे अपने कॉन्टेक्स्ट में सामग्री जोड़ने और टोकन उपयोग बढ़ाने से रोकने के लिए auto memory को भी डिसेबल कर सकते हैं।
00:11:39Auto memory एक बैकग्राउंड प्रोसेस है जो आपकी बातचीत का विश्लेषण करती है और आपके विशिष्ट प्रोजेक्ट के लिए
00:11:43उपयोगी जानकारी को मेमोरी फाइलों में समेकित करती है।
00:11:44इसे डिसेबल करने का मतलब है कि यह आपकी आदतों को ट्रैक नहीं करेगा लेकिन यह बैकग्राउंड में न चलकर
00:11:49टोकन बचाएगा।
00:11:52एक और फ्लैग है जिसे disable background task कहा जाता है जो बैकग्राउंड प्रोसेस को लगातार
00:11:56टोकन की खपत करने से रोकता है।
00:11:57इनमें dream, memory refactoring and cleaning और background indexing शामिल हैं।
00:12:00इसे बंद करने से टोकन बचाने में मदद मिलती है क्योंकि भले ही आप सक्रिय रूप से चैट न कर रहे हों, ये
00:12:02प्रक्रियाएं अभी भी आपकी बातचीत पर काम कर रही होंगी।
00:12:06जब आवश्यकता न हो तो आपको thinking (सोचने) को भी डिसेबल कर देना चाहिए क्योंकि सोचना बहुत अधिक
00:12:10कॉन्टेक्स्ट की खपत करता है और उन कार्यों पर टोकन बर्बाद करता है जिन्हें इसकी आवश्यकता भी नहीं है।
00:12:13अब यह उस एफर्ट सेटिंग से अलग है जिसकी हमने पहले चर्चा की थी।
00:12:16एफर्ट सेटिंग यह नियंत्रित करती है कि Claude एक जवाब के भीतर कितनी रीजनिंग करता है, इसलिए लो एफर्ट का
00:12:20मतलब कम सोचना है, लेकिन वह फिर भी सोचता है।
00:12:23Thinking को पूरी तरह से डिसेबल करने से इंटरनल रीजनिंग स्टेप बंद हो जाता है और Claude बस
00:12:28सीधे जवाब देता है।
00:12:30इसलिए यदि आपके कार्य को गहरी रीजनिंग की आवश्यकता नहीं है, तो thinking को पूरी तरह से डिसेबल कर दें।
00:12:34यदि इसमें कुछ रीजनिंग की आवश्यकता है लेकिन बहुत ज़्यादा नहीं, तो इसके बजाय एफर्ट लेवल को कम कर दें।
00:12:35अंत में max output tokens को एक निर्धारित संख्या पर कॉन्फ़िगर करें।
00:12:39कोई डिफ़ॉल्ट नहीं है, लेकिन इसे सीमित करने से यह नियंत्रित होता है कि मॉडल कितना जेनरेट करता है।
00:12:43यदि आप आक्रामक रूप से टोकन बचाना चाहते हैं तो इसे कम सेट करें या यदि आपके कार्य के लिए लंबे
00:12:46आउटपुट की आवश्यकता है तो इसे बढ़ाएँ।
00:12:50अब इस वीडियो और हमारे सभी पिछले वीडियो के लिए Claude.md टेम्पलेट और अन्य संसाधन AI Labs Pro में उपलब्ध हैं
00:12:55जहाँ से आप इसे डाउनलोड कर सकते हैं और अपने स्वयं के प्रोजेक्ट्स के लिए उपयोग कर सकते हैं।
00:12:56यदि आपको हमारे काम में मूल्य मिला है और आप चैनल का समर्थन करना चाहते हैं, तो यह
00:13:00इसे करने का सबसे अच्छा तरीका है।
00:13:05लिंक डिस्क्रिप्शन में है।
00:13:09यह हमें इस वीडियो के अंत में लाता है।
00:13:10यदि आप चैनल का समर्थन करना चाहते हैं और इस तरह के वीडियो बनाने में हमारी मदद करना चाहते हैं, तो आप
00:13:11नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके ऐसा कर सकते हैं।
00:13:13हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।
00:13:17इसलिए नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके।
00:13:19हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।

Key Takeaway

Claude Code की उपयोग सीमा को अधिकतम करने के लिए कॉन्टेक्स्ट का सक्रिय प्रबंधन करना, 300 लाइनों से छोटी गाइडिंग फाइलों का उपयोग करना और अनावश्यक बैकग्राउंड टास्क जैसे auto memory को डिसेबल करना आवश्यक है।

Highlights

Claude Pro प्लान 5 घंटे की अवधि में लगभग 45 संदेशों की अनुमति देता है, जबकि Max प्लान 225 और Max 20x प्लान 900 संदेश देता है।

Opus मॉडल Sonnet की तुलना में लगभग 3 गुना अधिक टोकन की खपत करता है, जिससे संदेश सीमा बहुत तेज़ी से समाप्त हो जाती है।

init कमांड द्वारा बनाई गई Claude.md फाइल को AI द्वारा पहले से ज्ञात जानकारी हटाकर 300 लाइनों से कम रखना टोकन दक्षता बढ़ाता है।

rewind कमांड या एस्केप की (escape key) को दो बार दबाने से गलत कोड इम्प्लीमेंटेशन कॉन्टेक्स्ट से हट जाता है, जिससे भविष्य के टोकन बचते हैं।

disable prompt caching को false पर सेट करने से Anthropic बार-बार उपयोग किए जाने वाले प्रीफ़िक्स को कैश करता है, जिससे नए संदेशों की लागत कम होती है।

हुक्स (hooks) का उपयोग करके केवल फेल हुए टेस्ट केस को कॉन्टेक्स्ट में लोड करना पास हुए टेस्ट के अनावश्यक टोकन खर्च को रोकता है।

Timeline

Claude के प्लान और मैसेज लिमिट का तंत्र

  • Claude के पेड प्लान 5 घंटे की गतिशील विंडो का उपयोग करते हैं जो पहले संदेश के साथ शुरू होती है।
  • उपयोगकर्ता के सक्रिय न होने पर भी यह 5 घंटे की विंडो चलती रहती है और समय पूरा होने पर ही रीसेट होती है।
  • एक ही अकाउंट से जुड़े सभी डिवाइस एक ही मैसेज लिमिट साझा करते हैं।

Claude Pro प्लान के लिए $20 मासिक शुल्क है, जबकि Max प्लान अधिक महंगा है और टीमों के लिए बनाया गया है। संदेशों की संख्या उपयोग किए गए मॉडल पर निर्भर करती है, जहाँ Sonnet अधिक लचीलापन प्रदान करता है। 1 मिलियन टोकन की बड़ी कॉन्टेक्स्ट विंडो कभी-कभी लिमिट को जल्दी खत्म करने का कारण बनती है।

टोकन ड्रेन के कारण और बाहरी प्रभाव

  • Opus जैसे शक्तिशाली मॉडल साधारण कार्यों के लिए भी अत्यधिक कंप्यूट संसाधनों और टोकन का उपयोग करते हैं।
  • Anthropic पीक वर्किंग घंटों के दौरान मांग बढ़ने पर सेशन लिमिट को सक्रिय रूप से कम कर देता है।
  • जटिल कार्यों और कई टूल्स के एक साथ उपयोग से टोकन कोटा तेजी से घटता है।

कंप्यूट इंटेंसिव टास्क प्रो प्लान की 45 संदेशों की सीमा को भी कम कर सकते हैं। AI Labs जैसी टीमें जो Max प्लान साझा करती हैं, वे भी भारी उपयोग के कारण अक्सर लिमिट से बाहर हो जाती हैं। पीक घंटों के दौरान यह समस्या और गंभीर हो जाती है, जिससे काम पूरा होने से पहले ही सेवा बाधित हो सकती है।

Claude Code के आंतरिक बग और टोकन बर्बादी

  • रेट लिमिट एरर आने पर Claude अधूरे जवाबों को कॉन्टेक्स्ट में रखकर दोबारा कोशिश करता है, जिससे अनावश्यक डेटा बढ़ता है।
  • स्किल लिस्टिंग की जानकारी कॉन्टेक्स्ट में बार-बार डाली जाती है जबकि सिस्टम पहले से ही टूल्स के माध्यम से इसे संभाल सकता है।
  • सोर्स कोड के विश्लेषण से पता चलता है कि सिस्टम में छिपे हुए टोकन ड्रेन मौजूद हैं जो इरादे से कोटा खत्म करते हैं।

लीक हुए सोर्स कोड से पता चला है कि ट्रंकेटेड जवाब पिछले कॉन्टेक्स्ट को भारी बना देते हैं। अनावश्यक स्किल लिस्टिंग तेज़ पहुँच के नाम पर टोकन बर्बाद करती है। इन समस्याओं के कारण आधिकारिक लिमिट उम्मीद से बहुत पहले ही समाप्त हो जाती है।

सेशन ऑप्टिमाइज़ेशन के लिए आवश्यक कमांड्स

  • clear कमांड कार्य पूरा होने के बाद पिछले पूरे कॉन्टेक्स्ट को हटाकर विंडो को ताज़ा करता है।
  • compact कमांड बातचीत का संक्षिप्त सारांश बनाकर जगह खाली करता है जबकि महत्वपूर्ण संदर्भ सुरक्षित रहता है।
  • by the way कमांड साइड सवालों को एक अलग सेशन में भेजता है ताकि वे मुख्य कॉन्टेक्स्ट को भारी न करें।

हर नए संदेश के साथ Claude पूरी पिछली बातचीत, सिस्टम प्रॉम्प्ट और टूल्स की जानकारी भेजता है। शुरुआत में प्लानिंग पर टोकन खर्च करना भविष्य के सुधारों पर होने वाली बड़ी बर्बादी को रोकता है। rewind कमांड मॉडल द्वारा की गई गलतियों को इतिहास से मिटाकर टोकन दक्षता में सुधार करता है।

Claude.md और प्रोजेक्ट स्ट्रक्चर का अनुकूलन

  • init कमांड द्वारा बनाई गई फाइलों में सर्वर चलाने के निर्देश जैसी डिफ़ॉल्ट जानकारी हटा देनी चाहिए।
  • Claude.md फाइल को केवल गाइडिंग सिद्धांतों तक सीमित रखकर 300 लाइनों के भीतर रखना चाहिए।
  • विशिष्ट डेटाबेस या स्कीमा नियमों को अलग फाइलों में विभाजित करके मुख्य फाइल से लिंक करना चाहिए।

Claude फाइल नामों से आर्किटेक्चर को समझने में सक्षम है, इसलिए विस्तृत मैनुअल की आवश्यकता नहीं है। यदि सब कुछ एक ही फाइल में रखा जाता है, तो वह हर संदेश के साथ लोड होती है। फाइलों को विभाजित करने से Claude केवल उस जानकारी को खींचता है जिसकी उसे उस समय वास्तव में आवश्यकता होती है।

एडवांस कॉन्फ़िगरेशन और हुक्स का उपयोग

  • append system prompt फ्लैग का उपयोग केवल आवश्यक निर्देश अस्थायी रूप से जोड़ने के लिए करना चाहिए।
  • कार्य की जटिलता के अनुसार effort level को low पर सेट करने से टोकन की बचत होती है।
  • टेस्ट रिपोर्ट के लिए कस्टम हुक्स का उपयोग करके केवल फेल हुए परिणामों को कॉन्टेक्स्ट में भेजना चाहिए।

मॉडल का प्रयास स्तर (Effort Level) डिफ़ॉल्ट रूप से ऑटो पर होता है, जिसे कम जटिल कार्यों के लिए मैन्युअल रूप से घटाया जा सकता है। बार-बार होने वाले कार्यों के लिए स्किल्स और स्क्रिप्ट का उपयोग प्रोग्रामेटिक हैंडलिंग सुनिश्चित करता है। Haiku मॉडल Sonnet या Opus की तुलना में सरल कार्यों के लिए अधिक किफायती विकल्प है।

सिस्टम सेटिंग्स और बैकग्राउंड प्रोसेस नियंत्रण

  • auto memory और background task को डिसेबल करने से बैकग्राउंड में होने वाली निरंतर टोकन खपत रुकती है।
  • thinking फीचर को पूरी तरह बंद करने से गहरी रीजनिंग के बिना सीधे जवाब मिलते हैं, जिससे टोकन बचते हैं।
  • max output tokens की सीमा निर्धारित करने से मॉडल द्वारा उत्पन्न आउटपुट की लंबाई नियंत्रित होती है।

Dream, memory refactoring और background indexing जैसी प्रक्रियाएं उपयोगकर्ता के सक्रिय न होने पर भी टोकन खर्च करती हैं। थिंकिंग फीचर एफर्ट सेटिंग से अलग है और इसे बंद करने से इंटरनल रीजनिंग स्टेप्स समाप्त हो जाते हैं। इन सेटिंग्स को .claud फ़ोल्डर में कॉन्फ़िगर करके आक्रामक तरीके से टोकन बचाए जा सकते हैं।

Community Posts

View all posts