00:00:00Claude code पिछले कुछ समय से उतना अच्छा नहीं रहा है।
00:00:02हमारी टीम इसे हर दिन इस्तेमाल करती है और पिछले कुछ हफ़्तों से हम लिमिट्स से
00:00:06उम्मीद से कहीं ज़्यादा जल्दी बाहर हो रहे हैं।
00:00:071 मिलियन टोकन वाला कॉन्टेक्स्ट विंडो चीज़ों को बेहतर बनाने के लिए था, लेकिन इसने वास्तव में
00:00:12इसे और खराब कर दिया है।
00:00:13यही कारण है कि हमने उन ऑप्टिमाइज़ेशन पर रिसर्च की जिन्हें हम Claude code को लंबे समय तक चलाने के लिए ढूंढ सकते थे।
00:00:18इससे पहले कि हम इस पर आगे बढ़ें कि हम वास्तव में लिमिट्स का अधिकतम लाभ कैसे उठा सकते हैं, आइए पहले
00:00:22चर्चा करें कि Claude का प्लान और लिमिट्स सिस्टम वास्तव में कैसे काम करता है।
00:00:26यह सेक्शन सिर्फ उन लोगों को समझाने के लिए है जो इस बात से परिचित नहीं हैं कि लिमिट्स वास्तव में
00:00:30कैसे काम करती हैं।
00:00:31Claude के 2 पेड प्लान हैं जिनमें pro और max प्लान शामिल हैं।
00:00:34Max सबसे महंगा है और pro एक सस्ता प्लान है जो सिर्फ $20 मासिक है।
00:00:38दोनों प्लान्स में उन विभिन्न फीचर्स तक पहुँच है जो फ्री प्लान में उपलब्ध नहीं थे, जिनमें
00:00:43Claude code, co-work और अन्य शामिल हैं।
00:00:45लेकिन वे सभी एक ही नियम का पालन करते हैं।
00:00:46चाहे कोई भी प्लान हो, हर एक आपको मैसेज की एक सीमित संख्या देता है जिसे आप 5 घंटे की
00:00:51विंडो के भीतर भेज सकते हैं और एक बार जब वह विंडो समाप्त हो जाती है, तो आपका मैसेज काउंट रीसेट हो जाता है।
00:00:55आपको मिलने वाले मैसेज की संख्या प्लान के अनुसार अलग-अलग होती है।
00:00:575 घंटे की विंडो तब शुरू होती है जब आप अपना पहला मैसेज भेजते हैं, चाहे वह Claude डेस्कटॉप पर हो,
00:01:01वेब पर हो या किसी भी Claude इंटरफ़ेस पर।
00:01:03विंडो शुरू होने के बाद, आपके द्वारा भेजा गया प्रत्येक मैसेज आपके प्लान की निर्धारित सीमा के विरुद्ध गिना जाता है।
00:01:08अब आप उम्मीद कर सकते हैं कि विंडो केवल तभी गिनी जाएगी जब आप सक्रिय रूप से इसका उपयोग कर रहे हों।
00:01:11लेकिन भले ही आप बीच में खाली बैठें और फिर 5वें घंटे में इसका भारी उपयोग करें, फिर भी विंडो
00:01:15चल रही होती है और आपकी लिमिट रीसेट होने से पहले आपको पूरे 5 घंटे बीतने तक
00:01:20इंतज़ार करना होगा।
00:01:215 घंटे की विंडो आपके डिवाइस पर भी निर्भर नहीं है।
00:01:23इसलिए यदि आप एक ही अकाउंट के साथ एक से अधिक डिवाइस का उपयोग कर रहे हैं, तो सभी उपयोग
00:01:27उसी सीमा के भीतर गिने जाएंगे।
00:01:28अब pro प्लान के लिए, आपको प्रति 5 घंटे की विंडो में लगभग 45 मैसेज मिलते हैं।
00:01:32Max प्लान आपको 225 देता है और max 20 times प्लान, जो कि 100 डॉलर वाले
00:01:37प्लान से ज़्यादा महंगा है, आपको उसी विंडो में 900 मैसेज देता है।
00:01:41ये संख्याएँ आपके द्वारा उपयोग किए जाने वाले मॉडल के आधार पर भिन्न हो सकती हैं क्योंकि आपको Sonnet के साथ अधिक
00:01:46और Opus के साथ कम मैसेज मिलते हैं।
00:01:47अब आपको लग सकता है कि मैसेज की यह संख्या आपके उपयोग के लिए पर्याप्त से अधिक है।
00:01:51लेकिन यह सिर्फ एक अनुमानित संख्या है और अन्य कारक भी हैं जो इसे प्रभावित करते हैं।
00:01:54पहला वह मॉडल है जिसका आप उपयोग कर रहे हैं।
00:01:56Opus मॉडल उसी अनुरोध के लिए Sonnet की तुलना में लगभग 3 गुना अधिक टोकन की खपत करते हैं क्योंकि वे
00:02:01कहीं अधिक शक्तिशाली और कंप्यूट इंटेंसिव हैं।
00:02:03इसलिए यदि आप हर समय Opus का उपयोग कर रहे हैं, तो आपको अपनी 5 घंटे की विंडो में 45 मैसेज नहीं मिलेंगे
00:02:08और आपकी लिमिट बहुत तेज़ी से खत्म हो जाएगी।
00:02:10Pro प्लान की कुल लिमिट कम है।
00:02:12जहाँ तक max प्लान की बात है, जबकि एक अकेला व्यक्ति इसे संभाल सकता है, max आमतौर पर संगठनों द्वारा
00:02:16खरीदा जाता है और टीम के सदस्यों के बीच वितरित किया जाता है, इसलिए यह कई लोगों के
00:02:20साथ टिक नहीं पाएगा।
00:02:21हम AI labs में भी यही करते हैं, हमने एक max प्लान खरीदा है और उसे अपनी टीम में बाँट दिया है।
00:02:26इसके बावजूद, हमारी लिमिट अक्सर खत्म हो जाती है जिससे हमें इसे लंबे समय तक चलाने के
00:02:30तरीकों पर शोध करने के लिए मजबूर होना पड़ा।
00:02:31दूसरा कारक आपके द्वारा किए जा रहे कार्य का प्रकार है।
00:02:34कंप्यूट इंटेंसिव टास्क या ऐसे टास्क जिनमें कई टूल्स की आवश्यकता होती है, बहुत सारे टोकन की खपत करते हैं।
00:02:38इसलिए विंडो सामान्य से बहुत तेज़ी से खत्म हो जाएगी और हो सकता है कि आप pro प्लान पर 45
00:02:43मैसेज तक भी न पहुँच सकें।
00:02:44और इन सबके अलावा, Anthropic ने हाल ही में पीक वर्किंग घंटों के दौरान सेशन लिमिट को तेज़ी से कम कर दिया है,
00:02:48जब कई लोग एक साथ सेवा का भारी उपयोग कर रहे होते हैं।
00:02:52इसलिए आपका Claude प्लान आपके द्वारा कोई वास्तविक काम पूरा करने से पहले ही और तेज़ी से खत्म हो जाएगा।
00:02:56यही कारण है कि अपनी विंडो का अधिकतम लाभ उठाने और
00:03:00पूरे दिन प्रभावी ढंग से Claude का उपयोग करने के तरीके सीखने का यह सही समय है।
00:03:02लेकिन आगे बढ़ने से पहले, आइए हमारे प्रायोजक, Twin के बारे में कुछ शब्द सुनें।
00:03:05यदि आपने Zapier या N8N जैसे टूल के साथ ऑटोमेशन की कोशिश की है, तो आप जानते हैं कि क्या होता है।
00:03:09कठोर वर्कफ़्लो, लगातार खराबी और ऐप्स को जोड़ने में बर्बाद हुए घंटों।
00:03:13और Claudebot जैसे स्थानीय एजेंट सुरक्षा के लिए खतरा हैं और बहुत महंगे हैं।
00:03:17Twin उसे बदल देता है।
00:03:18यह एक नो-कोड AI एजेंट है जो आपके सोते समय वास्तव में आपके लिए काम करता है।
00:03:21यह टूल्स से API के माध्यम से जुड़ता है जब वे मौजूद होते हैं और जब नहीं होते हैं, तो यह तुरंत
00:03:26इंटीग्रेशन बनाता है, जिससे आपको एक अनंत इंटीग्रेशन लाइब्रेरी मिलती है।
00:03:29और अगर कोई API नहीं है, तो Twin बस एक इंसान की तरह ब्राउज़ और बातचीत कर सकता है।
00:03:33इसके अलावा, आपको Perplexity, Gamma, VO3 और Nanobanana जैसे टूल्स तक इन-बिल्ट पहुँच मिलती है।
00:03:38उन्होंने अभी-अभी Twin API लॉन्च किया है।
00:03:40तो आप कहीं से भी एजेंटों को ट्रिगर कर सकते हैं और उन्हें अपने मौजूदा वर्कफ़्लो में प्लग कर सकते हैं।
00:03:44और सबसे अच्छी बात?
00:03:45ये एजेंट सीखते हैं।
00:03:46वे कुछ टूटने पर खुद को ठीक करते हैं, समय के साथ सुधार करते हैं और 24/7 चलते हैं।
00:03:50टूटे हुए ऑटोमेशन की देखभाल करना बंद करें।
00:03:52पिंड कमेंट में दिए गए लिंक पर क्लिक करें और Twin को देखें।
00:03:55अब आप पहले से ही जानते होंगे कि Claude code का सोर्स कोड लीक हो गया था।
00:03:58और बहुत से लोगों ने पहचाना कि इसके अंदर कई समस्याएँ हैं जो लिमिट्स को
00:04:02इरादे से तेज़ी से खत्म कर सकती हैं।
00:04:04इनमें से एक कॉन्टेक्स्ट में रहने वाले ट्रंकेटेड (अधूरे) जवाब हैं।
00:04:07इसलिए यदि आपको रेट लिमिट पूरी होने जैसा कोई एरर मैसेज मिलता है, तो यह एक अधूरा
00:04:12जवाब बना सकता है।
00:04:13और उसके संबंध में, यह पिछले कॉन्टेक्स्ट और उस अधूरे
00:04:17एरर से भरे मैसेज को साथ रखते हुए फिर से कोशिश करता है।
00:04:18यह अनावश्यक जानकारी के साथ कॉन्टेक्स्ट को बढ़ा देता है और टोकन बर्बाद करता है।
00:04:22स्किल लिस्टिंग भी मुख्य रूप से तेज़ पहुँच के लिए डाली जाती है, भले ही वे
00:04:27ज़्यादा मूल्य प्रदान नहीं करती हैं क्योंकि स्किल टूल के माध्यम से तेज़ हैंडलिंग पहले से ही मौजूद है।
00:04:31इसी तरह की कुछ अन्य समस्याएँ भी हैं।
00:04:33इन सब की वजह से बहुत से लोग Claude लिमिट्स के उम्मीद से जल्दी खत्म होने की शिकायत कर रहे हैं।
00:04:38तो आधिकारिक सीमाओं और इन छिपे हुए टोकन ड्रेन्स दोनों का मुकाबला करने के लिए, आपको
00:04:43अपने प्रोडक्ट बनाते समय Claude code को लंबे समय तक चलाने के लिए कुछ उपाय करने होंगे।
00:04:47हम इस चैनल पर AI के साथ प्रोडक्ट बनाने के बारे में जो कुछ भी पाते हैं उसे साझा करते हैं।
00:04:51तो अगर आप इस पर और वीडियो चाहते हैं, तो सब्सक्राइब करें और भविष्य के वीडियो पर नज़र रखें।
00:04:55हम उन सुझावों से शुरू करेंगे जो आपने शायद हमसे पहले ही सुन लिए होंगे यदि आपने हमारे पिछले
00:04:59वीडियो देखे हैं।
00:05:00पहला clear कमांड है।
00:05:01इसका उपयोग तब करें जब आपने कोई कार्य पूरा कर लिया हो और आपको अब पिछले कॉन्टेक्स्ट की आवश्यकता न हो।
00:05:05उदाहरण के लिए, जब आप ऐप को लागू करना समाप्त कर लेते हैं और टेस्टिंग फेज में जाना चाहते हैं,
00:05:09तो आपको पहले के कॉन्टेक्स्ट की आवश्यकता नहीं होती है।
00:05:11इसलिए इसे रीसेट करना और ताज़ा कॉन्टेक्स्ट विंडो के साथ अगला कार्य शुरू करना बेहतर है।
00:05:15लेकिन कभी-कभी आप उस कॉन्टेक्स्ट के कुछ हिस्से को बनाए रखना चाहते हैं।
00:05:18उस स्थिति में, आप इसके बजाय compact कमांड चला सकते हैं।
00:05:21यह पूरी बातचीत का सारांश बनाता है और कॉन्टेक्स्ट में सारांश के साथ जगह खाली करता है।
00:05:25कारण यह है कि हम चाहते हैं कि आप इनका उपयोग करें क्योंकि हर बार जब Claude कोई मैसेज भेजता है, तो इसमें
00:05:29अब तक की पूरी बातचीत, सिस्टम प्रॉम्प्ट, आपके टूल्स और पिछली सभी
00:05:34बातचीत का इतिहास शामिल होता है।
00:05:35हर नए मैसेज के साथ, यह बढ़ता रहता है, जिसके परिणामस्वरूप कॉन्टेक्स्ट विंडो भारी हो जाती है और
00:05:40प्रति मैसेज टोकन का उपयोग अधिक होता है।
00:05:41अब कॉम्पैक्ट करने के बाद भी, यदि आप मुख्य विंडो में साइड सवाल पूछते हैं, तो आप अभी भी इसे
00:05:46असंबंधित सामग्री के साथ भारी कर रहे हैं।
00:05:47तो आप एक त्वरित साइड सवाल पूछने के लिए by the way कमांड का उपयोग कर सकते हैं।
00:05:50यह एक अलग सेशन कॉन्टेक्स्ट विंडो में जवाब देता है।
00:05:53यह साइड सवाल आपके द्वारा भेजे जाने वाले अगले मैसेज के साथ नहीं जाएगा, जिससे प्रति
00:05:57अनुरोध कम टोकन खर्च होंगे।
00:05:58अब भले ही प्लानिंग एक टोकन इंटेंसिव टास्क लग सकता है, आपको अपने
00:06:02प्रोजेक्ट्स की शुरुआत इसी से करनी चाहिए।
00:06:03ऐसा इसलिए है क्योंकि यदि आप प्लानिंग में समय नहीं बिताते हैं, तो आपको बाद में Claude को सही करना होगा
00:06:07जब इसका इम्प्लीमेंटेशन आपकी ज़रूरत के अनुरूप नहीं होगा।
00:06:10प्लानिंग पर शुरुआत में टोकन खर्च करना आपको भविष्य में सुधारों पर
00:06:14कहीं अधिक टोकन बर्बाद करने से बचाता है।
00:06:15कभी-कभी Claude आपके निर्देशों का पालन उस तरह से नहीं करता जैसा आप चाहते हैं।
00:06:18उन समयों में, हम अक्सर इसे इम्प्लीमेंटेशन के सही तरीके के साथ फिर से प्रॉम्प्ट करते हैं।
00:06:22लेकिन फिर से प्रॉम्प्ट करने के बजाय, आप बातचीत और कोड को उस मैसेज से पहले के
00:06:26पॉइंट पर वापस ले जाने के लिए rewind कमांड चला सकते हैं जहाँ Claude ने गलती की थी और प्रॉम्प्ट में
00:06:31सीधे बदलाव कर सकते हैं।
00:06:32आप ऐसा करने के लिए एस्केप की (escape key) को दो बार भी दबा सकते हैं।
00:06:35यह कॉन्टेक्स्ट विंडो से गलत इम्प्लीमेंटेशन को हटा देता है और गलत आउटपुट
00:06:39मॉडल को नहीं भेजे जाते हैं।
00:06:41अब ये सभी कमांड आपको एक सेशन के दौरान टोकन बचाने में मदद करते हैं।
00:06:44लेकिन बड़ा प्रभाव इस बात से पड़ता है कि आपका प्रोजेक्ट शुरू में कैसे संरचित है।
00:06:47आपने शायद Beemad, SpecKit जैसे विभिन्न फ्रेमवर्क का उपयोग करके
00:06:52अपने प्रोजेक्ट्स को पहले ही स्ट्रक्चर किया होगा।
00:06:53लेकिन इनमें से अधिकांश फ्रेमवर्क वास्तव में टोकन इंटेंसिव हैं।
00:06:56इसलिए यदि आप उन्हें अपने ऐप में उपयोग करते हैं, तो उम्मीद करें कि आपकी टोकन सीमा तेज़ी से पूरी हो जाएगी।
00:07:00जबकि ये फ्रेमवर्क max प्लान पर टिक सकते हैं, वे pro पर निश्चित रूप से नहीं टिकेंगे।
00:07:04अब भले ही आप फ्रेमवर्क का उपयोग नहीं कर रहे हों, आपने अपना खुद का सेटअप किया होगा।
00:07:07Claude.md फ़ाइल बनाने के लिए आपने init कमांड का उपयोग किया होगा जो आपके कोडबेस को स्कैन करता है
00:07:12और आपके लिए एक Claude.md फ़ाइल बनाता है।
00:07:14यह एक फ़ाइल बनाता तो है, लेकिन इसमें बहुत सारी समस्याएँ होती हैं।
00:07:17यह फ़ाइल AI एजेंट को मार्गदर्शन प्रदान करने के लिए होती है, लेकिन यह कुछ ऐसी चीज़ों को सूचीबद्ध करती है
00:07:20जो AI पहले से ही अपने आप जानता है।
00:07:22उदाहरण के लिए, यह जो कमांड दिखाता है वे हर देव सर्वर को चलाने के लिए उपयोग किए जाते हैं और Claude पहले से ही
00:07:27जानता है कि इसे कैसे करना है।
00:07:28जब तक आपके पास सर्वर चलाने के लिए कोई अलग रनिंग फ्लैग न हो, उन्हें
00:07:31जोड़ने की कोई आवश्यकता नहीं है।
00:07:32आर्किटेक्चर की तरह, Claude फ़ाइल के नामों को पढ़ सकता है और नाम के आधार पर यह अनुमान लगा सकता है कि प्रत्येक फ़ाइल किस बारे में है
00:07:37क्योंकि वह फ़ाइल सिस्टम को समझता है और इसका उपयोग नेविगेट करने के लिए करता है।
00:07:41इसलिए इस तरह के निर्देशों की वास्तव में कोई आवश्यकता नहीं है जब तक कि ऐसे विशिष्ट मामले न हों
00:07:45जहाँ अतिरिक्त मार्गदर्शन की आवश्यकता हो।
00:07:47यदि आप अपना खुद का Claude.md लिखने जा रहे हैं, तो यह आदर्श रूप से 300 लाइनों से कम होना चाहिए।
00:07:52फ़ाइल जितनी छोटी होगी, यह उतना ही बेहतर प्रदर्शन करेगी और Claude वास्तव में
00:07:56महत्वपूर्ण चीज़ों पर उतना ही केंद्रित रहेगा।
00:07:57इसे एक गाइडिंग फ़ाइल के रूप में कार्य करना चाहिए, न कि सब कुछ करने का तरीका समझाने वाले विस्तृत मैनुअल के रूप में।
00:08:01आप जो कुछ भी शामिल करते हैं वह पूरे प्रोजेक्ट में सामान्य रूप से लागू होना चाहिए, न कि हर हिस्से का
00:08:05विशिष्ट विवरण जो एक ही फ़ाइल में भरा हुआ हो।
00:08:08इसमें वह सब शामिल करें जो Claude को नहीं करना चाहिए, आपके कोई भी डेवलपमेंट प्रैक्टिस और अन्य समान निर्देश
00:08:13जो Claude को डिफ़ॉल्ट रूप से पता नहीं हैं, केवल Claude.md में ही डालें।
00:08:16आपको इस फ़ाइल को ठीक से कॉन्फ़िगर करने की आवश्यकता है क्योंकि यह फ़ाइल हर सेशन में एक बार
00:08:20कॉन्टेक्स्ट में लोड होती है और वहीं रहती है।
00:08:22इसलिए कॉन्टेक्स्ट विंडो में अनावश्यक जानकारी का मतलब है कि आप हर बार उन टोकन को बर्बाद कर रहे हैं
00:08:27जिनकी शुरुआत में आवश्यकता भी नहीं थी।
00:08:28प्रोजेक्ट के विशिष्ट पहलुओं जैसे डेटाबेस, स्कीमा या अन्य क्षेत्रों के लिए जहाँ अलग-अलग नियमों
00:08:33की आवश्यकता होती है, उन्हें अलग दस्तावेज़ों में विभाजित करें और उन्हें Claude.md फ़ाइल में लिंक करें।
00:08:37यह Claude को केवल उन दस्तावेज़ों को धीरे-धीरे खींचने की अनुमति देता है जिनकी उसे वास्तव में आवश्यकता है।
00:08:41हमने अपने पिछले वीडियो में भी इसका उल्लेख किया था, प्रोजेक्ट रूल्स बनाना जो कुछ
00:08:45पाथ्स के लिए विशिष्ट हों, Claude को केंद्रित रहने में मदद करता है।
00:08:48इस तरह, Claude के पास कॉन्टेक्स्ट में केवल प्रासंगिक जानकारी होती है और अनावश्यक टोकन उपयोग से बचा जाता है।
00:08:53इसलिए आपको एरिया-विशिष्ट लॉजिक के लिए नियमों की फाइलों को भी अलग करना चाहिए ताकि Claude केवल
00:08:57वही लोड कर सके जिसकी आवश्यकता है।
00:08:58आपको बार-बार होने वाले वर्कफ़्लो के लिए स्किल्स का उपयोग करने की भी आवश्यकता है और स्क्रिप्ट और संदर्भ जोड़ने की ताकि
00:09:03यह कार्यों को अधिक सटीक रूप से कर सके।
00:09:05स्किल्स केवल आवश्यक भाग को धीरे-धीरे लोड करके मदद करते हैं और इससे Claude कार्य के
00:09:10प्रासंगिक पहलू पर केंद्रित रहता है।
00:09:12स्क्रिप्ट के साथ बंडलिंग उन नियतात्मक कार्यों पर टोकन बर्बाद न करने में मदद करती है जिन्हें
00:09:16प्रोग्रामेटिक रूप से संभाला जा सकता है।
00:09:17फाइलों को अलग करने का कारण सरल है।
00:09:19यदि Claude एक हिस्से पर काम कर रहा है, तो उसे असंबंधित क्षेत्रों के बारे में जानकारी की आवश्यकता नहीं है।
00:09:24लेकिन अगर सब कुछ एक ही Claude.md फ़ाइल में रखा जाता है, तो यह सब हर बार लोड होगा,
00:09:29जिससे अनावश्यक टोकन उपयोग होगा।
00:09:30आप सीधे सिस्टम प्रॉम्प्ट में विशिष्ट निर्देश जोड़ने के लिए append system prompt फ्लैग का भी उपयोग कर सकते हैं।
00:09:35सब कुछ Claude.md फ़ाइल में डालने के बजाय सेशन उन
00:09:36निर्देशों के साथ शुरू होता है।
00:09:40ये निर्देश अस्थायी हैं और सेशन समाप्त होने के बाद हटा दिए जाएंगे।
00:09:41अब यह ऐसा लग सकता है जैसे यह कॉन्टेक्स्ट को बढ़ा रहा है, लेकिन यह वास्तव में
00:09:44Claude.md में एक बार के निर्देश डालने से अधिक कुशल है।
00:09:48यदि आप इसे वहां जोड़ते हैं, तो Claude इसे स्थायी रूप से कॉन्टेक्स्ट में रखता है, जिससे टोकन अनावश्यक रूप से बर्बाद होते हैं।
00:09:51अपेंडिंग के साथ, आप निर्देश ठीक उसी समय प्रदान करते हैं जब आपको उनकी आवश्यकता होती है।
00:09:56साथ ही, यदि आप हमारी सामग्री का आनंद ले रहे हैं, तो हाइप बटन दबाने पर विचार करें क्योंकि यह हमें
00:09:59इस तरह की और सामग्री बनाने और अधिक लोगों तक पहुँचने में मदद करता है।
00:10:03आपको अपने द्वारा उपयोग किए जा रहे मॉडल का एफर्ट लेवल (प्रयास स्तर) भी सेट करने की आवश्यकता है।
00:10:06यदि आप किसी ऐसे कार्य पर काम नहीं कर रहे हैं जिसमें बहुत अधिक सोचने की आवश्यकता है, तो इसे low पर सेट करें क्योंकि low
00:10:10सेटिंग टोकन बचाती है।
00:10:14डिफ़ॉल्ट रूप से, यह effort auto पर सेट होता है जिसका अर्थ है कि मॉडल तय करता है कि कितना
00:10:15प्रयास करना है लेकिन आप इसे मैन्युअल रूप से बदल सकते हैं।
00:10:20यदि आपका कार्य बहुत जटिल नहीं है, तो हाई एफर्ट सेटिंग का उपयोग करने की कोई आवश्यकता नहीं है।
00:10:21अब जैसा कि हमने पहले बताया, Opus सबसे अधिक टोकन खपत करने वाला मॉडल है।
00:10:25इसलिए यदि आप सीधे कार्यों पर काम कर रहे हैं, तो Haiku पर स्विच करें।
00:10:28यदि आपके कार्य के लिए उचित स्तर की सोच की आवश्यकता है, तो Sonnet का उपयोग करें।
00:10:31यह Opus जितना शक्तिशाली नहीं हो सकता है, लेकिन यह अभी भी कुशल है और अधिक टोकन बचाता है।
00:10:34यदि आपने किसी प्रोजेक्ट के लिए कई MCPs कॉन्फ़िगर किए हैं और आपको किसी विशेष की आवश्यकता नहीं है, तो बस उसे डिसेबल
00:10:39कर दें ताकि यह कॉन्टेक्स्ट विंडो में अनावश्यक जानकारी डालकर टोकन बर्बाद न करे।
00:10:43एक और महत्वपूर्ण कदम ऐसे हुक्स बनाना है जो उस सामग्री को फ़िल्टर करते हैं जो Claude के
00:10:48कॉन्टेक्स्ट विंडो से संबंधित नहीं होनी चाहिए।
00:10:52उदाहरण के लिए, मैंने अपने प्रोजेक्ट के लिए टेस्ट केस कॉन्फ़िगर किए हैं।
00:10:54जब हम उन्हें चलाते हैं, तो वे पास और फेल दोनों टेस्ट की रिपोर्ट करते हैं और वह सब
00:10:57कॉन्टेक्स्ट में लोड हो जाता है।
00:11:01लेकिन Claude की मुख्य चिंता फेल हुए टेस्ट हैं क्योंकि वे ही हैं जिन्हें ठीक करने की आवश्यकता है।
00:11:02तो आप एक हुक बना सकते हैं जो पास हुए टेस्ट केस को कॉन्टेक्स्ट विंडो में प्रवेश करने से
00:11:05रोकने के लिए एक स्क्रिप्ट का उपयोग करता है और केवल फेल हुए टेस्ट ही शामिल किए जाते हैं।
00:11:10यह सभी टेस्ट रिपोर्ट डालने की तुलना में काफी टोकन बचाता है।
00:11:13आप टोकन उपयोग को अनुकूलित करने के लिए इसी तरह से कई अन्य कार्यों के लिए हुक्स कॉन्फ़िगर कर सकते हैं।
00:11:17अब इन सबके अलावा, प्रदर्शन को बेहतर बनाने के लिए आपको अपने .claud
00:11:21फ़ोल्डर में कुछ कॉन्फ़िगरेशन करने की आवश्यकता है।
00:11:25पहला disable prompt caching को false पर सेट करना है।
00:11:27यह Claude को आपके सबसे अधिक उपयोग किए जाने वाले प्रीफ़िक्स को कैश करने के लिए मजबूर करता है, जो टोकन उपयोग को कम करता है।
00:11:30Anthropic आपसे उन हिस्सों के लिए शुल्क नहीं लेता है जो बार-बार भेजे जाते हैं, आप केवल नई
00:11:34सामग्री के लिए भुगतान करते हैं।
00:11:38आप उसे अपने कॉन्टेक्स्ट में सामग्री जोड़ने और टोकन उपयोग बढ़ाने से रोकने के लिए auto memory को भी डिसेबल कर सकते हैं।
00:11:39Auto memory एक बैकग्राउंड प्रोसेस है जो आपकी बातचीत का विश्लेषण करती है और आपके विशिष्ट प्रोजेक्ट के लिए
00:11:43उपयोगी जानकारी को मेमोरी फाइलों में समेकित करती है।
00:11:44इसे डिसेबल करने का मतलब है कि यह आपकी आदतों को ट्रैक नहीं करेगा लेकिन यह बैकग्राउंड में न चलकर
00:11:49टोकन बचाएगा।
00:11:52एक और फ्लैग है जिसे disable background task कहा जाता है जो बैकग्राउंड प्रोसेस को लगातार
00:11:56टोकन की खपत करने से रोकता है।
00:11:57इनमें dream, memory refactoring and cleaning और background indexing शामिल हैं।
00:12:00इसे बंद करने से टोकन बचाने में मदद मिलती है क्योंकि भले ही आप सक्रिय रूप से चैट न कर रहे हों, ये
00:12:02प्रक्रियाएं अभी भी आपकी बातचीत पर काम कर रही होंगी।
00:12:06जब आवश्यकता न हो तो आपको thinking (सोचने) को भी डिसेबल कर देना चाहिए क्योंकि सोचना बहुत अधिक
00:12:10कॉन्टेक्स्ट की खपत करता है और उन कार्यों पर टोकन बर्बाद करता है जिन्हें इसकी आवश्यकता भी नहीं है।
00:12:13अब यह उस एफर्ट सेटिंग से अलग है जिसकी हमने पहले चर्चा की थी।
00:12:16एफर्ट सेटिंग यह नियंत्रित करती है कि Claude एक जवाब के भीतर कितनी रीजनिंग करता है, इसलिए लो एफर्ट का
00:12:20मतलब कम सोचना है, लेकिन वह फिर भी सोचता है।
00:12:23Thinking को पूरी तरह से डिसेबल करने से इंटरनल रीजनिंग स्टेप बंद हो जाता है और Claude बस
00:12:28सीधे जवाब देता है।
00:12:30इसलिए यदि आपके कार्य को गहरी रीजनिंग की आवश्यकता नहीं है, तो thinking को पूरी तरह से डिसेबल कर दें।
00:12:34यदि इसमें कुछ रीजनिंग की आवश्यकता है लेकिन बहुत ज़्यादा नहीं, तो इसके बजाय एफर्ट लेवल को कम कर दें।
00:12:35अंत में max output tokens को एक निर्धारित संख्या पर कॉन्फ़िगर करें।
00:12:39कोई डिफ़ॉल्ट नहीं है, लेकिन इसे सीमित करने से यह नियंत्रित होता है कि मॉडल कितना जेनरेट करता है।
00:12:43यदि आप आक्रामक रूप से टोकन बचाना चाहते हैं तो इसे कम सेट करें या यदि आपके कार्य के लिए लंबे
00:12:46आउटपुट की आवश्यकता है तो इसे बढ़ाएँ।
00:12:50अब इस वीडियो और हमारे सभी पिछले वीडियो के लिए Claude.md टेम्पलेट और अन्य संसाधन AI Labs Pro में उपलब्ध हैं
00:12:55जहाँ से आप इसे डाउनलोड कर सकते हैं और अपने स्वयं के प्रोजेक्ट्स के लिए उपयोग कर सकते हैं।
00:12:56यदि आपको हमारे काम में मूल्य मिला है और आप चैनल का समर्थन करना चाहते हैं, तो यह
00:13:00इसे करने का सबसे अच्छा तरीका है।
00:13:05लिंक डिस्क्रिप्शन में है।
00:13:09यह हमें इस वीडियो के अंत में लाता है।
00:13:10यदि आप चैनल का समर्थन करना चाहते हैं और इस तरह के वीडियो बनाने में हमारी मदद करना चाहते हैं, तो आप
00:13:11नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके ऐसा कर सकते हैं।
00:13:13हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।
00:13:17इसलिए नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके।
00:13:19हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।