Log in to leave a comment
No posts yet
जब आप एजेंट-आधारित कोडिंग शुरू करते हैं, तो सबसे डरावनी चीज़ प्रदर्शन नहीं, बल्कि अगले महीने का कार्ड स्टेटमेंट होता है। वीडियो में दिखाए गए डुअल-एजेंट शानदार लगते हैं, लेकिन बिना सोचे-समझे इनका उपयोग करने पर API लागत का बम फूटना तय है। 2026 में, Claude 4.6 Opus की इनपुट लागत 3.00) से 60% अधिक महंगी है। आउटपुट लागत तो $25.00 तक पहुँच जाती है। 1 लाख से अधिक टोकन वाले लेगेसी प्रोजेक्ट में, हर एक लूप का मतलब एक कप कॉफी की कीमत गंवाना है।
लागत को नियंत्रित करने के लिए, केवल Opus पर निर्भर न रहें, बल्कि स्नॉट आवंटन (Slot Allocation) पद्धति का उपयोग करें। कुल कार्य के 20% हिस्से, जैसे कि डिज़ाइन और आर्किटेक्चरल निर्णयों के लिए Opus को तैनात करें, और शेष 80% सरल कार्यान्वयन Sonnet को सौंपें।
--model opus फ़्लैग के साथ मैन्युअल रूप से अपग्रेड करें। हर सोमवार सुबह API रिपोर्ट खोलकर यह जाँचने की आदत डालें कि क्या वास्तविक खर्च अनुमानित वक्र के अनुसार है।एजेंट द्वारा उपयोग किए जाने वाले 70% टोकन वास्तव में अनावश्यक फ़ाइलों और निर्देशिकाओं (directories) को खोजने में बर्बाद हो जाते हैं। जब संदर्भ (context) 1 लाख टोकन से अधिक हो जाता है, तो LLM की एकाग्रता तेज़ी से कम होने लगती है, जिसे "परफॉरमेंस क्लिफ" कहा जाता है। सभी सोर्स कोड को एक साथ डालना पैसे की बर्बादी और प्रदर्शन खराब करने का सबसे छोटा रास्ता है। Anthropic के आंतरिक परीक्षण परिणामों के अनुसार, संदर्भ को कंप्रेस करके भेजने पर तर्क की गुणवत्ता बनी रहती है और इनपुट लागत 50% से अधिक कम हो जाती है।
AI के लिए विशेष विनिर्देश ARCH.md बनाएँ और एजेंट को एक नक्शा दें।
tree -L 3 -I 'node_modules|dist|.git' > tree.md कमांड के साथ प्रोजेक्ट का ढांचा निकालें। फिर Repomix जैसे टूल का उपयोग करके वास्तविक लॉजिक को हटा दें और केवल फ़ंक्शन सिग्नेचर और इंटरफ़ेस परिभाषाओं वाला सिग्नेचर मैप बनाएँ। अंत में, .claudeignore फ़ाइल में .svg, .json जैसी संपत्तियों (assets) को स्पष्ट रूप से लिखें ताकि वे एजेंट की नज़र से बाहर रहें।डुअल-एजेंट का मूल सिद्धांत डिज़ाइन (Advisor) और कार्यान्वयन (Executor) को अलग करके सुरक्षा कवच बनाना है। यदि आप केवल "कोड की समीक्षा करें" कहते हैं, तो आपको "यह साफ दिख रहा है" जैसे नीरस उत्तर ही मिलेंगे। एक सीनियर इंजीनियर के रूप में, आपको एडवाइज़र को एक कठोर आलोचक की भूमिका निभाने के लिए मजबूर करना चाहिए। केवल इसी चरण को सही ढंग से करने से बग फिक्सिंग में लगने वाले साप्ताहिक 5+ घंटों की बचत हो सकती है।
निष्पादन मॉडल द्वारा कोड को छूने से पहले, Opus द्वारा आलोचनात्मक समीक्षा करने का तंत्र बनाएँ।
यदि एडवाइज़र और एक्ज़ीक्यूटर एक लाइन में खड़े हैं, तो हर बार सत्यापन के दौरान प्रतीक्षा समय (waiting time) उत्पन्न होगा। बड़े पैमाने के रिफैक्टरिंग में, जहाँ सैकड़ों फ़ाइलों को ठीक करने की आवश्यकता होती है, यह तरीका बहुत धीमा है। 50,000 से अधिक लाइनों वाली लाइब्रेरी को माइग्रेट करते समय, कार्यों को विभाजित करने और उन्हें समानांतर (parallel) रूप से चलाने के लिए ऑर्केस्ट्रेशन की आवश्यकता होती है।
कार्य की गति बढ़ाने के लिए समानांतर प्रक्रिया इस प्रकार तैयार करें:
git worktree add कमांड के साथ फीचर-वार स्वतंत्र निर्देशिकाएं बनाएँ। प्रत्येक वर्कट्री में एक अलग Claude Code सत्र शुरू करें और एक साथ विभिन्न मॉड्यूल को रिफैक्टर करें। अंत में, Clash जैसे टूल का उपयोग करके वर्कट्री के बीच के टकरावों (conflicts) को सुलझाएं और उन्हें मुख्य शाखा (main branch) में मिला दें।जैसे-जैसे AI द्वारा लिखा गया कोड जमा होता जाता है, एक बिंदु आता है जहाँ समग्र संरचना गड़बड़ा जाती है और तकनीकी ऋण उत्पन्न होता है। एजेंट एक एकल फ़ाइल को तो शानदार ढंग से ठीक कर सकता है, लेकिन वह पूरे सिस्टम की दिशा के लिए ज़िम्मेदार नहीं होता। 2026 में एक सीनियर इंजीनियर का असली काम खुद कोड टाइप करना नहीं, बल्कि एजेंटों द्वारा बनाए गए परिणामों के संरेखण (alignment) को प्रबंधित करना है।
हर शुक्रवार छुट्टी से पहले 'आर्किटेक्चर ऑडिट' रूटीन चलाएँ।