Log in to leave a comment
No posts yet
एकल AI मॉडल बड़े पैमाने के प्रोजेक्ट्स के सामने निश्चित रूप से विफल हो जाते हैं। हज़ारों फाइलों से जुड़े कोडबेस में बग ढूंढते समय या आर्किटेक्चर को रिफैक्टर करते समय, अकेले काम करने वाला AI अक्सर संदर्भ (context) खो देता है और अनंत लूप में फंसकर टोकन बर्बाद करता है। यह अलग-थलग संरचना की सीमा है।
Anthropic का Claude 4.6 Opus आधारित Agent-Teams इसी बिंदु को लक्षित करता है। यह केवल कई चैट विंडो खोलने जैसा नहीं है। यह एक सॉफ्टवेयर इंजीनियरिंग स्वार्म (Swarm) का अहसास है जहाँ एजेंट वास्तविक समय में संवाद करते हैं, लोकल फाइल सिस्टम साझा करते हैं, और एक मानव विकास टीम की तरह समानांतर में सहयोग करते हैं। सीनियर डेवलपर्स और टेक लीड्स को इस शक्तिशाली टीम को कैसे डिजाइन और नियंत्रित करना चाहिए, इसकी वास्तविक रणनीति यहाँ दी गई है।
Agent-Teams मौजूदा सरल सब-एजेंट पद्धति से जिस महत्वपूर्ण बिंदु पर भिन्न है, वह है साझा स्थिति (Shared State)। अतीत में, यह एक लंबवत संरचना थी जहाँ मुख्य AI काम सौंपता था और केवल परिणाम प्राप्त करता था, लेकिन अब एजेंटों के लिए एक ही कार्यालय (लोकल डायरेक्टरी) में एक साथ काम करते हुए क्षैतिज सहयोग करना संभव है।
जब सत्र शुरू होता है, तो प्रोजेक्ट रूट में एक .claude फोल्डर बनाया जाता है। यह टीम का वॉर रूम (operation room) है।
सबसे नवीन विशेषता एजेंटों के बीच सीधा संचार है। SendMessage टूल का उपयोग करने पर, प्राप्तकर्ता एजेंट के इनबॉक्स में एक संदेश रिकॉर्ड किया जाता है, और अगले अनुमान (inference) टर्न में सिस्टम संदेश के रूप में इंजेक्ट किया जाता है। विशेष रूप से, टीम के सदस्यों द्वारा 2-4 सेकंड के अंतराल पर भेजे जाने वाले हार्टबीट (Heartbeat) सिग्नल टीम लीडर को वास्तविक समय में टीम के सदस्यों की उपलब्धता को समझने में मदद करते हैं।
सिर्फ सहयोग करने का आदेश देना गैर-जिम्मेदाराना है। प्रदर्शन तभी आता है जब प्रत्येक एजेंट को एक स्पष्ट व्यक्तित्व (persona) और अधिकार दिए जाते हैं। एक जटिल प्रणाली की कमजोरियों को खोजने के लिए, टीम को निम्नानुसार डिजाइन करें:
| भूमिका का नाम | मुख्य मिशन और प्रयुक्त उपकरण | अपेक्षित परिणाम |
|---|---|---|
| Security Auditor | भेद्यता स्कैन, स्थिर विश्लेषण | PoC कोड और रिपोर्ट |
| Performance Analyst | मेमोरी प्रोफाइलिंग, क्वेरी विश्लेषण | अड़चन (bottleneck) अनुकूलन प्रस्ताव |
| Code Archeologist | इतिहास विश्लेषण, निर्भरता की पहचान | आर्किटेक्चर आरेख |
| Test Engineer | एज केस परीक्षण निष्पादन | प्रतिगमन (regression) परीक्षण रिपोर्ट |
एजेंटों के बीच हस्तक्षेप कम करने के लिए, नीचे दी गई संरचना वाले कार्य दस्तावेज़ (Task Document) को प्रॉम्प्ट के रूप में उपयोग किया जाना चाहिए।
[Task Document Template]
/src/auth/* (इस सीमा के बाहर की फाइलों को संशोधित करना वर्जित है)npm test चलाएँ और सफलता/विफलता का लॉग रखें।Claude 4.6 Opus शक्तिशाली है, लेकिन यदि इसे प्रबंधित नहीं किया गया, तो लागत बढ़ जाएगी। शोध डेटा के अनुसार, प्रॉम्प्ट कैशिंग (Prompt Caching) का उचित उपयोग करने पर इनपुट टोकन लागत को 90% तक कम किया जा सकता है। हर कार्य के लिए महंगे Opus का उपयोग करने की आवश्यकता नहीं है। कार्य की प्रकृति के अनुसार मॉडलों को मिलाएँ।
Claude 4.6 Opus (Max Effort) - समग्र संरचना डिजाइन और निर्णय लेना।Claude 4.6 Sonnet - गति और सटीकता का इष्टतम संतुलन।Claude 4.6 Haiku - कम लागत पर बड़े पैमाने पर टेक्स्ट प्रोसेसिंग।यदि मुख्य एजेंट हर छोटी चीज़ को स्वयं करने की कोशिश करता है, तो Delegate Mode (Shift+Tab) के माध्यम से लीडर को समन्वय-केंद्रित मोड में स्विच करें। टोकन की बर्बादी को रोकने की कुंजी यह स्पष्ट बाधा है कि जब तक टीम के सदस्य का काम पूरा न हो जाए, तब तक हस्तक्षेप न किया जाए।
इस सुविधा का उपयोग करने के लिए पर्यावरण सेटअप चरण यहाँ दिए गए हैं।
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1tmux वातावरण उपयुक्त है। यदि आप इसे claude --teammate-mode tmux विकल्प के साथ चलाते हैं, तो आप अलग-अलग पैनल में प्रत्येक टीम के सदस्य की कार्य स्क्रीन को वास्तविक समय में देख सकते हैं।Claude 4.6 Opus का 1 मिलियन टोकन कॉन्टेक्स्ट विंडो का अर्थ है कि एजेंट हज़ारों लाइनों के लेगेसी कोड और बाहरी दस्तावेज़ों को अपने दिमाग में रखकर संवाद कर सकते हैं। वास्तव में, MRCR v2 बेंचमार्क में, इस मॉडल की विशाल डेटा के भीतर जानकारी खोजने की क्षमता पिछली पीढ़ी की तुलना में 76% बेहतर हुई है।
एक वरिष्ठ डेवलपर की मुख्य प्रतिस्पर्धा अब कोड लिखने की क्षमता से हटकर AI एजेंट टीमों को डिजाइन और ऑर्केस्ट्रेट करने की क्षमता की ओर बढ़ रही है। आपको एक ऐसा आर्किटेक्ट बनना होगा जो जटिल प्रणालियों की सीमाएं तय करे और एजेंटों के बीच संचार प्रोटोकॉल को अनुकूलित करे। 3 या उससे कम सदस्यों वाली छोटी टीम के साथ शुरुआत करें और उत्पादकता मेट्रिक्स को स्वयं मापें।