Opus 4.6 + Agent Teams ने Claude Code को बनाया बेमिसाल

BBetter Stack
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00पिछले हफ़्ते, हमने क्लाउड कोड एजेंट स्वॉर्म फीचर के बारे में एक वीडियो बनाया था,
00:00:03जहाँ विशिष्ट कार्यों के लिए स्पेशलाइज्ड सब-एजेंट बनाए जाते हैं,
00:00:07और ये वापस मुख्य ऑर्केस्ट्रेटर या टीम लीड से संपर्क कर सकते हैं।
00:00:11खैर, तब यह एक छिपा हुआ फीचर था जिसे चालाकी से हैक करके एक्सेस किया गया था।
00:00:15लेकिन अब इसे आधिकारिक तौर पर एक्सपेरिमेंटल फ्लैग के तहत रिलीज़ कर दिया गया है
00:00:19और अब इसके साथ ऑफिशियल डॉक्यूमेंटेशन, टीमवर्क सपोर्ट,
00:00:21और टीम के साथियों के बीच एक-दूसरे को चुनौती देने या बहस करने की सुविधा भी मिलती है।
00:00:25सब्सक्राइब बटन दबाएं और चलिए शुरू करते हैं।
00:00:28एन्थ्रोपिक इस हफ़्ते पूरे फॉर्म में रहा है, ओपस 4.6 की रिलीज़ से लेकर
00:00:32उन सुपर बाउल विज्ञापनों तक, जिनसे सैम ऑल्टमैन नाखुश हैं।
00:00:35लेकिन क्लाउड कोड के लिए रिलीज़ किए गए फीचर्स में एजेंट टीम्स सबसे बड़े फीचर्स में से एक है,
00:00:40जो टास्क फीचर और पैरेलल सब-एजेंट्स के काम को आपस में जोड़ता है।
00:00:44हालांकि, टीम्स खुद सब-एजेंट्स से काफी बेहतर हैं।
00:00:48मैं आपको दिखाता हूँ।
00:00:48एजेंट टीम्स फीचर के काम करने के लिए, आपका वर्जन 2.1.32 या उससे ऊपर होना चाहिए
00:00:54और अपनी .Claude डायरेक्टरी की settings.json फ़ाइल में यह लाइन जोड़नी होगी।
00:00:58ठीक है, तो यहाँ मेरे पास XDL नामक टूल में वेब इंटरफ़ेस जोड़ने का एक प्लान है
00:01:03जो आपको ट्विटर से वीडियो डाउनलोड करने की सुविधा देता है।
00:01:05मैंने एजेंटों को प्लान पढ़ने, टास्क बनाने और एक फ्रंट-एंड और डिज़ाइनर साथी तैयार करने को कहा है।
00:01:11लेकिन एंटर दबाने से पहले, आप यहाँ नीचे देखेंगे कि मैं असल में Teamux का उपयोग कर रहा हूँ।
00:01:16ऐसा इसलिए है क्योंकि एजेंट स्प्लिट पेन बनाने के लिए Teamux या item 2 का उपयोग कर सकते हैं
00:01:21ताकि मुझे ठीक से दिख सके कि टीम का हर साथी क्या कर रहा है।
00:01:24तो चलिए एंटर दबाते हैं और देखते हैं कि यह क्या करता है।
00:01:26ठीक है, अब यह प्लान पढ़ रहा है और कुछ टास्क बना रहा है
00:01:30इससे पहले कि यह एक साथ कई साथियों को काम पर लगाए।
00:01:33और यहाँ हमारा पहला साथी है, फ्रंट-एंड वाला।
00:01:35मैं थोड़ा ज़ूम आउट करने जा रहा हूँ ताकि हम इसे देख सकें क्योंकि यहाँ काफी कुछ हो रहा है।
00:01:39और यहाँ नीचे हमारा दूसरा साथी है, जो UI स्टाइलिंग का काम देख रहा है।
00:01:43तो आप यहाँ गौर करेंगे कि अगर मैं चाहूँ तो इन साथियों के साथ बातचीत कर सकता हूँ,
00:01:47और काम के दौरान उन्हें खास निर्देश दे सकता हूँ।
00:01:49जाहिर है, अगर मेरे पास बड़ा मॉनिटर होता या मैं सामान्य ज़ूम लेवल पर होता,
00:01:53तो मैं देख पाता कि हर कोई ठीक-ठीक क्या कर रहा है।
00:01:55लेकिन क्योंकि मैंने थोड़ा ज़ूम इन किया है, इसलिए ऐसा करना मुश्किल है।
00:01:58ठीक है, और एक बार जब साथी अपना काम पूरा कर लेता है,
00:02:00तो इस तरफ मौजूद क्लाउड कोड का मुख्य टीम मेंबर इसे अपने आप बंद कर देगा।
00:02:04अब जबकि दोनों साथियों का काम खत्म हो गया है, हम डिज़ाइन देख सकते हैं,
00:02:08जो कुछ ऐसा दिखता है।
00:02:09मैं एक ट्वीट का URL पेस्ट करूँगा, डाउनलोड पर क्लिक करूँगा, और वीडियो वास्तव में एक्सट्रैक्ट हो रहा है,
00:02:14जिसे हम डाउनलोड करके अपने ब्राउज़र में देख सकते हैं।
00:02:18बहुत शानदार।
00:02:19इसके अलावा, अगर हम अपनी dot Claude teams डायरेक्टरी में देखें,
00:02:22तो हमें प्रोजेक्ट और ब्रांच के नाम वाला एक फोल्डर दिखाई देगा।
00:02:26और अगर मैं उस फोल्डर में जाऊँ, तो वहाँ एक config JSON फ़ाइल है जिसमें प्रोजेक्ट,
00:02:31यहाँ टीम लीड, और टीम लीड जिस मॉडल का उपयोग कर रहा था, उसका विवरण है, जो हैकू (haiku) था।
00:02:36भले ही मैंने इसे हैकू पर सेट नहीं किया था, मुझे लगता है कि इसने खुद ही इसे काम के लिए सबसे अच्छा मॉडल चुना।
00:02:41अब, अगर मैं TMUX के बाहर उसी मॉडल के साथ वही प्रॉम्ट चलाता हूँ और एंटर दबाता हूँ,
00:02:46तो यह फिर से काम पर लग जाता है, टास्क सेट करता है और टीम मेंबर्स बनाता है।
00:02:50लेकिन इस बार आपको टीम के साथी यहाँ नीचे दिखाई देंगे।
00:02:53तो हमारे पास डिज़ाइनर है, फ्रंट एंड डेवलपर है और मुख्य टीम लीडर है।
00:02:57और अगर मैं एंटर दबाकर किसी टीम मेंबर के सेक्शन में जाता हूँ, तो देख सकता हूँ कि वे क्या कर रहे हैं।
00:03:01और हम इस विंडो में भी उनके साथ संवाद कर सकते हैं।
00:03:04तो फिर से, यह TMUX वाले व्यू जैसा ही है, लेकिन कई विंडोज़ के बजाय,
00:03:09हमें एक बड़ी विंडो मिलती है और हम यहाँ नीचे टीम मेंबर्स के बीच स्विच कर सकते हैं।
00:03:13और जब कोई साथी अपने टास्क पूरे कर लेता है, तो उसे बंद कर दिया जाता है और मुख्य टीम लीड कमान संभाल लेता है।
00:03:18इस मामले में, हम देख सकते हैं कि यह हमें बता रहा है कि कौन से टास्क पूरे हो गए हैं।
00:03:21और यह हमें किए गए कामों का सारांश दे रहा है।
00:03:24अब, यह सब-एजेंट्स जैसा लग सकता है, लेकिन वे असल में बहुत अलग हैं।
00:03:28अगर हम डॉक्यूमेंटेशन देखें और इस सेक्शन तक स्क्रॉल करें,
00:03:31तो हम अंतर देख सकते हैं। एजेंट टीम्स को अपना स्वतंत्र कॉन्टेक्स्ट मिलता है।
00:03:35सब-एजेंट केवल मुख्य एजेंटों से बात करते हैं,
00:03:38जबकि टीम के साथी एक-दूसरे से बात कर सकते हैं और उनकी टास्क लिस्ट भी साझा होती है।
00:03:43जबकि सब-एजेंट्स के लिए, मुख्य एजेंट ही सब कुछ मैनेज करता है।
00:03:46लेकिन यहाँ एक दिलचस्प बात है।
00:03:47सब-एजेंट परिणाम का सारांश बनाकर मुख्य कॉन्टेक्स्ट को वापस भेजते हैं,
00:03:51जबकि एजेंटों का अपना अलग क्लाउड इंस्टेंस होता है।
00:03:55इसलिए वे कहीं ज़्यादा टोकन खर्च करते हैं।
00:03:57तो हाँ, एजेंट टीम्स या एजेंट स्वॉर्म फीचर आधिकारिक तौर पर आ गया है।
00:04:02हालांकि मुझे नहीं लगता कि मैं इसका इतना ज़्यादा उपयोग करूँगा।
00:04:04एन्थ्रोपिक मॉडलों की लागत और इस तथ्य को देखते हुए कि यह फीचर
00:04:09टोकन को बहुत तेज़ी से खत्म करता है, मेरा मन इसे ज़्यादा इस्तेमाल करने का नहीं है
00:04:13और मैं इसे केवल रिसर्च करने या एक एजेंट से दूसरे एजेंट के काम की जाँच करवाने जैसे विशेष मामलों तक ही सीमित रखूँगा।
00:04:19मेरा मतलब है, ज़रा इसे देखिए।
00:04:20जब मैंने पहली बार एजेंट टीम्स फीचर का उपयोग किया।
00:04:23वीडियो में पहले, मुख्य एजेंट को छोड़कर मेरे दो साथियों के इस्तेमाल ने
00:04:27ओपस 4.6 के मेरे 29% कोटे का उपयोग किया, जो लगभग 13,000 टोकन है।
00:04:34लेकिन यह ध्यान रखना महत्वपूर्ण है कि पैरेलल एजेंट चलाना कोई नई बात नहीं है।
00:04:37ओपन कोड में यह फीचर काफी समय से है और कुछ अन्य एजेंट हार्नेस में भी है।
00:04:41इसलिए यह देखना दिलचस्प होगा कि क्लाउड कोड यूज़र्स एजेंट टीम्स फीचर को कैसे अपनाते हैं,
00:04:47यह देखते हुए कि Teamux के शॉर्टकट उतने यूज़र-फ्रेंडली नहीं हैं।

Key Takeaway

क्लाउड कोड का नया 'एजेंट टीम्स' फीचर डेवलपर्स को एआई एजेंटों की एक पूरी टीम के साथ जटिल कोडिंग कार्यों को समानांतर में करने की अनुमति देता है, लेकिन यह टोकन खपत और लागत के मामले में काफी महंगा साबित हो सकता है।

Highlights

क्लाउड कोड ने आधिकारिक तौर पर 'एजेंट टीम्स' (Agent Teams) फीचर को एक एक्सपेरिमेंटल फ्लैग के तहत रिलीज़ किया है।

यह फीचर 'स्वॉर्म' (Swarm) आर्किटेक्चर पर आधारित है, जहाँ स्पेशलाइज्ड सब-एजेंट एक-दूसरे के साथ सहयोग और बहस कर सकते हैं।

उपयोगकर्ता TMUX या iTerm2 का उपयोग करके समानांतर में काम कर रहे विभिन्न एजेंटों को अलग-अलग विंडो स्प्लिट में देख सकते हैं।

एजेंट टीम्स और साधारण सब-एजेंट्स के बीच मुख्य अंतर यह है कि टीम के साथियों का अपना स्वतंत्र कॉन्टेक्स्ट होता है और वे एक-दूसरे से सीधे बात कर सकते हैं।

इस फीचर की मुख्य चुनौती इसकी उच्च लागत है, क्योंकि यह बहुत कम समय में बड़ी संख्या में टोकन का उपयोग करता है।

एन्थ्रोपिक का ओपस 4.6 मॉडल इन एजेंटों को चलाने के लिए मुख्य रूप से उपयोग किया जा रहा है।

Timeline

एजेंट टीम्स फीचर का परिचय और सेटअप

वीडियो की शुरुआत क्लाउड कोड के नए आधिकारिक 'एजेंट टीम्स' फीचर के परिचय से होती है, जिसे पहले एक गुप्त हैक के रूप में जाना जाता था। अब इसे आधिकारिक डॉक्यूमेंटेशन और टीमवर्क सपोर्ट के साथ एक्सपेरिमेंटल फ्लैग के तहत पेश किया गया है। वक्ता बताते हैं कि ओपस 4.6 की रिलीज़ के साथ एन्थ्रोपिक काफी सक्रिय रहा है, जो एजेंट टीम्स को और अधिक शक्तिशाली बनाता है। इस फीचर को सक्रिय करने के लिए उपयोगकर्ताओं को अपने वर्जन को 2.1.32 पर अपडेट करना होगा और settings.json फ़ाइल में एक विशिष्ट कोड लाइन जोड़नी होगी। यह सेटअप प्रक्रिया उन डेवलपर्स के लिए महत्वपूर्ण है जो एआई-संचालित टीम वर्कफ़्लो का अनुभव करना चाहते हैं।

प्रैक्टिकल डेमो: ट्विटर वीडियो डाउनलोडर प्रोजेक्ट

वक्ता XDL नामक टूल के लिए एक वेब इंटरफ़ेस बनाने का उदाहरण देकर इस फीचर का प्रदर्शन करते हैं। वह एजेंटों को एक प्लान पढ़ने, टास्क बनाने और फ्रंट-एंड डेवलपर और डिज़ाइनर एजेंटों को नियुक्त करने का निर्देश देते हैं। यहाँ TMUX का उपयोग किया गया है ताकि उपयोगकर्ता अलग-अलग स्क्रीन पैनल में हर एजेंट की प्रगति को वास्तविक समय में देख सके। प्रदर्शन के अंत में, एआई टीम सफलतापूर्वक एक कार्यात्मक वेब पेज बनाती है जहाँ वीडियो URL पेस्ट करके एक्सट्रैक्ट किया जा सकता है। यह दिखाता है कि कैसे कई विशेषज्ञ एजेंट मिलकर एक पूर्ण प्रोजेक्ट को कुछ ही मिनटों में समाप्त कर सकते हैं।

कन्फ़िगरेशन और इंटरफ़ेस के विकल्प

इस खंड में, सिस्टम के आंतरिक कार्य करने के तरीके और प्रोजेक्ट डायरेक्टरी के भीतर मौजूद config JSON फ़ाइलों की जांच की गई है। वक्ता बताते हैं कि क्लाउड ने काम के लिए स्वचालित रूप से 'हैकू' (Haiku) मॉडल को चुना, जो कुशलता और लागत का संतुलन बनाता है। वे बिना TMUX के इंटरफ़ेस का भी प्रदर्शन करते हैं, जहाँ उपयोगकर्ता एक ही विंडो में नीचे दिए गए टैब के माध्यम से विभिन्न एजेंटों के बीच स्विच कर सकते हैं। यह लचीलापन उन उपयोगकर्ताओं के लिए उपयोगी है जो जटिल टर्मिनल सेटअप का उपयोग नहीं करना चाहते हैं। जैसे ही टास्क पूरे होते हैं, मुख्य टीम लीडर कमान संभाल लेता है और किए गए सभी कार्यों का सारांश प्रस्तुत करता है।

एजेंट टीम्स बनाम सब-एजेंट्स और टोकन लागत

वक्ता एजेंट टीम्स और पारंपरिक सब-एजेंट्स के बीच के तकनीकी अंतर को विस्तार से समझाते हैं। एजेंट टीम्स का अपना स्वतंत्र कॉन्टेक्स्ट होता है और वे एक साझा टास्क लिस्ट पर आपस में संवाद कर सकते हैं, जबकि सब-एजेंट केवल मुख्य एजेंट के माध्यम से काम करते हैं। हालाँकि, यह उच्च प्रदर्शन एक बड़ी कीमत पर आता है क्योंकि प्रत्येक एजेंट का अपना क्लाउड इंस्टेंस होता है, जिससे टोकन की खपत बहुत बढ़ जाती है। वक्ता ने अनुभव किया कि एक छोटे कार्य के लिए उनके दैनिक ओपस कोटे का लगभग 29% (13,000 टोकन) खर्च हो गया। अंत में, वे निष्कर्ष निकालते हैं कि यह फीचर शक्तिशाली तो है, लेकिन इसकी उच्च लागत के कारण इसका उपयोग केवल विशिष्ट शोध या जटिल कार्यों के लिए ही किया जाना चाहिए।

Community Posts

No posts yet. Be the first to write about this video!

Write about this video