00:00:00क्या Opus 4.6 ही एंथ्रोपिक का एकमात्र अपग्रेड था?
00:00:03आप सब-एजेंट्स के बारे में तो जानते ही हैं, जहाँ प्रत्येक एजेंट एक अलग इकाई के रूप में
00:00:07अपने स्वयं के कॉन्टेक्स्ट विंडो के साथ काम करता है।
00:00:09लेकिन ये सब-एजेंट तब विफल हो गए जब किसी काम के लिए उनके बीच तालमेल की आवश्यकता थी।
00:00:13ऐसे मामलों में, ऑर्केस्ट्रेटर को हस्तक्षेप करना पड़ता था, एक एजेंट से जवाब लेकर
00:00:17दूसरे को सौंपना पड़ता था, या एजेंटों को प्रोजेक्ट फोल्डर में मौजूद नोट्स पर निर्भर रहना पड़ता था।
00:00:21संचार की इस कमी के कारण, सरल कार्य भी बहुत जटिल हो जाते थे।
00:00:25इससे निपटने के लिए, एंथ्रोपिक ने सब-एजेंट्स के लिए एक नया अपग्रेड जारी किया और उन्हें “एजेंट-टीम्स” नाम दिया।
00:00:30इन्हें Opus 4.6 के साथ लॉन्च किया गया है।
00:00:33हालाँकि यह अभी भी एक प्रयोगात्मक फीचर है, हमने इसे कई वर्कफ्लो में लागू किया है,
00:00:37और सबसे बड़ा सुधार यह था कि इन कार्यों में लगने वाला समय काफी कम हो गया।
00:00:41लेकिन यह एक कारण से प्रयोगात्मक है और इसमें अभी भी कुछ कमियाँ हैं, और हमने
00:00:44उन समस्याओं के लिए कुछ छोटे समाधान भी खोज लिए हैं।
00:00:47एजेंट-टीम्स का विचार एक साथ काम करने वाले कई क्लाउड-कोड इंस्टेंस रखने का है।
00:00:51टीम का प्रत्येक सदस्य अलग-थलग कार्यों पर काम करता है और उसका प्रबंधन
00:00:55एक एजेंट द्वारा केंद्रित होता है।
00:00:56अब, आप सोच सकते हैं कि यह मौजूदा क्लाउड सब-एजेंट्स के बहुत समान लगता है क्योंकि
00:01:00दोनों समानांतर में चलते हैं और कार्यों को विभाजित करते हैं, लेकिन वे एक जैसे नहीं हैं।
00:01:03ऐसा इसलिए है क्योंकि एजेंट-टीम्स ने उस एक समस्या को हल कर दिया है जो सब-एजेंट फ्रेमवर्क में थी।
00:01:08सब-एजेंट एक-दूसरे के साथ संवाद करने में सक्षम नहीं होते हैं और उन्हें संचार के माध्यम के रूप में
00:01:12ऑर्केस्ट्रेटर एजेंट पर निर्भर रहना पड़ता है।
00:01:15दूसरी ओर, टीम के सदस्य एक-दूसरे के साथ संवाद करने में सक्षम हैं।
00:01:18एजेंट-टीम्स के पीछे मूल विचार एक साथ काम करने वाले कई क्लाउड-कोड सत्रों का होना है।
00:01:22एक सत्र टीम लीडर के रूप में कार्य करता है, काम का समन्वय करता है, कार्य सौंपता है और परिणामों को संश्लेषित करता है,
00:01:27जबकि टीम के साथी अपने स्वयं के कॉन्टेक्स्ट विंडो में स्वतंत्र रूप से काम करते हैं।
00:01:31सब-एजेंट्स का अपना कॉन्टेक्स्ट विंडो होता है, और वे परिणाम वापस कॉलर को रिपोर्ट करते हैं।
00:01:34लेकिन टीमों के लिए, यह अलग तरह से काम करता है।
00:01:36एजेंट टीम का प्रत्येक सदस्य पूरी तरह से स्वतंत्र टर्मिनल सत्र होता है।
00:01:40वे किसी ऐसे ऑर्केस्ट्रेटर द्वारा प्रतिबंधित या समन्वित नहीं होते हैं जो केवल कार्यों को विभाजित करता है।
00:01:43इसके बजाय, इन टर्मिनल सत्रों को मुख्य टीम लीड द्वारा खोला और बंद किया जाता है।
00:01:47वे संवाद करने की अपनी क्षमता के कारण उन कार्यों पर काम करने में सक्षम हैं
00:01:52जिनमें एजेंटों के बीच चर्चा और सहयोग की आवश्यकता होती है।
00:01:54तो एक एजेंट टीम में अनिवार्य रूप से एक टीम लीड और टीम के साथी होते हैं।
00:01:57टीम लीड मुख्य एजेंट है जो टीम बनाता है और उनके काम का समन्वय करता है।
00:02:01टीम के साथी वे कार्यकर्ता हैं जो वास्तव में कार्यों को पूरा करते हैं।
00:02:03प्रत्येक टीम साथी को एक कार्य सूची प्राप्त होती है, जो वस्तुओं की एक साझा सूची होती है।
00:02:07प्रत्येक सदस्य इस सूची से पहचानता है कि उसे क्या करना है और उसे निष्पादित करता है।
00:02:10संवाद करने के लिए, उनके पास एक साझा मेलबॉक्स भी होता है जो उन्हें एक-दूसरे को संदेश भेजने की अनुमति देता है।
00:02:15अब सवाल यह था कि अगर टीम का हर सदस्य स्वतंत्र है तो यह वास्तव में कैसे काम करता है।
00:02:19उन्हें कैसे पता चलता है कि दूसरे सदस्य क्या कर रहे हैं?
00:02:21यह इसलिए काम करता है क्योंकि टीम, सदस्यों और उन कार्यों के बारे में सारी जानकारी जो प्रत्येक सदस्य
00:02:26कर रहा है, स्थानीय रूप से .claud फ़ोल्डर में संग्रहीत होती है और कार्य के नाम से पहचानी जाती है।
00:02:30यह फीचर अभी भी प्रयोगात्मक है और डिफ़ॉल्ट रूप से अक्षम है, इसलिए इस चरण के दौरान
00:02:34टीम के साथी के संचालन में कुछ बग होने वाले हैं।
00:02:36इसे आज़माने के लिए, हमें इसे मैन्युअल रूप से सक्षम करना पड़ा।
00:02:38हमने प्रयोगात्मक एजेंट टीमों के लिए क्लाउड कोड CLI फ़्लैग को 1 पर सेट करके ऐसा किया।
00:02:43इस CLI फ़्लैग के सक्षम होने के साथ, एजेंट टीमें आगे के सत्रों में उपयोग के लिए उपलब्ध थीं।
00:02:47इस फ़्लैग के सक्षम होने पर, हम क्लाउड कोड में टीम फीचर तक पहुँचने में सक्षम थे।
00:02:51चूंकि यह एक प्रयोगात्मक फीचर है, इसलिए हमें विशिष्ट शब्दों का उपयोग करने की आवश्यकता थी जो
00:02:55क्लाउड को बताते हैं कि हम किसी खास काम के लिए एजेंट टीम का उपयोग करना चाहते हैं।
00:02:58हमारी टीम ने कोड समीक्षा को समानांतर करने के लिए इस फीचर का उपयोग करना शुरू कर दिया है, जिससे
00:03:02कोड की समस्याओं को एक ही समय में पहचाना और ठीक किया जा सके।
00:03:04ऐसा करने के लिए, हमने क्लाउड से कोड बेस में समस्याएँ खोजने के लिए एक टीम सदस्य का उपयोग करने और
00:03:08दूसरे सदस्य को पहले सदस्य द्वारा पहचानी गई समस्याओं को ठीक करने के लिए कहा।
00:03:11इसे सही दिशा में ले जाने के लिए हमें प्रॉम्प्ट में काफी विस्तृत होना पड़ा।
00:03:15अब, यदि सब-एजेंट इसे संभाल रहे होते, तो वे दूसरे एजेंटों को यह बताने के लिए कि क्या ठीक करना है,
00:03:19किसी भौतिक फ़ाइल में एक रिपोर्ट लिख रहे होते।
00:03:21लेकिन यहाँ हम किसी स्थानीय फ़ाइल में लिखने के झंझट के बिना
00:03:26समीक्षा प्रक्रिया को तेज़ करना चाहते थे।
00:03:27जब हमने क्लाउड कोड को प्रॉम्प्ट दिया, तो टीम के सदस्य पैदा हुए, जिनमें से प्रत्येक
00:03:31टीम लीड द्वारा नियंत्रित था।
00:03:32लीड एजेंट ने व्यक्तिगत एजेंटों को प्रॉम्प्ट दिया, उन्हें बताया कि कौन सा कार्य करना है।
00:03:36अब पहले कोड समीक्षक एजेंट ने काम करना शुरू किया, और कार्य का विश्लेषण करने के बाद, इसने
00:03:40एक-एक करके बग के बारे में कोड फिक्सर के साथ संदेश साझा किए।
00:03:42यह एजेंट महत्वपूर्ण सुरक्षा मुद्दों को प्राथमिकता दे रहा था, और जैसे ही कोड फिक्सर को
00:03:47कोड समीक्षक से संदेश मिले, उसने समाधान लागू करना शुरू कर दिया जबकि कोड समीक्षक
00:03:51और अधिक मुद्दों की तलाश करना जारी रखा।
00:03:53इसी तरह, वे एक-दूसरे से बात करते रहे और लागू किए गए बदलावों की रिपोर्ट देते रहे।
00:03:57एक बार महत्वपूर्ण मुद्दे पूरे हो जाने के बाद, दोनों एजेंट मध्यम
00:04:01प्राथमिकता वाले मुद्दों को ठीक करने की ओर बढ़े।
00:04:02कोड समीक्षा और कोड फिक्सिंग एक साथ हो रहे थे, जिससे काफी समय बचा।
00:04:06इसकी अच्छी बात यह है कि आप टीम के किसी सदस्य के लिए कोई भी कार्य सौंप या संशोधित कर सकते हैं।
00:04:10इसके सक्षम होने से, आप उस विशिष्ट टीम सदस्य के काम की दिशा को नियंत्रित कर सकते हैं।
00:04:14एजेंटों का काम पूरा होने के बाद, नियंत्रण वापस मुख्य एजेंट को सौंप दिया गया, जो
00:04:18यह सुनिश्चित करने के लिए जिम्मेदार है कि आवश्यक बदलाव सही ढंग से लागू किए गए हैं और इन
00:04:22एजेंटों को शांति से बंद करने के लिए, ताकि उनके बाहर निकलने से बाद में कोई त्रुटि न हो।
00:04:26आपने शायद गौर किया होगा कि हम इन वीडियो में बहुत कुछ बनाते हैं।
00:04:28सभी प्रॉम्प्ट, कोड, टेम्प्लेट, यानी वो सब कुछ जिसे आपको सामान्य रूप से
00:04:32वीडियो रोककर स्क्रीन से कॉपी करना पड़ता, वह सब हमारे कम्युनिटी में, इस वीडियो और
00:04:36इससे पहले के हर वीडियो के लिए उपलब्ध है।
00:04:37लिंक विवरण में दिए गए हैं।
00:04:38बड़े पैमाने पर समस्याओं को खोजना और ठीक करना एक बहुत अच्छी बात है, लेकिन अक्सर ऐसे मामले होते हैं जहाँ आपको समस्याएँ मिलती हैं
00:04:43और आप यह नहीं समझ पाते कि उनका कारण क्या है।
00:04:45उन मामलों में, हम एक ही ऐप के कई दृष्टिकोणों का परीक्षण करने के लिए एक एजेंट टीम का उपयोग कर सकते हैं
00:04:49और बग की ओर धीरे-धीरे बढ़ सकते हैं।
00:04:51इस तरह, टीम के सदस्य अपने निष्कर्षों को एक-दूसरे को बता सकते हैं और साथ मिलकर आगे बढ़ सकते हैं।
00:04:55हमने क्लाउड को कोड बेस में एक बग खोजने के लिए कहा और कई टीम सदस्यों का उपयोग करने का निर्देश दिया,
00:04:59जिससे वे समस्या को विभिन्न दृष्टिकोणों से देख सकें।
00:05:02इसके बाद इसने चार सब-एजेंटों को जन्म दिया, जिनमें से प्रत्येक एक ही ऐप के अलग-अलग दृष्टिकोण पर केंद्रित था।
00:05:06उन्हें टीम लीड से समान प्रॉम्प्ट मिले और उन्होंने एप्लिकेशन के अपने विशिष्ट पहलू के आधार पर
00:05:09त्रुटियों की जांच की, जबकि मुख्य लीड ने उनके समाप्त होने की प्रतीक्षा की और
00:05:14फिर उनके शोध से प्राप्त निष्कर्षों का विश्लेषण किया।
00:05:16टीमों के बिना, हमारे पास एक ही थ्रेड होता, जिसमें बहुत अधिक समय लगता।
00:05:19लेकिन इन एजेंटों के साथ, प्रक्रिया बहुत तेज़ थी।
00:05:22जांच जल्दी पूरी हो गई, और एजेंटों द्वारा सारा शोध लगभग
00:05:272 से 3 मिनट में किया गया, जो लीनियर चेकिंग की तुलना में एक महत्वपूर्ण सुधार है, जिसमें
00:05:31आसानी से 5 से 10 मिनट लग जाते।
00:05:33एक बात जिसका ध्यान रखना है वह यह है कि यह दृष्टिकोण बहुत सारे टोकन खर्च करता है, क्योंकि प्रत्येक एजेंट का
00:05:37अपना कॉन्टेक्स्ट विंडो होता है, इसलिए हमें उस बारे में सावधान रहने की आवश्यकता है।
00:05:40एक बार जब एजेंटों ने अपना आउटपुट दे दिया और उन्हें बंद कर दिया गया, तो टीम लीड ने भी
00:05:45स्वयं जाँच करके परिणामों का सत्यापन किया।
00:05:46सभी चार एजेंट एक ही बग पर सहमत हुए, और उन्होंने सही ढंग से use effect में
00:05:50एक पुराने क्लोजर (stale closure) के साथ समस्या की ओर इशारा किया।
00:05:52ठीक इसी हिस्से को चारों एजेंटों ने चिन्हित किया था।
00:05:54साथ ही, यदि आप हमारी सामग्री का आनंद ले रहे हैं, तो हाइप बटन दबाने पर विचार करें, क्योंकि यह
00:05:59हमें ऐसी और सामग्री बनाने और अधिक लोगों तक पहुँचने में मदद करता है।
00:06:02इस एजेंट फ्रेमवर्क ने लंबी अवधि के कार्यों पर हमारे काम करने के तरीके को बदल दिया है, क्योंकि उनकी क्षमताओं के साथ,
00:06:07एजेंटों को केवल अपनी प्रगति का दस्तावेजीकरण करने पर निर्भर नहीं रहना पड़ता है।
00:06:10एजेंट टीमों के साथ, हम समानांतर में एक एप्लिकेशन के विभिन्न पहलुओं को संभाल सकते हैं, और
00:06:14शोध को संभालने के लिए एक सदस्य को समर्पित भी कर सकते हैं।
00:06:16जब हमने क्लाउड को प्रॉम्प्ट दिया, तो इसने 6 एजेंटों को जन्म दिया।
00:06:19दो शोध और बुनियादी ढांचा तैयार करने पर काम कर रहे थे, जबकि बाकी
00:06:23पेज बनाने के लिए थे।
00:06:24बिल्डर एजेंट उस एजेंट द्वारा रुके हुए थे जो बुनियादी ढांचा तैयार कर रहा था, क्योंकि वह
00:06:28आवश्यक पैकेज इंस्टॉल करने और सभी डिपेंडेंसी के साथ वातावरण तैयार करने के लिए जिम्मेदार था।
00:06:32प्रत्येक एजेंट को उनके काम को परिभाषित करने वाला एक विशिष्ट प्रॉम्प्ट मिला।
00:06:35रुके हुए एजेंट टीम लीड से अनब्लॉक सिग्नल की प्रतीक्षा करते रहे।
00:06:38एक बार शोध और बुनियादी काम पूरा हो जाने के बाद, शेष एजेंटों को अनब्लॉक कर दिया गया और उन्होंने
00:06:43एप्लिकेशन के अपने संबंधित हिस्सों को साथ-साथ लागू करना शुरू कर दिया।
00:06:46वे प्रत्येक घटक के बीच स्थिरता के लिए एक-दूसरे के साथ संवाद करते रहे।
00:06:49टीम लीड एजेंटों के साथ समन्वय करती रही, और जैसे ही कोई एजेंट समाप्त हुआ, टीम लीड ने
00:06:53उस एजेंट को शटडाउन संदेश भेजा, जिससे उसका बाहर निकलना सुचारू रूप से संपन्न हुआ।
00:06:57इस पूरी प्रक्रिया में कॉन्टेक्स्ट विंडो के लगभग 170k टोकन खर्च हुए, लेकिन अंत में,
00:07:02हमें ऐप ठीक वैसा ही मिला जैसा हम चाहते थे, वह भी सिर्फ एक प्रॉम्प्ट से।
00:07:05जैसा कि हमने वीडियो में उल्लेख किया है, जब हमारी टीम इसका परीक्षण कर रही थी, तो हमें
00:07:09एजेंट टीमों को हमारे लिए बेहतर ढंग से काम करने के कई तरीके मिले, और ये सर्वोत्तम अभ्यास
00:07:13AI Labs Pro में उपलब्ध हैं, ताकि आप उन्हें स्वयं आज़मा सकें।
00:07:16पहली सिफारिश आम तौर पर सभी एजेंटों पर लागू होती है, और केवल
00:07:20एजेंट टीम फीचर तक सीमित नहीं है।
00:07:21आपको स्पष्ट रूप से उस दायरे को निर्दिष्ट करने की आवश्यकता है जहाँ एजेंट को काम करना चाहिए।
00:07:25आप इसे या तो प्रॉम्प्ट में परिभाषित करके कर सकते हैं, यह निर्दिष्ट करते हुए कि कार्य करने के लिए
00:07:29किन फ़ाइलों को देखना है, या प्रोजेक्ट में व्यक्तिगत कार्यों वाले दस्तावेज़ बनाकर,
00:07:33जैसा कि हमने अपने वर्कफ्लो के लिए किया था, जहाँ हमने प्रत्येक असाइनमेंट के लिए एक उचित टास्क डॉक्यूमेंट तैयार किया
00:07:38ताकि एजेंट स्वतंत्र रूप से और सही दायरे में काम कर सके।
00:07:41ध्यान रखने वाली एक और बात यह है कि इनमें से प्रत्येक एजेंट को एक-दूसरे से स्वतंत्र
00:07:45कार्यों पर काम करना चाहिए, क्योंकि यदि वे एक ही समय में एक ही फ़ाइल को संपादित कर रहे हैं, तो यह
00:07:49एक संघर्ष (conflict) पैदा करेगा और सामग्री को ओवरराइट करने का कारण बन सकता है।
00:07:52इसके अलावा, कई बार हमने पाया कि मुख्य एजेंट अधीर हो जाता
00:07:56यदि कोई एजेंट किसी कार्य को पूरा करने में लंबा समय लेता है और वह खुद ही कार्य को लागू करना शुरू कर देता है
00:08:00बजाय इसके कि टीम के साथियों को उसे पूरा करने दे, इसलिए मुख्य एजेंट को यह याद दिलाना महत्वपूर्ण है कि
00:08:04आगे बढ़ने से पहले टीम के साथियों के पूरा होने की प्रतीक्षा करें।
00:08:06आपको कार्यों के आकार को भी ठीक से निर्धारित करने की आवश्यकता है।
00:08:08यदि आप बहुत छोटे कार्य सौंपते हैं, तो यह समन्वय का बोझ पैदा करता है।
00:08:11यदि कार्य बहुत बड़े हैं, तो इससे प्रयासों के बर्बाद होने का जोखिम बढ़ जाता है, इसलिए कार्यों को संतुलित
00:08:16और आत्मनिर्भर होना चाहिए।
00:08:17अंत में, आपको एजेंट के काम की निगरानी करने की आवश्यकता है।
00:08:19यदि कोई एजेंट उम्मीद के मुताबिक प्रदर्शन नहीं कर रहा है, तो आप उसके निष्पादन को रोक सकते हैं और उसे
00:08:23नये निर्देश दे सकते हैं कि उसे क्या करना चाहिए।
00:08:25इन अभ्यासों का पालन करना इस प्रयोगात्मक सुविधा का उपयोग करना बहुत अधिक प्रभावी बनाता है।
00:08:29यह हमें इस वीडियो के अंत तक ले आता है।
00:08:31यदि आप चैनल का समर्थन करना चाहते हैं और हमें इस तरह के वीडियो बनाना जारी रखने में मदद करना चाहते हैं, तो आप
00:08:35नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके ऐसा कर सकते हैं।
00:08:38हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।