00:00:00लोग Kimi 2.5 के पीछे दीवाने हो रहे हैं। यह एक ओपन-सोर्स मॉडल है जिसके बेंचमार्क
00:00:05Opus से बेहतर हैं और इसमें एक बेहद स्मार्ट 'एजेंट स्वॉर्म' मोड है जहाँ एक ऑर्केस्ट्रेटर 100 तक
00:00:11विशेषज्ञ एजेंट बना सकता है। लेकिन क्या आपको पता है कि यह फीचर Claude के कोड में भी
00:00:17एक छिपे हुए फ्लैग के पीछे मौजूद है और इसे ट्विटर पर एक यूजर ने खोजा है? किसी ने इसे कैसे ढूँढा? और क्या
00:00:23Anthropic ने Kimi से यह आइडिया चुराया है? सब्सक्राइब करें और चलिए विस्तार से जानते हैं। Anthropic ने
00:00:30पिछले साल जुलाई में कस्टम सब-एजेंट्स की घोषणा की थी और तब से लोग इनका उपयोग कई तरह के
00:00:35खास कामों के लिए कर रहे हैं। हमने तब इस पर एक वीडियो भी बनाया था। लेकिन ये सब-एजेंट्स
00:00:41पूरी स्थिति का केवल एक हिस्सा ही देख पाते हैं क्योंकि उन्हें एक खास काम के लिए बनाया गया है। वे अपना
00:00:48काम करते हैं, डेटा देते हैं और उनकी याददाश्त फिर से खाली हो जाती है। इसलिए लोगों ने सब-एजेंट्स से
00:00:54उनके नतीजों को मार्कडाउन फाइल में लिखवाकर और एक मेन कॉन्टेक्स्ट फाइल को अपडेट करवाकर मेमोरी बनाई।
00:01:01ताकि अगर उसी या किसी और सब-एजेंट से बदलाव करने को कहा जाए, तो वे उन फाइल्स को पढ़ सकें
00:01:06और जान सकें कि काम कहाँ छूटा था। पर आपको अब भी खुद सब-एजेंट बनाने पड़ते हैं,
00:01:12उन्हें रोल देना, खास स्किल्स, टूल्स और परमिशन देना पड़ता है। यहीं Kimi का नया
00:01:19एजेंट स्वॉर्म बाजी मार लेता है क्योंकि इसमें ऑर्केस्ट्रेटर खुद ही किसी खास काम के लिए
00:01:25सब-एजेंट बनाता है, आपको कुछ नहीं करना पड़ता। ये सब-एजेंट्स
00:01:31एक साथ मिलकर काम कर सकते हैं और अपना हिस्सा पूरा होने पर वे डेटा
00:01:36ऑर्केस्ट्रेटर को दे देते हैं, जो तय करता है कि क्या उस डेटा के साथ नए सब-एजेंट्स बनाने की
00:01:42जरूरत है। Kimi का एजेंट स्वॉर्म अभी एक रिसर्च प्रोजेक्ट है लेकिन यह
00:01:48सिंगल एजेंट वर्कफ्लो की तुलना में काफी सुधार दिखा रहा है। इस ग्राफ को देखिए, काम चाहे जितना भी
00:01:53पेचीदा हो, परफॉर्मेंस स्थिर रहती है क्योंकि एजेंट एक साथ मिलकर काम करते हैं।
00:01:58सच कहूँ तो, आप Claude के कोड में ऐसा पहले से ही कुछ हद तक कर सकते हैं।
00:02:04इसके नए टास्क फीचर से आप टास्क की लिस्ट बनाकर उन्हें अलग-अलग सब-एजेंट्स को सौंप सकते हैं।
00:02:10दिक्कत यह है कि ये सब-एजेंट्स सामान्य होते हैं, उस खास काम के विशेषज्ञ नहीं।
00:02:15मुझे यह भी पक्का नहीं है कि Claude खुद सही सब-एजेंट को काम सौंप पाता है या नहीं।
00:02:21अगर आपने इसे ट्राई किया है तो कमेंट्स में बताएं। लेकिन ऐसा लगता है कि
00:02:25Claude की टीम एक ऐसे तरीके पर काम कर रही है जिससे ऑर्केस्ट्रेटर खुद जरूरत के हिसाब से
00:02:31सब-एजेंट बना सके। यह फीचर एक फ्लैग के पीछे छिपा था जिसे Mike Kelly ने ढूँढा,
00:02:37उन्होंने अपने ट्वीट में दिखाया कि यह कैसे काम करता है। साथ ही उन्होंने एक रेपो का लिंक भी दिया है
00:02:42जिसे “Claude Sneak Peek” कहा गया है। चलिए इसे आजमाते हैं। यह एआई द्वारा बनाया गया एक प्लान है,
00:02:48XDL नाम के टूल के लिए वेब फ्रंट-एंड बनाने का, जिससे आप टर्मिनल में X या ट्विटर से वीडियो डाउनलोड कर सकते हैं।
00:02:55मैंने Claude Sneak Peek पहले ही इंस्टॉल कर लिया है जो
00:03:00Claude कोड के एक छोटे वर्जन जैसा दिखता है। मैं इसे plan.md फाइल पढ़ने और ऐसे टास्क बनाने को कहूँगा
00:03:05जिन्हें एजेंटों की एक टोली (स्वॉर्म) पूरा कर सके। टास्क बनने के बाद, मैं इसे
00:03:11सब-एजेंट्स के जरिए उन्हें पूरा करने को कहूँगा। पर उससे पहले,
00:03:16यह कन्फर्म करने के लिए कि मेरे पास कोई कस्टम सब-एजेंट नहीं है, मैं /agent कमांड चलाता हूँ
00:03:21और आप देख सकते हैं कि यहाँ कोई विशेषज्ञ या कस्टम सब-एजेंट मौजूद नहीं है। तो अब यह
00:03:26काम शुरू कर रहा है, और इसने फ्रंट-एंड टास्क के लिए खुद ही एक 'फ्रंट-एंड बिल्डर' सब-एजेंट जोड़ दिया है।
00:03:32आप यहाँ देख सकते हैं कि एक पूरी टीम है। अगर आप नीचे स्क्रॉल करें, तो यहाँ पाँच
00:03:37एजेंट्स हैं: टीम लीड, QA टेस्टर, बैक-एंड बिल्डर, कंपोनेंट बिल्डर और फ्रंट-एंड बिल्डर,
00:03:42जो एक साथ काम कर रहे हैं। हम यह भी देख सकते हैं कि टीम का हर एजेंट क्या कर रहा है।
00:03:48QA टेस्टर पैटर्न खोज रहा है, बैक-एंड बिल्डर भी वही कर रहा है
00:03:53और फाइल्स पढ़ रहा है, और कंपोनेंट बिल्डर और फ्रंट-एंड बिल्डर भी अपने काम में लगे हैं।
00:03:57अगर हमें देखना है कि कोई एजेंट क्या कर रहा है, तो हम एंटर दबाकर एजेंट व्यू में जा सकते हैं
00:04:02जहाँ उसका सिस्टम प्रॉम्प्ट दिखता है। वापस जाने पर हम देखते हैं कि अब हमारे पास आठ एजेंट हैं।
00:04:07एक कंपोनेंट क्रिएटर, API सर्वर, सेटअप करने वाला, API जोड़ने वाला और अब
00:04:13कोई CSS का काम भी कर रहा है। हमारी टीम बढ़ती ही जा रही है। अगर हम टीम लीड पर क्लिक करें,
00:04:18तो हम वापस मेन Claude कोड व्यू में आ जाते हैं, यानी टीम लीड ही मुख्य ऑर्केस्ट्रेटर है।
00:04:24मेन व्यू में हम हर सब-एजेंट का करंट स्टेटस भी देख सकते हैं,
00:04:29और अगर मैं थोड़ा ज़ूम आउट करके ऊपर स्क्रॉल करूँ, तो सभी एजेंट्स के मैसेज देखे जा सकते हैं।
00:04:34सारे टास्क पूरे होने पर हमें एक 'स्वॉर्म प्रोजेक्ट कम्प्लीट' फाइल मिलती है,
00:04:41जो बताती है कि क्या-क्या किया गया। साथ ही एक 'स्वॉर्म एग्जीक्यूशन रिपोर्ट' भी मिलती है जिसमें
00:04:47इस्तेमाल किए गए एजेंट्स की संख्या, उनके रोल और काम पूरा होने की जानकारी होती है।
00:04:52हम नीचे स्क्रॉल करके विस्तार से देख सकते हैं कि हर एजेंट ने क्या किया। जितना काम
00:04:59Claude की टीम ने इस फीचर पर किया है, उसे देखकर मुझे नहीं लगता कि उन्होंने Kimi की नकल की है।
00:05:04शायद उन्होंने ऑनलाइन इसके दूसरे इम्प्लीमेंटेशन देखे होंगे और इसे Claude में जोड़ना चाहा होगा।
00:05:10मैं समझ सकता हूँ कि उन्होंने इसे अभी रिलीज क्यों नहीं किया। पहली बात तो यह कि शायद
00:05:16इसे Kimi 2.5 जितनी ट्रेनिंग नहीं मिली है। साथ ही, उन यूजर्स के लिए चीजें पेचीदा हो सकती हैं
00:05:22जिनके पास पहले से कई सब-एजेंट्स हैं। उदाहरण के लिए, किसी मुश्किल काम के लिए
00:05:28ऑर्केस्ट्रेटर को कैसे पता चलेगा कि नया फ्रंट-एंड एजेंट बनाना है या यूजर के पुराने
00:05:35सब-एजेंट का इस्तेमाल करना है? वह ये फैसला किन आंकड़ों के आधार पर लेगा? और स्किल्स इसे
00:05:42और भी पेचीदा बना देते हैं। अगर यूजर ने पहले से बहुत से स्किल्स डाउनलोड किए हैं, तो ऑर्केस्ट्रेटर
00:05:49उन्हें कैसे इस्तेमाल करेगा या नए स्किल्स कब डाउनलोड करेगा? मेरा मतलब है कि
00:05:56अगर Anthropic इसे रिलीज करता है, तो ऑर्केस्ट्रेटर को पहले से मौजूद डेटा, टूल्स और स्किल्स
00:06:02की जाँच करनी होगी, तभी वह तय कर पाएगा कि नया सब-एजेंट बनाना है या नहीं।
00:06:10मुझे नहीं पता कि टीम अभी इस पर काम कर रही है या उन्होंने
00:06:16इसे बहुत पेचीदा मानकर छोड़ दिया है। मुझे वाकई नहीं पता।
00:06:22फीचर्स की बात करें, तो अगर आप किसी प्रोजेक्ट में तेजी से नए फीचर्स जोड़ रहे हैं
00:06:28और चाहते हैं कि चीजें न बिगड़ें, तो आपको Betastack जरूर देखना चाहिए। यह आपके
00:06:33सर्वर के लॉग्स को मॉनिटर करता है और गड़बड़ी होने से पहले ही आपको चेतावनी दे देता है।
00:06:38इसमें फ्रंट-एंड की गलतियों को पकड़ने के लिए AI-आधारित एरर ट्रैकिंग भी है।
00:06:44तो आज ही Betastack को चेक करें।