Claude Code का गुप्त Agent Swarm (क्या यह Kimi K2.5 से बेहतर है?)

BBetter Stack
Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00लोग Kimi 2.5 के पीछे दीवाने हो रहे हैं। यह एक ओपन-सोर्स मॉडल है जिसके बेंचमार्क
00:00:05Opus से बेहतर हैं और इसमें एक बेहद स्मार्ट 'एजेंट स्वॉर्म' मोड है जहाँ एक ऑर्केस्ट्रेटर 100 तक
00:00:11विशेषज्ञ एजेंट बना सकता है। लेकिन क्या आपको पता है कि यह फीचर Claude के कोड में भी
00:00:17एक छिपे हुए फ्लैग के पीछे मौजूद है और इसे ट्विटर पर एक यूजर ने खोजा है? किसी ने इसे कैसे ढूँढा? और क्या
00:00:23Anthropic ने Kimi से यह आइडिया चुराया है? सब्सक्राइब करें और चलिए विस्तार से जानते हैं। Anthropic ने
00:00:30पिछले साल जुलाई में कस्टम सब-एजेंट्स की घोषणा की थी और तब से लोग इनका उपयोग कई तरह के
00:00:35खास कामों के लिए कर रहे हैं। हमने तब इस पर एक वीडियो भी बनाया था। लेकिन ये सब-एजेंट्स
00:00:41पूरी स्थिति का केवल एक हिस्सा ही देख पाते हैं क्योंकि उन्हें एक खास काम के लिए बनाया गया है। वे अपना
00:00:48काम करते हैं, डेटा देते हैं और उनकी याददाश्त फिर से खाली हो जाती है। इसलिए लोगों ने सब-एजेंट्स से
00:00:54उनके नतीजों को मार्कडाउन फाइल में लिखवाकर और एक मेन कॉन्टेक्स्ट फाइल को अपडेट करवाकर मेमोरी बनाई।
00:01:01ताकि अगर उसी या किसी और सब-एजेंट से बदलाव करने को कहा जाए, तो वे उन फाइल्स को पढ़ सकें
00:01:06और जान सकें कि काम कहाँ छूटा था। पर आपको अब भी खुद सब-एजेंट बनाने पड़ते हैं,
00:01:12उन्हें रोल देना, खास स्किल्स, टूल्स और परमिशन देना पड़ता है। यहीं Kimi का नया
00:01:19एजेंट स्वॉर्म बाजी मार लेता है क्योंकि इसमें ऑर्केस्ट्रेटर खुद ही किसी खास काम के लिए
00:01:25सब-एजेंट बनाता है, आपको कुछ नहीं करना पड़ता। ये सब-एजेंट्स
00:01:31एक साथ मिलकर काम कर सकते हैं और अपना हिस्सा पूरा होने पर वे डेटा
00:01:36ऑर्केस्ट्रेटर को दे देते हैं, जो तय करता है कि क्या उस डेटा के साथ नए सब-एजेंट्स बनाने की
00:01:42जरूरत है। Kimi का एजेंट स्वॉर्म अभी एक रिसर्च प्रोजेक्ट है लेकिन यह
00:01:48सिंगल एजेंट वर्कफ्लो की तुलना में काफी सुधार दिखा रहा है। इस ग्राफ को देखिए, काम चाहे जितना भी
00:01:53पेचीदा हो, परफॉर्मेंस स्थिर रहती है क्योंकि एजेंट एक साथ मिलकर काम करते हैं।
00:01:58सच कहूँ तो, आप Claude के कोड में ऐसा पहले से ही कुछ हद तक कर सकते हैं।
00:02:04इसके नए टास्क फीचर से आप टास्क की लिस्ट बनाकर उन्हें अलग-अलग सब-एजेंट्स को सौंप सकते हैं।
00:02:10दिक्कत यह है कि ये सब-एजेंट्स सामान्य होते हैं, उस खास काम के विशेषज्ञ नहीं।
00:02:15मुझे यह भी पक्का नहीं है कि Claude खुद सही सब-एजेंट को काम सौंप पाता है या नहीं।
00:02:21अगर आपने इसे ट्राई किया है तो कमेंट्स में बताएं। लेकिन ऐसा लगता है कि
00:02:25Claude की टीम एक ऐसे तरीके पर काम कर रही है जिससे ऑर्केस्ट्रेटर खुद जरूरत के हिसाब से
00:02:31सब-एजेंट बना सके। यह फीचर एक फ्लैग के पीछे छिपा था जिसे Mike Kelly ने ढूँढा,
00:02:37उन्होंने अपने ट्वीट में दिखाया कि यह कैसे काम करता है। साथ ही उन्होंने एक रेपो का लिंक भी दिया है
00:02:42जिसे “Claude Sneak Peek” कहा गया है। चलिए इसे आजमाते हैं। यह एआई द्वारा बनाया गया एक प्लान है,
00:02:48XDL नाम के टूल के लिए वेब फ्रंट-एंड बनाने का, जिससे आप टर्मिनल में X या ट्विटर से वीडियो डाउनलोड कर सकते हैं।
00:02:55मैंने Claude Sneak Peek पहले ही इंस्टॉल कर लिया है जो
00:03:00Claude कोड के एक छोटे वर्जन जैसा दिखता है। मैं इसे plan.md फाइल पढ़ने और ऐसे टास्क बनाने को कहूँगा
00:03:05जिन्हें एजेंटों की एक टोली (स्वॉर्म) पूरा कर सके। टास्क बनने के बाद, मैं इसे
00:03:11सब-एजेंट्स के जरिए उन्हें पूरा करने को कहूँगा। पर उससे पहले,
00:03:16यह कन्फर्म करने के लिए कि मेरे पास कोई कस्टम सब-एजेंट नहीं है, मैं /agent कमांड चलाता हूँ
00:03:21और आप देख सकते हैं कि यहाँ कोई विशेषज्ञ या कस्टम सब-एजेंट मौजूद नहीं है। तो अब यह
00:03:26काम शुरू कर रहा है, और इसने फ्रंट-एंड टास्क के लिए खुद ही एक 'फ्रंट-एंड बिल्डर' सब-एजेंट जोड़ दिया है।
00:03:32आप यहाँ देख सकते हैं कि एक पूरी टीम है। अगर आप नीचे स्क्रॉल करें, तो यहाँ पाँच
00:03:37एजेंट्स हैं: टीम लीड, QA टेस्टर, बैक-एंड बिल्डर, कंपोनेंट बिल्डर और फ्रंट-एंड बिल्डर,
00:03:42जो एक साथ काम कर रहे हैं। हम यह भी देख सकते हैं कि टीम का हर एजेंट क्या कर रहा है।
00:03:48QA टेस्टर पैटर्न खोज रहा है, बैक-एंड बिल्डर भी वही कर रहा है
00:03:53और फाइल्स पढ़ रहा है, और कंपोनेंट बिल्डर और फ्रंट-एंड बिल्डर भी अपने काम में लगे हैं।
00:03:57अगर हमें देखना है कि कोई एजेंट क्या कर रहा है, तो हम एंटर दबाकर एजेंट व्यू में जा सकते हैं
00:04:02जहाँ उसका सिस्टम प्रॉम्प्ट दिखता है। वापस जाने पर हम देखते हैं कि अब हमारे पास आठ एजेंट हैं।
00:04:07एक कंपोनेंट क्रिएटर, API सर्वर, सेटअप करने वाला, API जोड़ने वाला और अब
00:04:13कोई CSS का काम भी कर रहा है। हमारी टीम बढ़ती ही जा रही है। अगर हम टीम लीड पर क्लिक करें,
00:04:18तो हम वापस मेन Claude कोड व्यू में आ जाते हैं, यानी टीम लीड ही मुख्य ऑर्केस्ट्रेटर है।
00:04:24मेन व्यू में हम हर सब-एजेंट का करंट स्टेटस भी देख सकते हैं,
00:04:29और अगर मैं थोड़ा ज़ूम आउट करके ऊपर स्क्रॉल करूँ, तो सभी एजेंट्स के मैसेज देखे जा सकते हैं।
00:04:34सारे टास्क पूरे होने पर हमें एक 'स्वॉर्म प्रोजेक्ट कम्प्लीट' फाइल मिलती है,
00:04:41जो बताती है कि क्या-क्या किया गया। साथ ही एक 'स्वॉर्म एग्जीक्यूशन रिपोर्ट' भी मिलती है जिसमें
00:04:47इस्तेमाल किए गए एजेंट्स की संख्या, उनके रोल और काम पूरा होने की जानकारी होती है।
00:04:52हम नीचे स्क्रॉल करके विस्तार से देख सकते हैं कि हर एजेंट ने क्या किया। जितना काम
00:04:59Claude की टीम ने इस फीचर पर किया है, उसे देखकर मुझे नहीं लगता कि उन्होंने Kimi की नकल की है।
00:05:04शायद उन्होंने ऑनलाइन इसके दूसरे इम्प्लीमेंटेशन देखे होंगे और इसे Claude में जोड़ना चाहा होगा।
00:05:10मैं समझ सकता हूँ कि उन्होंने इसे अभी रिलीज क्यों नहीं किया। पहली बात तो यह कि शायद
00:05:16इसे Kimi 2.5 जितनी ट्रेनिंग नहीं मिली है। साथ ही, उन यूजर्स के लिए चीजें पेचीदा हो सकती हैं
00:05:22जिनके पास पहले से कई सब-एजेंट्स हैं। उदाहरण के लिए, किसी मुश्किल काम के लिए
00:05:28ऑर्केस्ट्रेटर को कैसे पता चलेगा कि नया फ्रंट-एंड एजेंट बनाना है या यूजर के पुराने
00:05:35सब-एजेंट का इस्तेमाल करना है? वह ये फैसला किन आंकड़ों के आधार पर लेगा? और स्किल्स इसे
00:05:42और भी पेचीदा बना देते हैं। अगर यूजर ने पहले से बहुत से स्किल्स डाउनलोड किए हैं, तो ऑर्केस्ट्रेटर
00:05:49उन्हें कैसे इस्तेमाल करेगा या नए स्किल्स कब डाउनलोड करेगा? मेरा मतलब है कि
00:05:56अगर Anthropic इसे रिलीज करता है, तो ऑर्केस्ट्रेटर को पहले से मौजूद डेटा, टूल्स और स्किल्स
00:06:02की जाँच करनी होगी, तभी वह तय कर पाएगा कि नया सब-एजेंट बनाना है या नहीं।
00:06:10मुझे नहीं पता कि टीम अभी इस पर काम कर रही है या उन्होंने
00:06:16इसे बहुत पेचीदा मानकर छोड़ दिया है। मुझे वाकई नहीं पता।
00:06:22फीचर्स की बात करें, तो अगर आप किसी प्रोजेक्ट में तेजी से नए फीचर्स जोड़ रहे हैं
00:06:28और चाहते हैं कि चीजें न बिगड़ें, तो आपको Betastack जरूर देखना चाहिए। यह आपके
00:06:33सर्वर के लॉग्स को मॉनिटर करता है और गड़बड़ी होने से पहले ही आपको चेतावनी दे देता है।
00:06:38इसमें फ्रंट-एंड की गलतियों को पकड़ने के लिए AI-आधारित एरर ट्रैकिंग भी है।
00:06:44तो आज ही Betastack को चेक करें।

Key Takeaway

यह वीडियो Claude Code के एक छिपे हुए 'एजेंट स्वॉर्म' फीचर का विश्लेषण करता है जो Kimi 2.5 को टक्कर देता है और स्वायत्त एआई टीमों के माध्यम से जटिल कोडिंग कार्यों को स्वचालित करता है।

Highlights

Kimi 2.5 एक शक्तिशाली ओपन-सोर्स मॉडल है जो अपने 'एजेंट स्वॉर्म' (Agent Swarm) मोड के लिए चर्चा में है।

Claude Code के भीतर एक गुप्त 'स्नीक पीक' फीचर खोजा गया है जो Kimi के ऑर्केस्ट्रेटर सिस्टम की तरह काम करता है।

Kimi का ऑर्केस्ट्रेटर जटिल कार्यों के लिए खुद विशेषज्ञ सब-एजेंट बनाता है, जबकि Claude में पहले यह काम मैनुअल था।

एजेंट स्वॉर्म मोड में टीम लीड, QA टेस्टर और बैक-एंड बिल्डर जैसे कई एजेंट एक साथ मिलकर काम करते हैं।

स्वॉर्म प्रोजेक्ट के अंत में एक विस्तृत रिपोर्ट मिलती है जो प्रत्येक एजेंट की भूमिका और उनके द्वारा किए गए काम का विवरण देती है।

एन्थ्रोपिक (Anthropic) ने इसे अभी तक आधिकारिक तौर पर जारी नहीं किया है, संभवतः मौजूदा सब-एजेंट्स और स्किल्स के साथ इसके एकीकरण की जटिलता के कारण।

Betastack जैसे टूल्स का उपयोग सर्वर लॉग्स की निगरानी और AI-आधारित एरर ट्रैकिंग के लिए किया जा सकता है।

Timeline

Kimi 2.5 और Claude का गुप्त फीचर

वीडियो की शुरुआत Kimi 2.5 के 'एजेंट स्वॉर्म' मोड की चर्चा से होती है, जो 100 विशेषज्ञ एजेंट बना सकता है। स्पीकर बताते हैं कि ट्विटर पर एक यूजर ने Claude Code के भीतर एक ऐसा ही छिपा हुआ फ्लैग खोजा है। पहले Claude में सब-एजेंट्स को मैनुअल रूप से बनाना और उन्हें निर्देश देना पड़ता था, जो एक थकाऊ प्रक्रिया थी। ये पुराने सब-एजेंट्स अक्सर केवल सीमित संदर्भ ही देख पाते थे और उनका डेटा स्टोर करने के लिए मार्कडाउन फाइलों का उपयोग करना पड़ता था। यह खंड यह समझने के लिए महत्वपूर्ण है कि एआई एजेंटों का विकास सिंगल टास्क से मल्टी-एजेंट सिस्टम की ओर कैसे हो रहा है।

Kimi एजेंट स्वॉर्म बनाम पारंपरिक वर्कफ़्लो

इस हिस्से में Kimi के ऑर्केस्ट्रेटर की कार्यक्षमता का विवरण दिया गया है, जो खुद तय करता है कि कब और कौन से सब-एजेंट बनाने हैं। Kimi का यह रिसर्च प्रोजेक्ट जटिल कार्यों के दौरान भी प्रदर्शन को स्थिर बनाए रखता है, जैसा कि ग्राफ में दिखाया गया है। Claude के मौजूदा टास्क फीचर की तुलना में Kimi के एजेंट अधिक विशेषज्ञ और कुशल माने जाते हैं। स्पीकर माइक केली द्वारा खोजे गए 'Claude Sneak Peek' रेपो का उल्लेख करते हैं जो इस छिपे हुए फीचर को आज़माने का मौका देता है। यहाँ मुख्य तर्क यह है कि स्वायत्त एजेंट निर्माण ही कोडिंग एआई का भविष्य है।

Claude Sneak Peek का व्यावहारिक प्रदर्शन

स्पीकर XDL टूल के लिए वेब फ्रंट-एंड बनाने के एक प्रोजेक्ट के माध्यम से इस गुप्त फीचर का लाइव डेमो दिखाते हैं। जैसे ही /agent कमांड चलाया जाता है, सिस्टम खुद ही 'फ्रंट-एंड बिल्डर' जैसे विशेषज्ञ एजेंट बनाने लगता है। देखते ही देखते पाँच से आठ एजेंटों की एक टीम बन जाती है जिसमें QA टेस्टर, बैक-एंड बिल्डर और API सर्वर विशेषज्ञ शामिल होते हैं। यूजर हर एजेंट के सिस्टम प्रॉम्प्ट और उनके वास्तविक समय के कार्यों को 'एजेंट व्यू' में जाकर देख सकता है। यह प्रदर्शन साबित करता है कि Claude का ऑर्केस्ट्रेटर जटिल प्रोजेक्ट्स को छोटे, प्रबंधनीय हिस्सों में बाँटने में सक्षम है।

रिपोर्टिंग और प्रोजेक्ट समापन

जब सभी सब-एजेंट अपना काम पूरा कर लेते हैं, तो मुख्य ऑर्केस्ट्रेटर एक 'स्वॉर्म प्रोजेक्ट कम्प्लीट' फाइल तैयार करता है। इसके साथ ही एक 'स्वॉर्म एग्जीक्यूशन रिपोर्ट' भी दी जाती है जिसमें इस्तेमाल किए गए सभी एजेंटों की कुल संख्या और उनकी विशिष्ट उपलब्धियों का डेटा होता है। स्पीकर का मानना है कि Anthropic ने Kimi की नकल नहीं की है, बल्कि वे लंबे समय से इस दिशा में काम कर रहे थे। हर एजेंट के मैसेज को ऊपर स्क्रॉल करके विस्तार से देखा जा सकता है ताकि पारदर्शिता बनी रहे। यह सेक्शन एआई प्रोजेक्ट्स में जवाबदेही और विस्तृत लॉगिंग के महत्व को दर्शाता है।

रिलीज में देरी और तकनीकी चुनौतियाँ

अंतिम भाग में उन कारणों पर चर्चा की गई है कि क्यों Anthropic ने इस फीचर को अभी तक सार्वजनिक नहीं किया है। मुख्य चुनौती यह है कि ऑर्केस्ट्रेटर पुराने यूजर-बनाए सब-एजेंट्स और नए स्वायत्त एजेंटों के बीच संतुलन कैसे बनाएगा। इसके अलावा, पहले से मौजूद टूल्स और स्किल्स का कुशलतापूर्वक उपयोग करना एक तकनीकी सिरदर्द हो सकता है। अंत में, डेवलपरों के लिए Betastack टूल का विज्ञापन किया गया है जो सर्वर एरर्स और फ्रंट-एंड गलतियों को ट्रैक करने में मदद करता है। यह निष्कर्ष देता है कि यद्यपि तकनीक तैयार दिखती है, लेकिन यूजर अनुभव को सरल बनाना अभी बाकी है।

Community Posts

View all posts