00:00:00क्या आप वाकई एक मॉडल को बेहतर मैनेजर बनने के लिए ट्रेन कर सकते हैं?
00:00:02Moonshot ने हाल ही में Kimi 2.5 रिलीज़ किया और इसे अब तक का सबसे शक्तिशाली ओपन-सोर्स मॉडल बताया।
00:00:08यह दावा पहले ही गलत साबित हो जाता है क्योंकि यह ओपन-वेट है, न कि ओपन-सोर्स।
00:00:11दोनों में अंतर है, लेकिन यहाँ मुद्दा वह नहीं है।
00:00:13Kimi 2.5 दो ऐसे दावे करता है जो वाकई टेस्ट करने लायक हैं।
00:00:17पहला, यह कहता है कि इसे एजेंट स्वार्म्स (एजेंटों के समूह) को संचालित करने के लिए शुरू से ट्रेन किया गया है,
00:00:21जिसमें 100 तक सब-एजेंट एक साथ काम कर सकते हैं।
00:00:23इसका रीइन्फोर्समेंट लर्निंग सेटअप सिर्फ सही जवाबों के लिए इनाम नहीं देता,
00:00:27बल्कि इस बात पर भी ध्यान देता है कि मॉडल एजेंटों के बीच काम को कितनी कुशलता से बाँटता है।
00:00:30दूसरा, यह दावा करता है कि इसमें विजुअल एजेंटिक इंटेलिजेंस है,
00:00:33और कहा गया है कि इसने सिर्फ एक प्रॉम्प्ट से बेहद उच्च स्तर के एनिमेशन तैयार किए।
00:00:37अब, लोग इसे एक बार में बनाने का दावा नहीं कर रहे, बल्कि खुद इसके निर्माता ऐसा कह रहे हैं।
00:00:42इसलिए, हमने अपनी टीम के एक सदस्य से इन दोनों का परीक्षण करवाया।
00:00:44हमें जो मिला उसमें से कुछ दावों पर खरा उतरा, और कुछ नहीं।
00:00:48जैसा कि मैंने बताया, Kimi 2.5 के ओपन-सोर्स मॉडल होने का दावा किया जा रहा है।
00:00:51असल में, Kimi 2.5 एक ओपन-सोर्स मॉडल नहीं है।
00:00:54ओपन सोर्स इनिशिएटिव की परिभाषा के अनुसार,
00:00:57ओपन-सोर्स मॉडल का मतलब है कि कोड, ट्रेनिंग डेटा और कार्यप्रणाली सार्वजनिक रूप से उपलब्ध होनी चाहिए,
00:01:02ताकि कोई भी उनकी जांच, संशोधन और उन्हें वितरित कर सके।
00:01:05लेकिन इस मॉडल के मामले में, यह केवल एक ओपन-वेट मॉडल है।
00:01:07एक ओपन-वेट मॉडल केवल अंतिम वेट्स (weights) उपलब्ध कराता है,
00:01:10इसका मतलब है कि न तो ट्रेनिंग कोड और न ही ट्रेनिंग डेटासेट को सार्वजनिक रूप से जारी किया गया है।
00:01:14इसमें केवल वेट्स होते हैं, जिन्हें इसलिए जारी किया जाता है ताकि दूसरे लोग अपने प्रोजेक्ट्स के लिए मॉडल को फाइन-ट्यून या अनुकूलित कर सकें।
00:01:20अब, इस मॉडल का आर्किटेक्चर काफी हद तक DeepSeek के मिक्सचर-ऑफ़-एक्सपर्ट मॉडल जैसा है।
00:01:25इसमें 1 ट्रिलियन पैरामीटर्स हैं, जिनमें से केवल 32 बिलियन पैरामीटर्स ही सक्रिय होते हैं।
00:01:30क्या इसका मतलब यह है कि हम मॉडल का पूरी क्षमता से उपयोग नहीं कर रहे हैं?
00:01:33यह ठीक वैसी ही सटीकता देता है जैसी 1 ट्रिलियन पैरामीटर वाला मॉडल देगा,
00:01:36लेकिन बहुत कम प्रोसेसिंग पावर और लागत के साथ।
00:01:39कुल पैरामीटर्स और सक्रिय पैरामीटर्स के बीच का यह अंतर ही मुख्य कारण है
00:01:43जिसकी वजह से इस मॉडल को उपलब्ध सबसे तेज़ ओपन-वेट मॉडलों में से एक माना जा रहा है।
00:01:47कम सक्रिय पैरामीटर्स का मतलब है कि हर क्वेरी के लिए केवल कुछ का ही उपयोग हो रहा है,
00:01:52और यह मॉडल की गति को काफी बढ़ा देता है।
00:01:54यही मुख्य कारण है कि यह अन्य मॉडलों की तुलना में इतना सस्ता है।
00:01:57उनका कहना है कि यह एक नेटिव मल्टीमॉडल मॉडल है और बेहतरीन कोडिंग और विज़न क्षमताएं प्रदान करता है।
00:02:03लेकिन यह वैसा ही दावा है जैसा हर मॉडल करता है - कि वह सबसे बेहतर और दूसरों से आगे है।
00:02:08इसलिए हमारी टीम को खुद इसकी पुष्टि करने के लिए इसे टेस्ट करना पड़ा, और हम आपको दिखाएंगे कि हमें क्या मिला।
00:02:12लेकिन इसकी अनूठी क्षमताओं के बारे में आगे बढ़ने से पहले, प्रायोजक (स्पॉन्सर) के बारे में कुछ बातें।
00:02:16Opera Neon. यह Opera का पहला एजेंटिक ब्राउज़र है,
00:02:19जिसे खास तौर पर उन पावर यूज़र्स के लिए डिज़ाइन किया गया है जो भविष्य का अनुभव करना चाहते हैं।
00:02:23Neon में “Tasks” का उपयोग होता है, जो उलझी हुई टैब्स की जगह फोकस्ड वर्कस्पेस देता है
00:02:27जहाँ AI एक ही संदर्भ में कई टैब्स पर काम कर सकता है और उनका विश्लेषण कर सकता है।
00:02:32मान लीजिए आपको काम के लिए एक छोटे से टूल की ज़रूरत है।
00:02:34IDE खोलने के बजाय, बस Neon Make का उपयोग करें।
00:02:37प्रॉम्प्ट टाइप करें जैसे “एक साइबरपंक पोमोडोरो टाइमर बनाएं”
00:02:40और ब्राउज़र तुरंत एजेंडा बनाने, कोड लिखने
00:02:43और ऐप को डिप्लॉय करने के लिए एक वर्चुअल मशीन तैयार कर देता है।
00:02:45यह रोज़मर्रा के कामों में समय की भारी बचत करता है, जिससे आप अपने फ्लो को तोड़े बिना
00:02:50कॉन्सेप्ट्स के प्रोटोटाइप बना सकते हैं या Neon Do के ज़रिए रिसर्च को ऑटोमेट कर सकते हैं।
00:02:53यह इंटरफ़ेस में ही मौजूद एक जूनियर डेवलपर की तरह काम करता है।
00:02:56मैं अपने प्रॉम्प्ट्स को ऑटोमेट करने के लिए इन Neon कार्ड्स का उपयोग ज़रूर करूँगा।
00:02:59आप आज ही Opera Neon को सब्सक्राइब कर सकते हैं। एजेंटिक बदलाव को सिर्फ देखें नहीं।
00:03:03इसका हिस्सा बनें। लिंक डिस्क्रिप्शन में है।
00:03:05Kimi मॉडल एजेंटों के समूह (swarm) को निर्देशित करने और उनके बीच कार्यों का समन्वय करने में सक्षम है।
00:03:10अब आप सोच रहे होंगे कि Claude भी ऐसा ही करता है और ज़रूरत के हिसाब से कई सब-एजेंट बनाता है।
00:03:15लेकिन यहाँ यह मॉडल किस तरह अलग है, देखिए।
00:03:17Kimi 2.5 ने 100 तक सब-एजेंटों के समूह को खुद निर्देशित करना सीख लिया है,
00:03:23जो पैरेलल एजेंट रीइन्फोर्समेंट लर्निंग के ज़रिए 1,500 समन्वित स्टेप्स में पैरेलल वर्कफ़्लो चलाता है।
00:03:29जिन्हें नहीं पता, उनके लिए - रीइन्फोर्समेंट लर्निंग एक ऐसी प्रक्रिया है जहाँ मॉडल को अच्छा प्रदर्शन करने पर इनाम मिलता है
00:03:33और लक्ष्य से भटकने पर दंड दिया जाता है।
00:03:36ज़्यादातर मॉडलों को केवल उनके प्रदर्शन के आधार पर इनाम दिया जाता है।
00:03:39लेकिन इस मामले में, मॉडल को इस आधार पर भी इनाम मिलता है कि वह स्टेप्स को कितनी अच्छी तरह पैरेलल कर सकता है
00:03:43और एक संचालक (orchestrator) के रूप में कार्य कर सकता है।
00:03:44सरल शब्दों में कहें तो, Kimi मॉडल को एक संचालक बनने के लिए ट्रेन किया गया है।
00:03:48उसकी सफलता की कसौटी सब-एजेंट बनाने और उन्हें काम सौंपने की उसकी क्षमता है।
00:03:53यह संचालक सब-एजेंट बनाने, काम सौंपने और अन्य संबंधित कार्यों के टूल्स से लैस है।
00:03:58यह विभिन्न कार्यों के लिए सब-एजेंट बनाता है, उन्हें काम सौंपता है,
00:04:02उनसे परिणाम प्राप्त करता है, और फिर सब कुछ एक अंतिम परिणाम में जोड़ देता है।
00:04:06उनके अनुसार, उन्होंने जटिल कार्यों पर प्रदर्शन सुधारने के लिए इस स्वार्म मेथड का उपयोग किया।
00:04:11और आंतरिक मूल्यांकन में, इसके परिणामस्वरूप कुल रनटाइम में 80% की कमी आई।
00:04:16इसका मतलब है कि वे बहुत अधिक जटिल और लंबे समय तक चलने वाले कार्यों को पूरा करने में सक्षम थे।
00:04:20उन्होंने इसकी तुलना लंबी दूरी के कार्यों के लिए सबसे अच्छे मॉडलों से की,
00:04:23जैसे कि Opus 4.5 और बिना स्वार्म वाला Kimi 2.5,
00:04:26और पाया कि Kimi 2.5 एजेंट स्वार्म ने उनके सभी बेंचमार्क में बाकी मॉडलों को पीछे छोड़ दिया।
00:04:32वे एक अकेले एजेंट को चलाने के बजाय कई एजेंटों का उपयोग करके काफी समय बचाने में भी सफल रहे।
00:04:36तो ये सभी दावे उनकी कही बातों पर आधारित थे।
00:04:39इन दावों का परीक्षण करने के लिए, हमने KimiCode CLI इंस्टॉल किया,
00:04:42जो इस मॉडल के साथ रिलीज़ किया गया एक नया कोडिंग एजेंट है।
00:04:45हमने पहले ही एक UI बनाया था और उसे एक अलग कॉम्पोनेंट स्ट्रक्चर में माइग्रेट करना चाहते थे।
00:04:49वह UI ShadCN का उपयोग करके बनाया गया था, और हम उसे Material UI का उपयोग करके दोबारा बनाना चाहते थे।
00:04:53प्रोजेक्ट में कई पेज थे,
00:04:55इसलिए हमने Kimi से पूरे प्रोजेक्ट के UI को ShadCN से Material UI में बदलने को कहा,
00:05:00और हर पेज को संभालने के लिए अलग एजेंटों का उपयोग करने को कहा,
00:05:02ताकि यह माइग्रेशन एक साथ तेज़ी से हो सके।
00:05:05इसने डायरेक्टरी की जांच शुरू की, ठीक वैसे ही जैसे ClaudeCode करता है।
00:05:08इसने एक टू-डू लिस्ट बनाई जिसमें उन सभी पेजों के नाम थे जिन्हें Material UI में बदला जाना था।
00:05:13इसने एक जैसे पेजों का समूह बनाया,
00:05:15जैसे कि साइनअप, लॉगिन और पासवर्ड भूल जाने वाले ऑथेंटिकेशन पेजों को कुशलता से संभालने के लिए।
00:05:20हालाँकि, इसने उम्मीद से ज़्यादा एजेंट बना दिए,
00:05:23जिसके बारे में हमें बाद में पता चला कि यह CLI में एक बग था।
00:05:26इसने काम पूरा करने के लिए सिर्फ पाँच एजेंटों का उपयोग किया था,
00:05:28जो एक नए प्रोडक्ट के लिए सामान्य बात थी।
00:05:30काम पूरा करने में लगभग 15 मिनट लगे,
00:05:32हमें लगा था कि पैरेलल एजेंटों के इस्तेमाल से यह समय कम हो जाएगा।
00:05:35इसने अंत में सब कुछ वेरिफाई और साफ़ (clean) करके काम खत्म किया।
00:05:38माइग्रेशन के बाद कुछ कॉम्पोनेंट्स का अब उपयोग नहीं हो रहा था,
00:05:41और इसने उन्हें भी साफ़ कर दिया।
00:05:43इसने सुनिश्चित किया कि टेस्ट फ़ाइलों सहित सभी ज़रूरी डिपेंडेंसीज़ इंस्टॉल और अपडेट की गई हैं,
00:05:45और बाकी सब की भी पुष्टि की।
00:05:48एक बार जब वह हो गया, तो इसने यह भी पक्का किया कि ShadCN के लिए ज़रूरी सभी डिपेंडेंसीज़ हटा दी गई हैं,
00:05:53जिससे प्रोजेक्ट में कोई फालतू डिपेंडेंसीज़ नहीं बचीं,
00:05:55जिसे ज़्यादातर एजेंट भूल जाते हैं और अंत में प्रोजेक्ट बेवजह भारी हो जाता है।
00:05:59इसने UI में थोड़े बदलाव भी किए।
00:06:01उदाहरण के लिए, हीरो सेक्शन में पहले टेक्स्ट और विजुअल्स अगल-बगल थे,
00:06:05लेकिन इसने उन्हें एक के ऊपर एक (vertical) कर दिया।
00:06:07इसके अलावा, बाकी सब कुछ लगभग वैसा ही दिख रहा था,
00:06:10बस कॉम्पोनेंट्स बदल दिए गए थे।
00:06:12इतना बड़ा काम होने के बावजूद, इसने कॉन्टेक्स्ट विंडो का केवल 25% ही इस्तेमाल किया,
00:06:16जिसका मतलब है कि यह लंबे समय तक चलने वाले एजेंटों पर प्रभावी ढंग से काम कर सकता है।
00:06:19तो एजेंट स्वार्म काम करता है, लेकिन यह हमेशा तेज़ नहीं होता
00:06:22और बड़े कोडबेस पर अधिक समय ले सकता है।
00:06:24आपने शायद गौर किया होगा कि हम इन वीडियो में बहुत कुछ बनाते हैं।
00:06:27सभी प्रॉम्प्ट्स, कोड, टेम्प्लेट्स, वही सब
00:06:29जो आपको आमतौर पर स्क्रीन से कॉपी करने के लिए वीडियो रोकना पड़ता है।
00:06:32यह सब हमारी कम्युनिटी में मौजूद है, इस वीडियो का भी और इससे पहले के हर वीडियो का भी।
00:06:35लिंक डिस्क्रिप्शन में हैं।
00:06:37Kimi 2.5 की सबसे बड़ी खासियत इसकी विजुअल एजेंटिक इंटेलिजेंस है।
00:06:41दावा किया जाता है कि यह फ्रंट-एंड क्षमताओं में विशेष रूप से मज़बूत है।
00:06:44यह इंटरैक्टिव लेआउट और शानदार एनिमेशन को लागू कर सकता है और उनके साथ इंटरैक्ट कर सकता है,
00:06:48जैसे कि टेक्स्ट के ज़रिए स्क्रॉल करना।
00:06:50उन्होंने एनिमेशन के कई उदाहरण दिए जो बहुत अच्छी तरह से बनाए गए थे।
00:06:53यहाँ इसकी असली खूबी सामने आती है।
00:06:55Kimi 2.5 विज़न के साथ कोडिंग करने में माहिर है, जो सिर्फ टेक्स्ट और इमेज प्रॉम्प्ट से कहीं आगे है।
00:07:00यह इनपुट के रूप में वीडियो भी ले सकता है और कोड जनरेट कर सकता है,
00:07:03जो इसे ऐसा करने में सक्षम पहले मॉडलों में से एक बनाता है।
00:07:06इससे कोड फ्लो को समझाना बहुत आसान हो गया।
00:07:08यह मल्टीमॉडल क्षमता ट्रेनिंग के बाद अलग से नहीं जोड़ी गई थी।
00:07:12इसे मॉडल की ट्रेनिंग के दौरान ही एकीकृत किया गया था।
00:07:14ज़्यादातर मॉडल अतिरिक्त क्षमताओं को तभी शामिल करते हैं
00:07:16जब उनकी टेक्स्ट क्षमताएं काफी मज़बूत हो जाती हैं,
00:07:19जिससे अक्सर विज़न और टेक्स्ट क्षमताओं के बीच समझौता (trade-off) करना पड़ता है।
00:07:23लेकिन Kimi 2.5 की ट्रेनिंग पद्धति के साथ,
00:07:25यह समझौता खत्म हो जाता है और दोनों क्षमताएं एक साथ बेहतर होती हैं।
00:07:29अब, हमें खुद इसका परीक्षण करना था।
00:07:30हमने Notion के न्यू पेज इंटरफ़ेस को नेविगेट करने और स्लैश कमांड का उपयोग करने की स्क्रीन रिकॉर्डिंग की।
00:07:35हमने रिकॉर्डिंग छोटी रखी क्योंकि डॉक्यूमेंटेशन में बताया गया है कि वीडियो 40 MB तक सीमित हैं।
00:07:40हमने Notion रिकॉर्डिंग का पाथ दिया और उससे वीडियो में दिखाई गई वेबसाइट का क्लोन बनाने को कहा।
00:07:45हमने प्रॉम्प्ट में विशेष रूप से यह नहीं बताया कि रिकॉर्डिंग किस बारे में थी,
00:07:48इसलिए इसने वीडियो का विश्लेषण करने के लिए “रीड मीडिया फाइल” टूल का उपयोग किया।
00:07:52इसने निष्कर्ष निकाला कि इंटरफ़ेस Notion जैसा था, सभी फीचर्स को पहचाना,
00:07:56और तय किया कि यह मैक ओएस-स्टाइल विंडो वाला एक Notion क्लोन था।
00:07:59एक बार जब उसने फ़ाइल में मौजूद चीज़ों की लिस्ट बना ली, तो उसने उसे लागू करना शुरू कर दिया।
00:08:02अगर आप अपने प्रोजेक्ट्स में वीडियो प्रोसेसिंग का उपयोग कर रहे हैं, तो इसे याद रखें।
00:08:06वीडियो और इमेज कॉन्टेक्स्ट विंडो को जल्दी खत्म कर सकते हैं,
00:08:09इसलिए बड़ी फ़ाइलों के साथ सावधान रहें और कॉन्टेक्स्ट ब्लोटिंग (अत्यधिक डेटा) पर नज़र रखें।
00:08:12जब उसने इंटरफ़ेस की नकल की, तो वह एकदम सटीक थी।
00:08:15UI को एडिट किया जा सकता था, जिसमें Notion के पेज आइकन और फीचर्स शामिल थे,
00:08:18भले ही शुरुआत में कुछ फीचर्स पूरी तरह काम नहीं कर रहे थे।
00:08:21स्लैश कमांड अभी काम नहीं कर रहे थे, लेकिन कुल मिलाकर UI सटीक था।
00:08:25बेहतर होता अगर स्लैश कमांड भी लागू किए जाते, क्योंकि वह वर्कफ़्लो का एक अहम हिस्सा है।
00:08:29लेकिन यह एक छोटी सी समस्या थी जिसे दोबारा कोशिश (reiteration) करके ठीक किया जा सकता था।
00:08:32इसलिए हमने इसे एक प्रॉम्प्ट दिया, जिसमें कार्यान्वयन में आ रही समस्याओं को ठीक करने को कहा।
00:08:37वहाँ से, इसने खुद से सुधार करना शुरू किया, बदलावों को लागू किया, परिणामों की जांच की,
00:08:41और बिना किसी अतिरिक्त प्रॉम्प्ट के यह सुनिश्चित किया कि फीचर सही ढंग से काम कर रहा है।
00:08:46इस सुधार प्रक्रिया ने आखिरकार स्लैश कमांड की समस्या को ठीक कर दिया,
00:08:49जिससे पूरा इंटरफ़ेस एक काम करने वाले Notion क्लोन जैसा महसूस होने लगा।
00:08:52तो यह मॉडल के दावों पर खरा उतर रहा है।
00:08:54कुछ समस्याओं पर काम करने के बाद, हमें लगता है कि यह Claude Code का एक सस्ता विकल्प हो सकता है,
00:08:58क्योंकि Claude के प्लान्स महंगे माने जाते हैं और Kimi के प्लान्स की कीमत कम है।
00:09:03इसी के साथ हम इस वीडियो के अंत में पहुँच गए हैं।
00:09:05अगर आप चैनल का समर्थन करना चाहते हैं और हमें इस तरह के वीडियो बनाने में मदद करना चाहते हैं,
00:09:08तो आप AI Labs Pro से जुड़कर ऐसा कर सकते हैं।
00:09:10हमेशा की तरह, देखने के लिए धन्यवाद, और मैं आपसे अगले वीडियो में मिलूँगा।