मैंने ऐसा पहले कभी कुछ नहीं देखा

AAI LABS
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00क्या आप वाकई एक मॉडल को बेहतर मैनेजर बनने के लिए ट्रेन कर सकते हैं?
00:00:02Moonshot ने हाल ही में Kimi 2.5 रिलीज़ किया और इसे अब तक का सबसे शक्तिशाली ओपन-सोर्स मॉडल बताया।
00:00:08यह दावा पहले ही गलत साबित हो जाता है क्योंकि यह ओपन-वेट है, न कि ओपन-सोर्स।
00:00:11दोनों में अंतर है, लेकिन यहाँ मुद्दा वह नहीं है।
00:00:13Kimi 2.5 दो ऐसे दावे करता है जो वाकई टेस्ट करने लायक हैं।
00:00:17पहला, यह कहता है कि इसे एजेंट स्वार्म्स (एजेंटों के समूह) को संचालित करने के लिए शुरू से ट्रेन किया गया है,
00:00:21जिसमें 100 तक सब-एजेंट एक साथ काम कर सकते हैं।
00:00:23इसका रीइन्फोर्समेंट लर्निंग सेटअप सिर्फ सही जवाबों के लिए इनाम नहीं देता,
00:00:27बल्कि इस बात पर भी ध्यान देता है कि मॉडल एजेंटों के बीच काम को कितनी कुशलता से बाँटता है।
00:00:30दूसरा, यह दावा करता है कि इसमें विजुअल एजेंटिक इंटेलिजेंस है,
00:00:33और कहा गया है कि इसने सिर्फ एक प्रॉम्प्ट से बेहद उच्च स्तर के एनिमेशन तैयार किए।
00:00:37अब, लोग इसे एक बार में बनाने का दावा नहीं कर रहे, बल्कि खुद इसके निर्माता ऐसा कह रहे हैं।
00:00:42इसलिए, हमने अपनी टीम के एक सदस्य से इन दोनों का परीक्षण करवाया।
00:00:44हमें जो मिला उसमें से कुछ दावों पर खरा उतरा, और कुछ नहीं।
00:00:48जैसा कि मैंने बताया, Kimi 2.5 के ओपन-सोर्स मॉडल होने का दावा किया जा रहा है।
00:00:51असल में, Kimi 2.5 एक ओपन-सोर्स मॉडल नहीं है।
00:00:54ओपन सोर्स इनिशिएटिव की परिभाषा के अनुसार,
00:00:57ओपन-सोर्स मॉडल का मतलब है कि कोड, ट्रेनिंग डेटा और कार्यप्रणाली सार्वजनिक रूप से उपलब्ध होनी चाहिए,
00:01:02ताकि कोई भी उनकी जांच, संशोधन और उन्हें वितरित कर सके।
00:01:05लेकिन इस मॉडल के मामले में, यह केवल एक ओपन-वेट मॉडल है।
00:01:07एक ओपन-वेट मॉडल केवल अंतिम वेट्स (weights) उपलब्ध कराता है,
00:01:10इसका मतलब है कि न तो ट्रेनिंग कोड और न ही ट्रेनिंग डेटासेट को सार्वजनिक रूप से जारी किया गया है।
00:01:14इसमें केवल वेट्स होते हैं, जिन्हें इसलिए जारी किया जाता है ताकि दूसरे लोग अपने प्रोजेक्ट्स के लिए मॉडल को फाइन-ट्यून या अनुकूलित कर सकें।
00:01:20अब, इस मॉडल का आर्किटेक्चर काफी हद तक DeepSeek के मिक्सचर-ऑफ़-एक्सपर्ट मॉडल जैसा है।
00:01:25इसमें 1 ट्रिलियन पैरामीटर्स हैं, जिनमें से केवल 32 बिलियन पैरामीटर्स ही सक्रिय होते हैं।
00:01:30क्या इसका मतलब यह है कि हम मॉडल का पूरी क्षमता से उपयोग नहीं कर रहे हैं?
00:01:33यह ठीक वैसी ही सटीकता देता है जैसी 1 ट्रिलियन पैरामीटर वाला मॉडल देगा,
00:01:36लेकिन बहुत कम प्रोसेसिंग पावर और लागत के साथ।
00:01:39कुल पैरामीटर्स और सक्रिय पैरामीटर्स के बीच का यह अंतर ही मुख्य कारण है
00:01:43जिसकी वजह से इस मॉडल को उपलब्ध सबसे तेज़ ओपन-वेट मॉडलों में से एक माना जा रहा है।
00:01:47कम सक्रिय पैरामीटर्स का मतलब है कि हर क्वेरी के लिए केवल कुछ का ही उपयोग हो रहा है,
00:01:52और यह मॉडल की गति को काफी बढ़ा देता है।
00:01:54यही मुख्य कारण है कि यह अन्य मॉडलों की तुलना में इतना सस्ता है।
00:01:57उनका कहना है कि यह एक नेटिव मल्टीमॉडल मॉडल है और बेहतरीन कोडिंग और विज़न क्षमताएं प्रदान करता है।
00:02:03लेकिन यह वैसा ही दावा है जैसा हर मॉडल करता है - कि वह सबसे बेहतर और दूसरों से आगे है।
00:02:08इसलिए हमारी टीम को खुद इसकी पुष्टि करने के लिए इसे टेस्ट करना पड़ा, और हम आपको दिखाएंगे कि हमें क्या मिला।
00:02:12लेकिन इसकी अनूठी क्षमताओं के बारे में आगे बढ़ने से पहले, प्रायोजक (स्पॉन्सर) के बारे में कुछ बातें।
00:02:16Opera Neon. यह Opera का पहला एजेंटिक ब्राउज़र है,
00:02:19जिसे खास तौर पर उन पावर यूज़र्स के लिए डिज़ाइन किया गया है जो भविष्य का अनुभव करना चाहते हैं।
00:02:23Neon में “Tasks” का उपयोग होता है, जो उलझी हुई टैब्स की जगह फोकस्ड वर्कस्पेस देता है
00:02:27जहाँ AI एक ही संदर्भ में कई टैब्स पर काम कर सकता है और उनका विश्लेषण कर सकता है।
00:02:32मान लीजिए आपको काम के लिए एक छोटे से टूल की ज़रूरत है।
00:02:34IDE खोलने के बजाय, बस Neon Make का उपयोग करें।
00:02:37प्रॉम्प्ट टाइप करें जैसे “एक साइबरपंक पोमोडोरो टाइमर बनाएं”
00:02:40और ब्राउज़र तुरंत एजेंडा बनाने, कोड लिखने
00:02:43और ऐप को डिप्लॉय करने के लिए एक वर्चुअल मशीन तैयार कर देता है।
00:02:45यह रोज़मर्रा के कामों में समय की भारी बचत करता है, जिससे आप अपने फ्लो को तोड़े बिना
00:02:50कॉन्सेप्ट्स के प्रोटोटाइप बना सकते हैं या Neon Do के ज़रिए रिसर्च को ऑटोमेट कर सकते हैं।
00:02:53यह इंटरफ़ेस में ही मौजूद एक जूनियर डेवलपर की तरह काम करता है।
00:02:56मैं अपने प्रॉम्प्ट्स को ऑटोमेट करने के लिए इन Neon कार्ड्स का उपयोग ज़रूर करूँगा।
00:02:59आप आज ही Opera Neon को सब्सक्राइब कर सकते हैं। एजेंटिक बदलाव को सिर्फ देखें नहीं।
00:03:03इसका हिस्सा बनें। लिंक डिस्क्रिप्शन में है।
00:03:05Kimi मॉडल एजेंटों के समूह (swarm) को निर्देशित करने और उनके बीच कार्यों का समन्वय करने में सक्षम है।
00:03:10अब आप सोच रहे होंगे कि Claude भी ऐसा ही करता है और ज़रूरत के हिसाब से कई सब-एजेंट बनाता है।
00:03:15लेकिन यहाँ यह मॉडल किस तरह अलग है, देखिए।
00:03:17Kimi 2.5 ने 100 तक सब-एजेंटों के समूह को खुद निर्देशित करना सीख लिया है,
00:03:23जो पैरेलल एजेंट रीइन्फोर्समेंट लर्निंग के ज़रिए 1,500 समन्वित स्टेप्स में पैरेलल वर्कफ़्लो चलाता है।
00:03:29जिन्हें नहीं पता, उनके लिए - रीइन्फोर्समेंट लर्निंग एक ऐसी प्रक्रिया है जहाँ मॉडल को अच्छा प्रदर्शन करने पर इनाम मिलता है
00:03:33और लक्ष्य से भटकने पर दंड दिया जाता है।
00:03:36ज़्यादातर मॉडलों को केवल उनके प्रदर्शन के आधार पर इनाम दिया जाता है।
00:03:39लेकिन इस मामले में, मॉडल को इस आधार पर भी इनाम मिलता है कि वह स्टेप्स को कितनी अच्छी तरह पैरेलल कर सकता है
00:03:43और एक संचालक (orchestrator) के रूप में कार्य कर सकता है।
00:03:44सरल शब्दों में कहें तो, Kimi मॉडल को एक संचालक बनने के लिए ट्रेन किया गया है।
00:03:48उसकी सफलता की कसौटी सब-एजेंट बनाने और उन्हें काम सौंपने की उसकी क्षमता है।
00:03:53यह संचालक सब-एजेंट बनाने, काम सौंपने और अन्य संबंधित कार्यों के टूल्स से लैस है।
00:03:58यह विभिन्न कार्यों के लिए सब-एजेंट बनाता है, उन्हें काम सौंपता है,
00:04:02उनसे परिणाम प्राप्त करता है, और फिर सब कुछ एक अंतिम परिणाम में जोड़ देता है।
00:04:06उनके अनुसार, उन्होंने जटिल कार्यों पर प्रदर्शन सुधारने के लिए इस स्वार्म मेथड का उपयोग किया।
00:04:11और आंतरिक मूल्यांकन में, इसके परिणामस्वरूप कुल रनटाइम में 80% की कमी आई।
00:04:16इसका मतलब है कि वे बहुत अधिक जटिल और लंबे समय तक चलने वाले कार्यों को पूरा करने में सक्षम थे।
00:04:20उन्होंने इसकी तुलना लंबी दूरी के कार्यों के लिए सबसे अच्छे मॉडलों से की,
00:04:23जैसे कि Opus 4.5 और बिना स्वार्म वाला Kimi 2.5,
00:04:26और पाया कि Kimi 2.5 एजेंट स्वार्म ने उनके सभी बेंचमार्क में बाकी मॉडलों को पीछे छोड़ दिया।
00:04:32वे एक अकेले एजेंट को चलाने के बजाय कई एजेंटों का उपयोग करके काफी समय बचाने में भी सफल रहे।
00:04:36तो ये सभी दावे उनकी कही बातों पर आधारित थे।
00:04:39इन दावों का परीक्षण करने के लिए, हमने KimiCode CLI इंस्टॉल किया,
00:04:42जो इस मॉडल के साथ रिलीज़ किया गया एक नया कोडिंग एजेंट है।
00:04:45हमने पहले ही एक UI बनाया था और उसे एक अलग कॉम्पोनेंट स्ट्रक्चर में माइग्रेट करना चाहते थे।
00:04:49वह UI ShadCN का उपयोग करके बनाया गया था, और हम उसे Material UI का उपयोग करके दोबारा बनाना चाहते थे।
00:04:53प्रोजेक्ट में कई पेज थे,
00:04:55इसलिए हमने Kimi से पूरे प्रोजेक्ट के UI को ShadCN से Material UI में बदलने को कहा,
00:05:00और हर पेज को संभालने के लिए अलग एजेंटों का उपयोग करने को कहा,
00:05:02ताकि यह माइग्रेशन एक साथ तेज़ी से हो सके।
00:05:05इसने डायरेक्टरी की जांच शुरू की, ठीक वैसे ही जैसे ClaudeCode करता है।
00:05:08इसने एक टू-डू लिस्ट बनाई जिसमें उन सभी पेजों के नाम थे जिन्हें Material UI में बदला जाना था।
00:05:13इसने एक जैसे पेजों का समूह बनाया,
00:05:15जैसे कि साइनअप, लॉगिन और पासवर्ड भूल जाने वाले ऑथेंटिकेशन पेजों को कुशलता से संभालने के लिए।
00:05:20हालाँकि, इसने उम्मीद से ज़्यादा एजेंट बना दिए,
00:05:23जिसके बारे में हमें बाद में पता चला कि यह CLI में एक बग था।
00:05:26इसने काम पूरा करने के लिए सिर्फ पाँच एजेंटों का उपयोग किया था,
00:05:28जो एक नए प्रोडक्ट के लिए सामान्य बात थी।
00:05:30काम पूरा करने में लगभग 15 मिनट लगे,
00:05:32हमें लगा था कि पैरेलल एजेंटों के इस्तेमाल से यह समय कम हो जाएगा।
00:05:35इसने अंत में सब कुछ वेरिफाई और साफ़ (clean) करके काम खत्म किया।
00:05:38माइग्रेशन के बाद कुछ कॉम्पोनेंट्स का अब उपयोग नहीं हो रहा था,
00:05:41और इसने उन्हें भी साफ़ कर दिया।
00:05:43इसने सुनिश्चित किया कि टेस्ट फ़ाइलों सहित सभी ज़रूरी डिपेंडेंसीज़ इंस्टॉल और अपडेट की गई हैं,
00:05:45और बाकी सब की भी पुष्टि की।
00:05:48एक बार जब वह हो गया, तो इसने यह भी पक्का किया कि ShadCN के लिए ज़रूरी सभी डिपेंडेंसीज़ हटा दी गई हैं,
00:05:53जिससे प्रोजेक्ट में कोई फालतू डिपेंडेंसीज़ नहीं बचीं,
00:05:55जिसे ज़्यादातर एजेंट भूल जाते हैं और अंत में प्रोजेक्ट बेवजह भारी हो जाता है।
00:05:59इसने UI में थोड़े बदलाव भी किए।
00:06:01उदाहरण के लिए, हीरो सेक्शन में पहले टेक्स्ट और विजुअल्स अगल-बगल थे,
00:06:05लेकिन इसने उन्हें एक के ऊपर एक (vertical) कर दिया।
00:06:07इसके अलावा, बाकी सब कुछ लगभग वैसा ही दिख रहा था,
00:06:10बस कॉम्पोनेंट्स बदल दिए गए थे।
00:06:12इतना बड़ा काम होने के बावजूद, इसने कॉन्टेक्स्ट विंडो का केवल 25% ही इस्तेमाल किया,
00:06:16जिसका मतलब है कि यह लंबे समय तक चलने वाले एजेंटों पर प्रभावी ढंग से काम कर सकता है।
00:06:19तो एजेंट स्वार्म काम करता है, लेकिन यह हमेशा तेज़ नहीं होता
00:06:22और बड़े कोडबेस पर अधिक समय ले सकता है।
00:06:24आपने शायद गौर किया होगा कि हम इन वीडियो में बहुत कुछ बनाते हैं।
00:06:27सभी प्रॉम्प्ट्स, कोड, टेम्प्लेट्स, वही सब
00:06:29जो आपको आमतौर पर स्क्रीन से कॉपी करने के लिए वीडियो रोकना पड़ता है।
00:06:32यह सब हमारी कम्युनिटी में मौजूद है, इस वीडियो का भी और इससे पहले के हर वीडियो का भी।
00:06:35लिंक डिस्क्रिप्शन में हैं।
00:06:37Kimi 2.5 की सबसे बड़ी खासियत इसकी विजुअल एजेंटिक इंटेलिजेंस है।
00:06:41दावा किया जाता है कि यह फ्रंट-एंड क्षमताओं में विशेष रूप से मज़बूत है।
00:06:44यह इंटरैक्टिव लेआउट और शानदार एनिमेशन को लागू कर सकता है और उनके साथ इंटरैक्ट कर सकता है,
00:06:48जैसे कि टेक्स्ट के ज़रिए स्क्रॉल करना।
00:06:50उन्होंने एनिमेशन के कई उदाहरण दिए जो बहुत अच्छी तरह से बनाए गए थे।
00:06:53यहाँ इसकी असली खूबी सामने आती है।
00:06:55Kimi 2.5 विज़न के साथ कोडिंग करने में माहिर है, जो सिर्फ टेक्स्ट और इमेज प्रॉम्प्ट से कहीं आगे है।
00:07:00यह इनपुट के रूप में वीडियो भी ले सकता है और कोड जनरेट कर सकता है,
00:07:03जो इसे ऐसा करने में सक्षम पहले मॉडलों में से एक बनाता है।
00:07:06इससे कोड फ्लो को समझाना बहुत आसान हो गया।
00:07:08यह मल्टीमॉडल क्षमता ट्रेनिंग के बाद अलग से नहीं जोड़ी गई थी।
00:07:12इसे मॉडल की ट्रेनिंग के दौरान ही एकीकृत किया गया था।
00:07:14ज़्यादातर मॉडल अतिरिक्त क्षमताओं को तभी शामिल करते हैं
00:07:16जब उनकी टेक्स्ट क्षमताएं काफी मज़बूत हो जाती हैं,
00:07:19जिससे अक्सर विज़न और टेक्स्ट क्षमताओं के बीच समझौता (trade-off) करना पड़ता है।
00:07:23लेकिन Kimi 2.5 की ट्रेनिंग पद्धति के साथ,
00:07:25यह समझौता खत्म हो जाता है और दोनों क्षमताएं एक साथ बेहतर होती हैं।
00:07:29अब, हमें खुद इसका परीक्षण करना था।
00:07:30हमने Notion के न्यू पेज इंटरफ़ेस को नेविगेट करने और स्लैश कमांड का उपयोग करने की स्क्रीन रिकॉर्डिंग की।
00:07:35हमने रिकॉर्डिंग छोटी रखी क्योंकि डॉक्यूमेंटेशन में बताया गया है कि वीडियो 40 MB तक सीमित हैं।
00:07:40हमने Notion रिकॉर्डिंग का पाथ दिया और उससे वीडियो में दिखाई गई वेबसाइट का क्लोन बनाने को कहा।
00:07:45हमने प्रॉम्प्ट में विशेष रूप से यह नहीं बताया कि रिकॉर्डिंग किस बारे में थी,
00:07:48इसलिए इसने वीडियो का विश्लेषण करने के लिए “रीड मीडिया फाइल” टूल का उपयोग किया।
00:07:52इसने निष्कर्ष निकाला कि इंटरफ़ेस Notion जैसा था, सभी फीचर्स को पहचाना,
00:07:56और तय किया कि यह मैक ओएस-स्टाइल विंडो वाला एक Notion क्लोन था।
00:07:59एक बार जब उसने फ़ाइल में मौजूद चीज़ों की लिस्ट बना ली, तो उसने उसे लागू करना शुरू कर दिया।
00:08:02अगर आप अपने प्रोजेक्ट्स में वीडियो प्रोसेसिंग का उपयोग कर रहे हैं, तो इसे याद रखें।
00:08:06वीडियो और इमेज कॉन्टेक्स्ट विंडो को जल्दी खत्म कर सकते हैं,
00:08:09इसलिए बड़ी फ़ाइलों के साथ सावधान रहें और कॉन्टेक्स्ट ब्लोटिंग (अत्यधिक डेटा) पर नज़र रखें।
00:08:12जब उसने इंटरफ़ेस की नकल की, तो वह एकदम सटीक थी।
00:08:15UI को एडिट किया जा सकता था, जिसमें Notion के पेज आइकन और फीचर्स शामिल थे,
00:08:18भले ही शुरुआत में कुछ फीचर्स पूरी तरह काम नहीं कर रहे थे।
00:08:21स्लैश कमांड अभी काम नहीं कर रहे थे, लेकिन कुल मिलाकर UI सटीक था।
00:08:25बेहतर होता अगर स्लैश कमांड भी लागू किए जाते, क्योंकि वह वर्कफ़्लो का एक अहम हिस्सा है।
00:08:29लेकिन यह एक छोटी सी समस्या थी जिसे दोबारा कोशिश (reiteration) करके ठीक किया जा सकता था।
00:08:32इसलिए हमने इसे एक प्रॉम्प्ट दिया, जिसमें कार्यान्वयन में आ रही समस्याओं को ठीक करने को कहा।
00:08:37वहाँ से, इसने खुद से सुधार करना शुरू किया, बदलावों को लागू किया, परिणामों की जांच की,
00:08:41और बिना किसी अतिरिक्त प्रॉम्प्ट के यह सुनिश्चित किया कि फीचर सही ढंग से काम कर रहा है।
00:08:46इस सुधार प्रक्रिया ने आखिरकार स्लैश कमांड की समस्या को ठीक कर दिया,
00:08:49जिससे पूरा इंटरफ़ेस एक काम करने वाले Notion क्लोन जैसा महसूस होने लगा।
00:08:52तो यह मॉडल के दावों पर खरा उतर रहा है।
00:08:54कुछ समस्याओं पर काम करने के बाद, हमें लगता है कि यह Claude Code का एक सस्ता विकल्प हो सकता है,
00:08:58क्योंकि Claude के प्लान्स महंगे माने जाते हैं और Kimi के प्लान्स की कीमत कम है।
00:09:03इसी के साथ हम इस वीडियो के अंत में पहुँच गए हैं।
00:09:05अगर आप चैनल का समर्थन करना चाहते हैं और हमें इस तरह के वीडियो बनाने में मदद करना चाहते हैं,
00:09:08तो आप AI Labs Pro से जुड़कर ऐसा कर सकते हैं।
00:09:10हमेशा की तरह, देखने के लिए धन्यवाद, और मैं आपसे अगले वीडियो में मिलूँगा।

Key Takeaway

Kimi 2.5 एक शक्तिशाली ओपन-वेट मॉडल है जो अपनी 'एजेंट स्वार्म' क्षमता और वीडियो-टू-कोड विजुअल इंटेलिजेंस के माध्यम से जटिल कोडिंग और प्रबंधन कार्यों को क्रांतिकारी ढंग से सरल बनाता है।

Highlights

Moonshot द्वारा जारी Kimi 2.5 एक "ओपन-वेट

Timeline

Kimi 2.5 का परिचय और ओपन-सोर्स का सच

वीडियो की शुरुआत Moonshot के नए मॉडल Kimi 2.5 के दावों के विश्लेषण से होती है। वक्ता स्पष्ट करता है कि हालाँकि इसे ओपन-सोर्स कहा जा रहा है, लेकिन यह वास्तव में एक ओपन-वेट मॉडल है क्योंकि इसका डेटासेट सार्वजनिक नहीं है। इसमें मुख्य रूप से दो बड़े दावों पर ध्यान केंद्रित किया गया है: एजेंट स्वार्म्स का प्रबंधन और विजुअल एजेंटिक इंटेलिजेंस। यह खंड समझाता है कि ओपन-सोर्स और ओपन-वेट के बीच का अंतर डेवलपर्स के लिए क्यों महत्वपूर्ण है। यह इस बात की नींव रखता है कि क्या वास्तव में एक AI मॉडल को एक बेहतर मैनेजर बनने के लिए प्रशिक्षित किया जा सकता है।

आर्किटेक्चर और प्रदर्शन क्षमता

इस भाग में Kimi 2.5 के तकनीकी ढांचे की तुलना DeepSeek के 'मिक्सचर-ऑफ़-एक्सपर्ट' मॉडल से की गई है। इसमें कुल 1 ट्रिलियन पैरामीटर्स हैं, लेकिन एक समय में केवल 32 बिलियन ही सक्रिय होते हैं, जो इसे अत्यधिक कुशल बनाता है। यह कम प्रोसेसिंग पावर और कम लागत के साथ 1 ट्रिलियन पैरामीटर्स वाली सटीकता प्रदान करने का वादा करता है। वक्ता बताते हैं कि सक्रिय पैरामीटर्स की कम संख्या ही इसकी तेज़ गति का मुख्य रहस्य है। यह खंड मॉडल की किफ़ायती प्रकृति और इसकी कोडिंग क्षमताओं पर प्रकाश डालता है।

ओपेरा नियोन (Opera Neon) और एजेंटिक ब्राउज़िंग

यह खंड ओपेरा के पहले एजेंटिक ब्राउज़र, 'Opera Neon' का परिचय देता है, जो पावर यूज़र्स के लिए डिज़ाइन किया गया है। इसमें 'Tasks' और 'Neon Make' जैसे फीचर्स हैं जो उलझी हुई टैब्स के बजाय एक फोकस्ड वर्कस्पेस प्रदान करते हैं। AI ब्राउज़र के भीतर ही कोड लिखने, एजेंडा बनाने और ऐप्स को डिप्लॉय करने के लिए वर्चुअल मशीन तैयार कर सकता है। यह टूल एक जूनियर डेवलपर की तरह काम करता है जो रोज़मर्रा के रिसर्च और प्रोटोटाइप कार्यों को ऑटोमेट कर देता है। वक्ता इसे भविष्य की ब्राउज़िंग तकनीक के रूप में प्रस्तुत करते हैं जो काम के फ्लो को बनाए रखती है।

एजेंट स्वार्म और रीइन्फोर्समेंट लर्निंग

यहाँ Kimi 2.5 की सबसे बड़ी विशेषता 'एजेंट स्वार्म' के प्रबंधन का विवरण दिया गया है। यह मॉडल 100 सब-एजेंटों को निर्देशित कर सकता है और 1,500 समन्वित स्टेप्स में पैरेलल वर्कफ़्लो चला सकता है। इसकी रीइन्फोर्समेंट लर्निंग प्रक्रिया मॉडल को केवल सही जवाब के लिए नहीं, बल्कि कार्यों को कुशलता से बाँटने के लिए इनाम देती है। आंतरिक मूल्यांकन के अनुसार, इस स्वार्म पद्धति से कुल रनटाइम में 80% की भारी कमी आई है। यह क्षमता इसे जटिल और लंबे समय तक चलने वाले कार्यों में Claude 4.5 जैसे शीर्ष मॉडलों से आगे ले जाती है।

KimiCode CLI का व्यावहारिक परीक्षण

टीम ने KimiCode CLI का उपयोग करके एक वास्तविक प्रोजेक्ट पर परीक्षण किया, जहाँ एक UI को ShadCN से Material UI में माइग्रेट करना था। मॉडल ने एक विस्तृत टू-डू लिस्ट बनाई और लॉगिन और पासवर्ड जैसे पेजों के लिए अलग-अलग एजेंट तैनात किए। हालाँकि प्रक्रिया में 15 मिनट लगे और एक बग के कारण ज़रूरत से ज़्यादा एजेंट बने, लेकिन परिणाम बहुत सटीक थे। इसने अनुपयोगी फाइलों को साफ़ किया और सुनिश्चित किया कि सभी डिपेंडेंसीज़ सही ढंग से अपडेट की गई हैं। यह परीक्षण साबित करता है कि एजेंट स्वार्म बड़े कोडबेस पर प्रभावी ढंग से काम कर सकता है, भले ही इसमें समय अधिक लग सकता है।

विजुअल इंटेलिजेंस और वीडियो-टू-कोड क्षमता

Kimi 2.5 की विजुअल क्षमताओं का परीक्षण Notion के न्यू पेज इंटरफ़ेस की स्क्रीन रिकॉर्डिंग के साथ किया गया। यह दुनिया के उन पहले मॉडलों में से एक है जो वीडियो इनपुट को समझकर उसका कार्यात्मक क्लोन बना सकता है। इसने वीडियो का विश्लेषण करने के लिए 'रीड मीडिया फाइल' टूल का उपयोग किया और मैक ओएस-स्टाइल का सटीक UI तैयार किया। शुरुआत में स्लैश कमांड जैसे कुछ फीचर्स में समस्या थी, लेकिन एक फॉलो-अप प्रॉम्प्ट के बाद मॉडल ने खुद ही सुधार किया। यह खंड मॉडल की 'सेल्फ-करेक्शन' क्षमता और विज़न-टेक्स्ट एकीकरण की शक्ति को दर्शाता है।

निष्कर्ष और भविष्य की संभावना

वीडियो के समापन में Kimi 2.5 को Claude Code के एक सस्ते और प्रभावी विकल्प के रूप में देखा गया है। वक्ता बताते हैं कि अपनी कम लागत और उच्च क्षमता के कारण यह डेवलपर्स के लिए एक आकर्षक विकल्प बन सकता है। मॉडल के दावों और टीम के व्यावहारिक परीक्षणों के बीच एक सकारात्मक समानता पाई गई है। दर्शकों को AI Labs Pro कम्युनिटी से जुड़ने और इन सभी प्रॉम्प्ट्स और कोड टेम्प्लेट्स को प्राप्त करने के लिए प्रोत्साहित किया गया है। अंत में, वक्ता ने इस एजेंटिक बदलाव का हिस्सा बनने और भविष्य की AI प्रगति पर नज़र रखने की सलाह दी है।

Community Posts

View all posts