Why is Everyone OBSESSED With The New Kimi K2.5 AI Model

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00रुकिए, मैंने अभी ध्यान दिया।
00:00:01यह रिपोर्ट जनवरी 2025 तक की सार्वजनिक रूप से उपलब्ध जानकारी पर आधारित है।
00:00:06ओह नहीं, नहीं, 2025, नहीं, मैंने यह नहीं माँगा था।
00:00:15Moonshot AI ने अपना नया AI मॉडल, Kimi K 2.5 लॉन्च कर दिया है, और इस पूरे
00:00:22हफ्ते इंटरनेट पर इसी की चर्चा हो रही है।
00:00:24कुछ लोग तो यहाँ तक कह रहे हैं कि यह उनका अब तक का सबसे पसंदीदा मॉडल हो सकता है।
00:00:29तो ज़ाहिर है कि मुझे इसे आज़माना ही था ताकि देख सकूँ कि शोर किस बात का है और यह पता लगा सकूँ कि क्या यह
00:00:34वाकई कुछ नया है या सिर्फ चमकदार मार्केटिंग के ज़रिए बढ़ा-चढ़ाकर पेश किया गया एक और मॉडल है।
00:00:39तो आज के वीडियो में हम यही पता लगाने वाले हैं।
00:00:42इसमें बहुत मज़ा आने वाला है, तो चलिए शुरू करते हैं।
00:00:49तो Kimi K 2.5 एक चीनी कंपनी Moonshot AI द्वारा विकसित
00:00:55लेटेस्ट ओपन सोर्स मॉडल है।
00:00:56अभी छह महीने पहले रिचर्ड ने K2 को विस्तार से कवर किया था और आज हम वापस आए हैं
00:01:01यह देखने के लिए कि K2.5 में नया क्या है।
00:01:05तो इस मॉडल में ऐसी क्या खास बात है?
00:01:06यह हर रोज़ आने वाले हज़ारों नए मॉडलों से अलग कैसे है?
00:01:12खैर, दो बातें हैं।
00:01:13पहली बात तो यह कि यह विज़न और कोडिंग में बहुत अच्छा होने का दावा करता है।
00:01:17यह खुद को ओपन सोर्स SOTA (सोटा) तक कहता है।
00:01:21SOTA।
00:01:22क्या आप जानते हैं इसका मतलब क्या है?
00:01:24सच तो यह है कि मुझे खुद इसका मतलब ढूँढना पड़ा, मुझे नहीं पता था।
00:01:27ओह अच्छा, तो इसका मतलब है “स्टेट ऑफ द आर्ट” (अत्याधुनिक)।
00:01:30ठीक है, आज मुझे कुछ नया सीखने को मिला।
00:01:32तो जो भी हो, यह एजेंटिक बेंचमार्क, विज़न और कोडिंग में पूरी तरह से अत्याधुनिक है।
00:01:37और इस मॉडल में दूसरी खास बात यह है कि इसमें “एजेंट स्वार्म” (Agent Swarm) नामक एक नई कार्यक्षमता है।
00:01:42जहाँ यह 100 सब-एजेंट और 1,500 टूल कॉल्स को एक साथ शुरू करने
00:01:44और उन्हें एक साथ चलाने में सक्षम है, जिससे परफॉरमेंस 4.5 गुना तेज़ हो जाती है।
00:01:51इस मॉडल के लिए उन्होंने “पैरेलल एजेंट रीइन्फोर्समेंट लर्निंग” या PARL नामक एक नई ट्रेनिंग पद्धति का उपयोग किया है।
00:01:55और इसका मतलब यह है कि मॉडल एक ट्रेनेबल ऑर्केस्ट्रेटर एजेंट बनाकर पूरे एजेंट स्वार्म को खुद निर्देशित कर सकता है,
00:02:00जो मूल रूप से जटिल कार्यों को छोटे समानांतर कार्यों में बाँटकर शो चलाता है
00:02:01और इन सभी एजेंटों पर नज़र रखता है ताकि यह सुनिश्चित हो सके कि पूरा ऑपरेशन
00:02:06“सीरियल कोलैप्स” में न बदल जाए, जो अक्सर इन मल्टी-एजेंट वर्कफ़्लो के साथ होता है।
00:02:12उन्होंने इसे सुलझाने के लिए हर सब-एजेंट को अलग-अलग महत्वपूर्ण चरणों पर रिवॉर्ड्स दिए हैं
00:02:18और यह पूरी प्रणाली K 2.5 को काफी बेहतर परफॉरमेंस हासिल करने में मदद करती है।
00:02:23तो हम निश्चित रूप से इसका परीक्षण करने वाले हैं।
00:02:28अब, मैं सभी अलग-अलग बेंचमार्क के बारे में बहुत ज़्यादा विस्तार में नहीं जाऊँगा क्योंकि
00:02:34ईमानदारी से कहूँ तो अब मैं जो भी वीडियो देखता हूँ, उसमें हमेशा इन नंबरों की तारीफ की जाती है और मुझे नहीं लगता
00:02:35कि अब हम इन नंबरों पर भरोसा कर सकते हैं।
00:02:40वे अपने बेंचमार्क ग्राफिक्स तक ठीक से नहीं दिखा पाते, हद है।
00:02:44तो इसके बजाय, मैं उन दो चीज़ों पर ध्यान केंद्रित करूँगा जिनमें यह मॉडल अच्छा होने का दावा करता है।
00:02:47विज़न और कोडिंग, और नई एजेंट स्वार्म कार्यक्षमता।
00:02:51तो चलिए इसका परीक्षण करते हैं।
00:02:55उनके पास “Kimi CLI” नाम का अपना CLI टूल भी है।
00:02:56तो मैं अपने टेस्ट करने के लिए आज उसी का उपयोग करने वाला हूँ।
00:03:00तो उनके द्वारा दावा की गई सबसे प्रभावशाली विशेषताओं में से एक यह है कि यह किसी विशेष वेबसाइट के
00:03:02UX की वीडियो रिकॉर्डिंग लेकर उसे कोड में बदल सकता है।
00:03:06यह काफी प्रभावशाली है।
00:03:09तो इसे टेस्ट करने के लिए, मैंने Apple के iPad Air प्रोडक्ट पेज की एक वीडियो रिकॉर्डिंग बनाई, जिसमें उनके सभी
00:03:13शानदार एनिमेशन और ट्रांज़िशन शामिल हैं।
00:03:19और मैंने एक फोल्डर बनाया जिसमें केवल इस रिकॉर्डिंग की फाइल है।
00:03:20और अब मैं K 2.5 को इस वीडियो के आधार पर iPad Air प्रोडक्ट के लिए
00:03:25एक प्रमोशनल वेबसाइट बनाने का प्रॉम्प्ट देने वाला हूँ।
00:03:28और शेल कमांड चलाने से पहले, यह पूछेगा कि क्या हम अनुमति देना चाहते हैं, तो मैं इस सेशन के लिए
00:03:32अनुमति दे दूँगा।
00:03:38और अब यह चल रहा है।
00:03:39और यह दिलचस्प है।
00:03:44इसने पहचान लिया कि फाइल बहुत बड़ी थी।
00:03:46तो इसने खुद ही इसे कंप्रेस करने के लिए FFmpeg का इस्तेमाल किया।
00:03:48और मैं यह जानने के लिए बहुत उत्सुक था कि यह मॉडल वीडियो फाइल को कैसे प्रोसेस करता और समझता है।
00:03:49पता चला कि यह वीडियो फाइल लेता है और एक बार फिर, वेबसाइट बनाने के लिए विज़ुअल सहायता के रूप में
00:03:51वीडियो से की-फ्रेम्स निकालने के लिए FFmpeg का उपयोग कर रहा है।
00:03:56तो मॉडल को काम पूरा करने में लगभग साढ़े पांच मिनट लगे।
00:04:01तो यह निश्चित रूप से सबसे तेज़ मॉडल नहीं है।
00:04:06और याद रहे, मैं मॉडल को कॉल करने के लिए उनके अपने API का उपयोग कर रहा हूँ, लोकल वर्ज़न का नहीं।
00:04:11लेकिन जो भी हो, एक बार काम हो जाने के बाद, हम यहाँ देख सकते हैं कि यह हमें विस्तृत विवरण देता है कि
00:04:15उसने क्या किया।
00:04:18तो अब चलिए खुद साइट को देखते हैं।
00:04:23ओह, वाह।
00:04:28इसे देखिए।
00:04:29हमने पूरी तरह से Apple के डिज़ाइन को पकड़ लिया है और इसने बीच में
00:04:30एक 3D तैरता हुआ iPad भी बना दिया है।
00:04:31और ऐसा लगता है कि यह माउस की मूवमेंट पर भी प्रतिक्रिया दे रहा है।
00:04:32यह काफी कूल है।
00:04:38फिर हमें अलग-अलग विंडोज़ के साथ यह अच्छा कैरोसेल सेक्शन मिलता है, लेकिन दुर्भाग्य से
00:04:39जब मैं डॉट्स पर क्लिक करता हूँ तो यह प्रतिक्रिया नहीं देता है, लेकिन फिर भी यह काफी शानदार है।
00:04:42फिर हमें कुछ एनिमेशन के साथ एक और सेक्शन मिलता है।
00:04:43ओह, और यहाँ हमें वास्तव में अलग-अलग डिज़ाइन वाला एक नेविगेटेबल कैरोसेल मिलता है।
00:04:48यह काफी कूल है।
00:04:52और फिर हमें कुछ और सेक्शन मिलते हैं, जो सभी Apple के डिज़ाइन जैसे ही लगते हैं।
00:04:55ईमानदारी से कहूँ तो, यह काफी अच्छा है।
00:05:00सिर्फ एक रेफरेंस वीडियो और एक छोटे से प्रॉम्प्ट से इन सभी एनिमेशन के साथ एक सुंदर दिखने वाली वेबसाइट
00:05:01बना पाना वाकई कमाल है।
00:05:06ठीक है।
00:05:07लेकिन Apple एक जाना-माना ब्रांड है।
00:05:12मुझे यकीन है कि उनका डिज़ाइन सौंदर्य निश्चित रूप से उनके मॉडल के ट्रेनिंग डेटा का हिस्सा है।
00:05:16तो यह संभवतः मॉडल के लिए एक सीधा काम है।
00:05:17अब चलिए कुछ ज़्यादा दिलचस्प और थोड़ा अनोखा आज़माते हैं।
00:05:18मैंने द सिम्पसंस के मिस्टर बर्न्स की एक सिंगल इमेज के साथ एक और फोल्डर बनाया है।
00:05:23देखते हैं Kimi K 2.5 कितना क्रिएटिव हो सकता है।
00:05:26मैंने यह प्रॉम्प्ट जोड़ा है, “मिस्टर बर्न्स राष्ट्रपति पद के लिए चुनाव लड़ रहे हैं।”
00:05:29मैं चाहता हूँ कि आप मिस्टर बर्न्स के लिए एक राष्ट्रपति चुनाव अभियान वेबसाइट बनाएँ, जिसमें इस चरित्र के गुणों
00:05:34और प्रेरणा के आधार पर उनकी नीतियाँ और राजनीतिक एजेंडा शामिल हो।
00:05:37देखते हैं यह कैसा रहता है।
00:05:40एक बार जब यह तर्क देने की प्रक्रिया शुरू करता है, तो हम देख सकते हैं कि यह डिज़ाइन के बारे में कैसे सोचता है।
00:05:45संपत्ति स्पष्ट है।
00:05:49मोंटगोमरी बर्न्स अपने सिग्नेचर गहरे हरे रंग के सूट और पीच कलर की टाई में।
00:05:51यह अभियान के डिज़ाइन के लिए मुख्य विज़ुअल रेफरेंस है।
00:05:55काफी बढ़िया।
00:05:56और इस सेक्शन को पूरा होने में और भी ज़्यादा समय लगा।
00:06:01यह कुल मिलाकर लगभग छह मिनट का था।
00:06:05लेकिन अब जब यह हो गया है, फिर से, हम जो बनाया गया है उसका विस्तृत विवरण देखते हैं और हम
00:06:06यहाँ देख सकते हैं कि इसने एक विज़न सेक्शन, एक पॉलिसी सेक्शन, प्रमोशनल मटेरियल आदि जोड़ा है।
00:06:08और इसे देखिए।
00:06:11इसने मजे़ के लिए एक छिपा हुआ ईस्टर एग (Easter egg) भी जोड़ा है।
00:06:16अब यह बहुत ही शानदार है।
00:06:22अब देखते हैं कि वेबसाइट कैसी दिखती है।
00:06:23वाह।
00:06:26इसे देखिए।
00:06:27शासन में उत्कृष्टता।
00:06:29मैं इस देश को फिर से अपने लिए महान बना रहा हूँ।
00:06:30ओह, और वहाँ एक छोटा न्यूक्लियर बटन भी है।
00:06:31जब मैं इस पर क्लिक करता हूँ तो क्या होता है?
00:06:33“स्मिथर्स ने मुझे कॉफी दी।”
00:06:36यह बढ़िया है।
00:06:40और यहाँ एक विस्तृत 'अबाउट' पेज भी है।
00:06:41और फिर समृद्धि है।
00:06:43और एनिमेशन कितने स्मूथ हैं।
00:06:44वाह।
00:06:46तो मुझे लगता है कि Kimi K 2.5 वास्तव में प्रभावशाली ग्राफिक्स बनाना जानता है।
00:06:49यह स्पष्ट रूप से उन सभी बेकार डिज़ाइन से बहुत बेहतर है जिन्हें हमने
00:06:50अन्य मॉडलों को बनाते हुए देखा है।
00:06:51और इसे देखिए।
00:06:55अभिजात वर्ग के लिए नीतियाँ।
00:07:01हे भगवान।
00:07:02यहाँ बहुत सारे मज़ेदार जोक्स हैं।
00:07:04यह अद्भुत है।
00:07:05हेल्थकेयर वाउचर केवल बर्न्स मेडिकल सेंटरों पर भुनाए जा सकते हैं।
00:07:06अंग प्रत्यारोपण प्रतीक्षा सूची नेट वर्थ के आधार पर क्रमबद्ध।
00:07:08सोने से बनी सीमा दीवार।
00:07:10लोग क्या कह रहे हैं?
00:07:14ठीक है, यहाँ हमें सिम्पसंस के पात्रों के कुछ कोट्स, कॉन्टैक्ट फॉर्म और अभियान दान
00:07:18पेज मिलते हैं।
00:07:21इसने एक मर्चेंडाइज़ शॉप भी जोड़ी है।
00:07:22ठीक है, लेकिन वह सेक्शन जल्द ही आ रहा है।
00:07:29हाँ, क्योंकि यह एक स्टैटिक HTML पेज है।
00:07:30ठीक है।
00:07:31अब मैं उस ईस्टर एग को ट्रिगर करना चाहता हूँ।
00:07:33मैं वह कैसे करूँ?
00:07:35कोनामी कोड कहता है कि मुझे कोनामी कोड इनपुट करना होगा।
00:07:36कोनामी कोड क्या है?
00:07:38ओह, अच्छा।
00:07:39कोनामी कोड एक प्रसिद्ध वीडियो गेम चीट कोड है।
00:07:43वाह।
00:07:45मुझे यह नहीं पता था।
00:07:46एक बार फिर, आज मुझे कुछ नया सीखने को मिला।
00:07:49तो यह है अप, अप, डाउन, डाउन, लेफ्ट, राइट, लेफ्ट, राइट, ए, बी। ओह, ठीक है।
00:07:50ये रहा।
00:07:51अब हमें पूरे पेज पर बड़ा सा “हा हा हा” टेक्स्ट मिलता है और स्लोगन बदलकर “एक्सीलेंट” हो जाता है।
00:07:52यह काफी प्यारा है।
00:07:58लेकिन सच कहूँ तो, यहाँ इतने सारे अच्छे नगेट्स हैं कि मैं इस होम पेज का लिंक
00:07:59डिस्क्रिप्शन में छोड़ दूँगा ताकि आप बाद में इसे खुद देख सकें।
00:08:06सिम्पसंस के प्रशंसक वास्तव में इसकी सराहना कर सकते हैं।
00:08:07यह वास्तव में प्रभावशाली है, सच में।
00:08:10मुझे उम्मीद नहीं थी कि यह सिर्फ एक इमेज और एक छोटे टेक्स्ट प्रॉम्प्ट से इतनी मज़ेदार वेबसाइट बना देगा।
00:08:14ठीक है।
00:08:17लेकिन अब मैं एजेंट स्वार्म फंक्शन को आज़माना चाहता हूँ जिसके बारे में हर कोई चर्चा कर रहा है।
00:08:19तो उनके उदाहरणों को देखते हुए, स्पष्ट रूप से स्वार्म फीचर किसी निश्चित विषय के लिए
00:08:24रिसर्च इकट्ठा करने या किसी भी ऐसी कार्रवाई के लिए बहुत अच्छा है जहाँ आप मल्टी-थ्रेडेड अप्रोच चाहते हैं।
00:08:25लेकिन इस फीचर को इसकी पूरी भव्यता के साथ टेस्ट करने के लिए, आधिकारिक Kimi पेज का उपयोग करना
00:08:29और उनके चैटबॉट में इसे चलाना सबसे अच्छा है क्योंकि उन्होंने बहुत सारे कूल विज़ुअल एलिमेंट्स
00:08:33और एनिमेशन भी जोड़े हैं जो स्वार्म प्रक्रिया को बहुत कूल दिखाते हैं।
00:08:39आप इसे एक पल में देखेंगे।
00:08:40तो इस टेस्ट के लिए, मैं एजेंट स्वार्म से अलग-अलग मॉडलों के बारे में जितनी हो सके
00:08:46उतनी जानकारी इकट्ठा करने के लिए कहूँगा कि कौन से मॉडल सबसे ज़्यादा इस्तेमाल किए जाते हैं, और मैं K 2.5 से
00:08:50इस सारी जानकारी को इकट्ठा करने और इसे एक अच्छी तरह से फॉर्मेटेड PDF डॉक्यूमेंट में समेकित करने के लिए कहूँगा।
00:08:54और साथ ही, अगर आप चाहते हैं कि मॉडल स्वार्म का उपयोग करे, तो उसे ऐसा करने के लिए कहना उपयोगी होता है क्योंकि
00:08:56मेरे पिछले टेस्ट में से एक में, मैंने इसे एक काम करने के लिए कहा और K 2.5 ने खुद ही निष्कर्ष निकाल लिया कि
00:09:00उसे स्वार्म का इस्तेमाल करने की ज़रूरत नहीं है और उसने मुझे कुछ टोकन क्रेडिट वापस दे दिए।
00:09:06इसलिए यदि आप वास्तव में स्वार्म को सक्रिय करना चाहते हैं, तो उसे बताना सुनिश्चित करें।
00:09:10ठीक है।
00:09:16तो चलिए अपना काम शुरू करते हैं।
00:09:23और जैसे ही यह शुरू होता है, हम उन कूल एनिमेशन को देख सकते हैं जो Kimi के चैटबॉट इंटरफेस पर हैं।
00:09:27और यह वाकई कुछ ऐसा है जिसे मैंने नोटिस किया है कि Moonshot AI इसमें बहुत अच्छा है।
00:09:31वे बहुत ही चंचल, बहुत ही गेमिफाइड यूज़र एक्सपीरियंस देने में माहिर हैं, जो
00:09:32उनके टूल्स का उपयोग करने की पूरी प्रक्रिया को और अधिक मज़ेदार बनाता है।
00:09:33और फिर से, यहाँ Kimi पूरी प्रक्रिया के बारे में थोड़ा मजाकिया हो रहा है क्योंकि मॉडल
00:09:39एजेंटों को नियुक्त करता है।
00:09:43और यह उनमें से प्रत्येक को आईडी बैज भी देता है।
00:09:49और हम वास्तविक समय में उनके काम पूरा होने की स्थिति को भी ट्रैक कर सकते हैं।
00:09:52और जैसे-जैसे एजेंट काम पूरा कर रहे हैं, हम मुख्य विंडो पर
00:09:57उनकी प्रगति पर भी नज़र रख सकते हैं।
00:09:58हम उन वेब पेजों को देख सकते हैं जिन पर वे जा रहे हैं और वह कोड जो वे बना रहे हैं।
00:10:01और इस समय, आप इस बात पर भी दांव लगा सकते हैं कि कौन सा एजेंट अपना काम
00:10:05सबसे तेज़ी से पूरा करेगा।
00:10:10एक बार जब एजेंट काम पूरा कर लेता है, तो आप उनके अवतार के ऊपर एक छोटा सा बबल पॉप अप होते देख सकते हैं।
00:10:11तो लगभग 10.5 मिनट बाद, मेरे स्वार्म ने दिया गया काम पूरा कर लिया है और हमें
00:10:15परिणाम के रूप में यह PDF डॉक्यूमेंट मिलता है।
00:10:20ऐसा लगता है कि यहाँ कुछ टेक्स्ट है, लेकिन मैं इसे ठीक से देख नहीं पा रहा हूँ।
00:10:21ठीक है, तो मुझे इसे समझने के लिए कहीं कॉपी पेस्ट करना पड़ा।
00:10:26ठीक है, तो यह कहता है “कोडिंग मॉडल, तुलनात्मक विश्लेषण।”
00:10:31ठीक है, ठीक है।
00:10:33खैर, शुरुआत से ही बहुत खराब डिज़ाइन विकल्प।
00:10:39लेकिन ठीक है, चलिए जल्दबाज़ी में किसी निष्कर्ष पर नहीं पहुँचते।
00:10:43चलिए बाकी रिपोर्ट देखते हैं।
00:10:46ठीक है, हमारे पास यहाँ एक कार्यकारी सारांश (Executive Summary) है।
00:10:47प्रमुख निष्कर्ष।
00:10:5081 प्रतिशत डेवलपर्स AI का उपयोग करते हैं या उपयोग करने की योजना बनाते हैं।
00:10:5359 प्रतिशत डेवलपर्स समानांतर में तीन AI टूल्स चलाते हैं।
00:10:55ठीक है, ठीक है, दिलचस्प है।
00:10:58और हम यहाँ देखते हैं कि Claude Code Opus 4.5 चार्ट पर हावी है।
00:10:59और फिर हम यहाँ बाज़ार के रुझान देखते हैं।
00:11:0346 प्रतिशत डेवलपर्स सक्रिय रूप से AI आउटपुट पर अविश्वास करते हैं।
00:11:06और वाह, यह आश्चर्यजनक है।
00:11:0842 प्रतिशत मार्केट शेयर के साथ GitHub Copilot मार्केट लीडर है।
00:11:13वाह।
00:11:16ऐसा लगता है कि Llama 4 Scout के पास 10 मिलियन टोकन के साथ सबसे बड़ी कॉन्टेक्स्ट विंडो है।
00:11:20यह काफी प्रभावशाली है।
00:11:22ठीक है, अब आता है।
00:11:26दिलचस्प हिस्सा।
00:11:27प्रमुख निष्कर्ष।
00:11:31ठीक है, देखते हैं।
00:11:32कोई अकेला विजेता नहीं।
00:11:33ओह, चलो भी।
00:11:34कितना बेकार जवाब है।
00:11:3545 प्रतिशत AI द्वारा जनरेट किए गए कोड में कमियाँ होती हैं।
00:11:36हाँ, यह निश्चित रूप से चिंता का विषय है।
00:11:37रुकिए, मैंने अभी ध्यान दिया कि रिपोर्ट जनवरी
00:11:392025 तक की सार्वजनिक रूप से उपलब्ध जानकारी पर आधारित है।
00:11:41ओह, नहीं।
00:11:43ओह, नहीं।
00:11:46दो हज़ार पच्चीस।
00:11:52नहीं, मैंने यह नहीं माँगा था।
00:11:54मैंने विशेष रूप से वर्तमान में सबसे ज़्यादा उपयोग किए जाने वाले मॉडलों के बारे में जानकारी माँगी थी।
00:11:56आपने जनवरी 2026 के डेटा का उपयोग क्यों नहीं किया?
00:11:57आप बिल्कुल सही कह रहे हैं।
00:11:59मुझे 2025 और जनवरी 2026 के डेटा पर रिसर्च करनी चाहिए थी।
00:12:02विशिष्ट LLM व्यवहार।
00:12:09Kimi, मैं तुमसे बहुत निराश हूँ।
00:12:14मैंने पुरानी जानकारी के लिए बहुत सारे टोकन और अपने समय के 10 मिनट बर्बाद कर दिए।
00:12:15ओह, खैर।
00:12:21तो यह सब था।
00:12:23यही है Kimi K2.5।
00:12:25पिछले टेस्ट में आदेशों का पालन करने की इसकी क्षमता में मेरी पूरी निराशा के बावजूद, मुझे अभी भी
00:12:30लगता है कि यह काफी अच्छा मॉडल है।
00:12:31मैं यह नहीं कहूँगा कि यह क्रांतिकारी या अत्याधुनिक है, लेकिन इसके अपने फायदे हैं।
00:12:32यदि आप वास्तव में एक सुंदर वेबसाइट बनाना चाहते हैं, जिसे आप
00:12:35Awwwards डॉट कॉम पर प्रदर्शित कर सकें, तो मैं निश्चित रूप से इसकी सिफारिश करूँगा।
00:12:40तो मैं निश्चित रूप से उदाहरण के लिए, Claude Code मॉडलों में से एक के बजाय K2.5 के साथ जाऊँगा।
00:12:42और मुझे ईमानदार होना होगा, स्वार्म फीचर बहुत कूल दिखता है और इसका उपयोग करना
00:12:47निश्चित रूप से मज़ेदार है।
00:12:51लेकिन क्या आप जानते हैं कि आप Claude Code का उपयोग करके यही सुविधा प्राप्त कर सकते हैं?
00:12:55रिचर्ड ने अभी उस विषय पर एक बेहतरीन वीडियो बनाया है, इसलिए उस वीडियो को भी
00:13:01ज़रूर देखें।
00:13:06और दोस्तों, अगर आपको यह वीडियो उपयोगी या कम से कम मनोरंजक लगा, तो
00:13:07वीडियो के नीचे लाइक बटन दबाकर मुझे बताएं।
00:13:10और हमारे चैनल को सब्सक्राइब करना भी सुनिश्चित करें ताकि आप हमारे भविष्य के किसी भी
00:13:14तकनीकी ब्रेकडाउन वीडियो को मिस न करें।
00:13:15मैं Better Stack से एंड्रेस हूँ और मैं आपसे अगले वीडियो में मिलूँगा।
00:13:19smashing that like button underneath the video.
00:13:22And also be sure to subscribe to our channel so you don't miss out on any of our future
00:13:26technical breakdown videos.
00:13:28This has been Andris from Better Stack and I will see you in the next videos.

Key Takeaway

Kimi K2.5 एक शक्तिशाली विजुअल और कोडिंग AI मॉडल है जो अपने 'एजेंट स्वार्म' और रचनात्मक डिजाइन क्षमताओं के साथ प्रभावशाली है, लेकिन इसकी डेटा सटीकता और गति में अभी भी सुधार की गुंजाइश है।

Highlights

Moonshot AI ने Kimi K2.5 लॉन्च किया है, जो विजन, कोडिंग और एजेंटिक बेंचमार्क में एक ओपन-सोर्स 'स्टेट ऑफ द आर्ट' (SOTA) मॉडल होने का दावा करता है।

इस मॉडल की सबसे बड़ी खासियत इसका 'एजेंट स्वार्म' (Agent Swarm) फीचर है, जो 100 सब-एजेंट्स और 1,500 टूल कॉल्स को एक साथ प्रबंधित कर सकता है।

Kimi K2.5 ने केवल एक वीडियो रिकॉर्डिंग के आधार पर एप्पल के iPad Air उत्पाद पेज का एक प्रभावशाली और कार्यात्मक क्लोन तैयार किया।

इसमें 'पैरेलल एजेंट रीइन्फोर्समेंट लर्निंग' (PARL) का उपयोग किया गया है, जो जटिल कार्यों को छोटे समानांतर कार्यों में विभाजित करके प्रदर्शन को 4.5 गुना तेज करता है।

परीक्षण के दौरान यह देखा गया कि मॉडल ने हास्य और रचनात्मकता दिखाते हुए 'द सिम्पसंस' के पात्र मिस्टर बर्न्स के लिए एक विस्तृत चुनावी वेबसाइट बनाई।

एक बड़ी खामी यह सामने आई कि 'एजेंट स्वार्म' रिसर्च के दौरान मॉडल ने 2026 के वर्तमान डेटा के बजाय जनवरी 2025 तक की पुरानी जानकारी प्रदान की।

Timeline

Kimi K2.5 का परिचय और मुख्य विशेषताएं

वीडियो की शुरुआत Moonshot AI द्वारा विकसित नए ओपन-सोर्स मॉडल Kimi K2.5 के परिचय से होती है। प्रस्तोता बताते हैं कि यह मॉडल विजन और कोडिंग में अत्याधुनिक (SOTA) होने का दावा करता है। इसकी प्रमुख विशेषता 'एजेंट स्वार्म' कार्यक्षमता है, जो 100 सब-एजेंट्स को एक साथ संचालित कर सकती है। इसे PARL नामक एक नई ट्रेनिंग पद्धति का उपयोग करके विकसित किया गया है ताकि मल्टी-एजेंट वर्कफ़्लो को अधिक कुशल बनाया जा सके। यह खंड मॉडल की तकनीकी क्षमता और बाजार में इसकी स्थिति को समझने के लिए महत्वपूर्ण है।

विजन और कोडिंग क्षमताओं का परीक्षण: एप्पल वेबसाइट क्लोन

इस खंड में प्रस्तोता Kimi CLI टूल का उपयोग करके मॉडल की कोडिंग शक्ति का परीक्षण करते हैं। वे मॉडल को एप्पल के iPad Air पेज की एक वीडियो रिकॉर्डिंग देते हैं और उसे वैसी ही वेबसाइट बनाने के लिए कहते हैं। मॉडल वीडियो से की-फ्रेम्स निकालने के लिए FFmpeg का उपयोग करता है और लगभग साढ़े पांच मिनट में परिणाम देता है। परिणाम आश्चर्यजनक रूप से सटीक है, जिसमें एनिमेशन, 3D रेंडरिंग और एप्पल जैसा डिजाइन सौंदर्य शामिल है। यह प्रदर्शित करता है कि मॉडल केवल दृश्य संदर्भों से जटिल फ्रंट-एंड कोड उत्पन्न करने में कितना सक्षम है।

रचनात्मक परीक्षण: मिस्टर बर्न्स की चुनावी वेबसाइट

यहाँ प्रस्तोता मॉडल की रचनात्मकता को परखने के लिए 'द सिम्पसंस' के मिस्टर बर्न्स की एक तस्वीर का उपयोग करते हैं। वे मॉडल को एक काल्पनिक राष्ट्रपति चुनाव अभियान वेबसाइट बनाने का निर्देश देते हैं जिसमें चरित्र के गुणों के आधार पर नीतियां शामिल हों। मॉडल ने गहरे हरे रंग के सूट जैसे विजुअल संकेतों को पहचाना और एक बहुत ही हास्यपूर्ण और विस्तृत वेबसाइट बनाई। वेबसाइट में 'ईस्टर एग्स', कोनामी कोड और चरित्र-विशिष्ट जोक्स शामिल थे, जो इसकी उन्नत तर्क शक्ति को दर्शाते हैं। यह खंड दिखाता है कि मॉडल न केवल कोड लिख सकता है, बल्कि संदर्भ के अनुसार रचनात्मक सामग्री भी तैयार कर सकता है।

एजेंट स्वार्म फीचर का गहराई से परीक्षण

प्रस्तोता अब सबसे चर्चित 'एजेंट स्वार्म' फीचर का परीक्षण करते हैं, जो शोध कार्यों के लिए बनाया गया है। वे मॉडल को विभिन्न AI कोडिंग टूल्स पर शोध करने और एक PDF रिपोर्ट तैयार करने का काम सौंपते हैं। Kimi का इंटरफेस चंचल और गेमिफाइड है, जहाँ प्रत्येक सब-एजेंट को एक आईडी बैज दिया जाता है और उनकी प्रगति को लाइव ट्रैक किया जा सकता है। यह प्रक्रिया पूरी होने में लगभग साढ़े दस मिनट का समय लेती है, जो मल्टी-थ्रेडेड दृष्टिकोण को क्रियान्वित करती है। यह खंड यूज़र इंटरफेस के अनुभव और जटिल कार्य प्रबंधन की मॉडल की क्षमता पर प्रकाश डालता है।

डेटा सटीकता की समस्या और अंतिम निष्कर्ष

अंतिम भाग में एजेंट स्वार्म द्वारा तैयार की गई रिपोर्ट का विश्लेषण किया गया है, जहाँ एक बड़ी निराशा हाथ लगती है। यद्यपि रिपोर्ट अच्छी तरह से फॉर्मेटेड थी, लेकिन इसमें दिया गया डेटा जनवरी 2026 के बजाय जनवरी 2025 का था, जो इसे पुराना बना देता है। प्रस्तोता बताते हैं कि मॉडल टोकन खर्च करने के बाद भी वर्तमान जानकारी देने में विफल रहा। हालांकि, वे निष्कर्ष निकालते हैं कि कोडिंग और विजुअल डिजाइन के लिए यह अभी भी क्लाउड (Claude) जैसे मॉडलों से बेहतर विकल्प हो सकता है। वीडियो का अंत दर्शकों को चैनल सब्सक्राइब करने और भविष्य के तकनीकी ब्रेकडाउन के लिए जुड़े रहने के आग्रह के साथ होता है।

Community Posts

View all posts