يمكن لـ Kimi K2.6 تأسيس شركة في 40 دقيقة! (تحليل كامل للنموذج)
BBetter Stack
컴퓨터/소프트웨어마케팅/광고창업/스타트업AI/미래기술
Transcript
00:00:00كما ترون في هذا المثال، يمكنك ببساطة إطلاق وكالتك الصغيرة
00:00:04للويب في 40 دقيقة باستخدام هذه الميزة في Kimi.
00:00:07حسنًا يا رفاق، عادت شركة Moonshot AI بتحديث آخر لنموذجها الرائد Kimi.
00:00:13Kimi K 2.6 هو أحدث طراز لديهم والذي يعد ببرمجة متطورة،
00:00:18وتنفيذ طويل المدى، وقدرات أسراب الوكلاء.
00:00:22في فيديو اليوم، سنلقي نظرة على هذا النموذج الجديد، ونرى كيف يؤدي في مهام
00:00:27الوكلاء المختلفة، ونكتشف ما إذا كان مثيرًا للإعجاب حقًا كما هو معلن.
00:00:32سيكون الأمر ممتعًا للغاية، لذا دعونا نبدأ.
00:00:34منذ بضعة أشهر، قمت بمراجعة Kimi K 2.5 وكان أداؤه رائعًا حقًا في تصميم الواجهات الأمامية.
00:00:44وقد أثارت ميزة أسراب الوكلاء لديهم إعجابي حقًا.
00:00:48أحببت أيضًا حقيقة أنهم بذلوا الكثير من الجهد في تجربة المستخدم على صفحة الدردشة الخاصة بهم.
00:00:54لذا، في هذا التكرار التالي، يعد Kimi ببعض القفزات الهائلة
00:00:57في كيفية استخدامنا لوكلاء الذكاء الاصطناعي في بيئة الإنتاج.
00:01:02أولاً، تضاعف حجم سرب الوكلاء تقريبًا ثلاث مرات.
00:01:05في الإصدار K 2.5، كنا نتحدث عن حوالي 100 وكيل فرعي، لكن K 2.6 يوسع هذا أفقيًا
00:01:12إلى 300 وكيل متخصص يمكنهم تنفيذ ما يصل إلى 4,000 خطوة منسقة.
00:01:18إذن، هذا تحديث ضخم جدًا.
00:01:20لذا، يمكنك الآن تشغيل المزيد من المهام المتوازية في نفس الوقت.
00:01:24لقد أضافوا أيضًا وضع تفكير محفوظ جديد،
00:01:26والذي يحافظ على ثبات مسار تفكير النموذج عبر المهام متعددة الخطوات.
00:01:31إنه يوقف انحراف الذاكرة الذي يحدث عادةً عندما تتعمق في سير عمل معقد.
00:01:36ثم لدينا المهام طويلة المدى.
00:01:39وفي اختباراتهم الخاصة، تمكن النموذج من إنجاز مهمة هندسية استغرقت 13 ساعة مع مكاسب في الإنتاجية بنسبة 185%.
00:01:46وعندما يتعلق الأمر بالجماليات، فقد انتقل النموذج إلى التصميم القائم على الكود.
00:01:51بدلاً من مجرد إنشاء صفحة هبوط جميلة، يستخدم K 2.6 مشفر الرؤية الأصلي الخاص بهم
00:01:57والمسمى MoonVIT ليفكر في هياكل واجهة وتجربة المستخدم على مستوى أعمق.
00:02:03يمكنه الآن التعامل مع سير عمل كامل من المصادقة إلى تسجيل البيانات في قاعدة البيانات،
00:02:08مما يحول مرجعًا بصريًا واحدًا أو مطالبة إلى نموذج أولي تفاعلي وظيفي بالكامل
00:02:14مع رسوم متحركة GSAP وتأثيرات التمرير وكل أنواع الميزات الرائعة.
00:02:19وبالمناسبة، كل هذا مفتوح المصدر، بما في ذلك مشفر الرؤية.
00:02:23لذا، إذا أردت، يمكنك تشغيله بشكل مستقل،
00:02:26منفصلاً عن بنية Kimi إذا حصلت على النموذج من Hugging Face.
00:02:30إذن، كل هذا يبدو مثيرًا للإعجاب للغاية، لكن دعونا نختبره ونرى كيف يعمل بالفعل.
00:02:35ونماذج Kimi مفتوحة المصدر، لذا يمكنك نظريًا استخدامها في أي إعداد تفضله.
00:02:40ولكن لاختبار ميزة "سرب الوكلاء" الخاصة بهم، سأستخدم واجهة الدردشة الخاصة بهم
00:02:46للحصول على أفضل النتائج. أولاً، أريد تجربة ميزة سرب الوكلاء الجديدة.
00:02:50بالنظر إلى أمثلتهم على موقعهم، لفت انتباهي شيء واحد حقًا.
00:02:54كان ذلك القسم الذي تم فيه استخدام K 2.6 لتحديد 30 متجر تجزئة في لوس أنجلوس بدون
00:03:01مواقع رسمية من خرائط جوجل وإنشاء صفحات هبوط عالية التحويل لكل منها.
00:03:06لقد رأيت هذا التوجه ينتشر على إنستغرام، لذا أريد تجربته ومعرفة ما إذا كان بإمكاننا حقًا
00:03:11إنشاء وكالتنا الصغيرة للويب. لذا، قمت بهذه التجربة بقرار القيام بشيء مشابه.
00:03:16أنا أعيش في تورنتو وما لاحظته هو أن العديد من الموثقين في منطقتي لديهم إما
00:03:21مواقع غير موجودة أو قديمة جدًا. لذا، فكرت أنها ستكون فكرة رائعة لتحديد
00:03:2620 موثقًا حول منطقة تورنتو الكبرى والبحث عنهم إما على خرائط جوجل أو في
00:03:32الصفحات الصفراء الكندية وإنشاء صفحات هبوط عالية التحويل لكل منهم.
00:03:37ولهذه المهمة، قام Kimi بتشغيل خمسة وكلاء فرعيين، كل منهم مخصص لإحدى المهام الفرعية.
00:03:43وكان من المثير للاهتمام رؤية كيف قام الوكلاء الفرعيون بالتنقل عبر الويب وزيارة
00:03:48المواقع. بل وحاولوا تقدير ما إذا كان الموقع قديمًا أم لا باستخدام أحكامهم الخاصة.
00:03:53في المجموع، استغرق الأمر من Kimi حوالي 40 دقيقة لإنهاء سير العمل بالكامل.
00:03:58ولكن في النهاية، أنتج Kimi تقرير تحليل مفصل للغاية حول جميع النتائج
00:04:03حول كل موقع. بل وقام أيضًا بإنشاء عينة رسالة تواصل يمكنني إرسالها إلى العملاء المحتملين
00:04:09لتقديم عروض مواقع الويب، جنبًا إلى جنب مع تقرير آخر عن حجم السوق الإجمالي وتأثير الإيرادات
00:04:16المحتمل. وبجانب ذلك، بالطبع، حصلنا على جميع الملفات التي تم إنشاؤها. وهناك أيضًا
00:04:22صفحة مخصصة أنشأها Kimi حيث يمكنني معاينة كل صفحة من صفحات الهبوط. ويجب أن أقول
00:04:27أن جميع صفحات الهبوط هذه تبدو متشابهة تمامًا، وهو أمر مخيب للآمال نوعًا ما. ولكن ربما
00:04:32كان خطئي في عدم تقديم مطالبة مفصلة بما فيه الكفاية، على الرغم من أن موقعهم الخاص كان يحتوي
00:04:38على نفس المطالبة التي استخدمتها. ولكن ربما كان لديهم بعض الأدوات المهيأة مسبقًا. لذا كمهمة متابعة،
00:04:43طلبت من Kimi المرور عبر كل من هذه الصفحات وتطبيق أسلوب فريد لكل منها، وإضافة
00:04:49بعض الصور لجعل صفحات الهبوط أكثر إثارة. وهنا يمكننا أن نرى أن Kimi قام بالفعل بإنشاء
00:04:55صور مخصصة لكل موقع. وكملاحظة جانبية مضحكة، لاحظت أيضًا كيف يحب Kimi
00:05:00مدح نفسه. على سبيل المثال، هنا، جميع الصور العشرين مذهلة. الآن سأبني 20 صفحة هبوط
00:05:06فريدة تمامًا. أعني، حسنًا يا Kimi، لكن دعني أكون الحكم على ذلك. على أي حال، استغرق الأمر من Kimi
00:05:12حوالي 17 دقيقة لإنهاء مهمة المتابعة هذه. ومرة أخرى، نرى هنا Kimi يمدح نفسه
00:05:17بأن صفحات الهبوط تبدو رائعة. حسنًا يا Kimi، حسنًا. إذن لدينا الآن صفحة معاينة جديدة،
00:05:23لكن هذه الصفحة مكسورة بشكل غريب. ربما كانت هناك مشكلة في تنسيق CSS أو شيء من هذا القبيل، ولكن لا بأس.
00:05:28سأتجاهل ذلك. أنا مهتم أكثر بصفحات الويب نفسها. لذا فإن الصفحات الجديدة تبدو أفضل بكثير
00:05:34لأن لدينا الآن رسومًا متحركة CSS لطيفة المظهر، وكل صفحة ويب لديها الآن صورة
00:05:40رأسية، تم إنشاؤها بواسطة الذكاء الاصطناعي، ولكن مع ذلك، إنها رأسية جميلة. لكنني لاحظت أيضًا أن كل صفحة
00:05:45لا تزال تتبع نفس النمط. لدينا نفس الأقسام، ونفس هيكل الموقع. لذا على الرغم من أن
00:05:51جميع هذه الصفحات تبدو مختلفة الآن، إلا أنها لا تزال تحتوي على نفس القالب، وهو أمر
00:05:56مخيب للآمال لأنني كنت آمل حقًا في نهج أكثر فرادة. ولكن هذه بداية جيدة
00:06:02على أي حال. لذا كما ترون في هذا المثال، يمكنك ببساطة إطلاق وكالتك الصغيرة للويب
00:06:07في 40 دقيقة باستخدام ميزة Kimi هذه. فقط اطلب من سرب وكلاء Kimi المرور عبر أعمالك
00:06:13المحلية والتواصل مع كل منهم بموقع ويب مخصص ورسالة تواصل
00:06:18مخصصة وسيكون لديك عمل جانبي جيد. أتخيل أنه بعد هذا الفيديو، ستبدأ كل شركة
00:06:25محلية صغيرة في تلقي المئات من رسائل العروض هذه مع مواقع ويب مخصصة
00:06:29تم إنشاؤها بواسطة الذكاء الاصطناعي. ولكن مهلاً، هذا هو الواقع. ويجب أن ألاحظ أن استخدام ميزة سرب الوكلاء
00:06:36هذه يتطلب أن تكون على خطتهم Allegretto. لكن يجب أن أقول أيضًا أنني متأكد
00:06:41من أنه أرخص بكثير من طلب نفس المهمة من Claude Code. من المؤسف أن إحصائيات استخدام Kimi
00:06:46لا توفر لنا المزيد من التفاصيل حول عدد الرموز (tokens) التي تم إنفاقها في هذه المهمة التي استغرقت 40 دقيقة.
00:06:53لكن لدي شعور بأنني كنت سأستهلك كل حدود الاستخدام الخاصة بي بحلول الآن
00:06:58لو استخدمت Claude للقيام بنفس الشيء. على أي حال، هذا هو سرب الوكلاء المحسّن الجديد. وبالمناسبة،
00:07:04إذا كنت قد استخدمت مؤخرًا سرب وكلاء Kimi لإجراء بعض التجارب المثيرة للاهتمام، شارك
00:07:09نتائجك في التعليقات أدناه. الآن أريد اختبار مدى تحسن Kimi من حيث البرمجة.
00:07:14يدّعون أن الإصدار 2.6 قد شهد تحسينات قوية في مهام البرمجة طويلة المدى مع تعميم موثوق.
00:07:20لذا لهذه المهمة، قررت أن أطلب من Kimi إنشاء تطبيق ويب بسيط مع واجهة أمامية
00:07:26وواجهة خلفية تتعامل أيضًا مع كشط الويب (web scraping). ربما سمعنا جميعًا مدى
00:07:31جنون أسعار ذاكرة الوصول العشوائي (RAM) في الأشهر الأخيرة. لذا فكرت أنها ستكون فكرة رائعة
00:07:36لإنشاء موقع لمقارنة الأسعار يقوم بكشط بيانات الأسعار لمختلف أنواع الذاكرة ويعطيك
00:07:42جدول مقارنة للعثور على أرخص الخيارات المتاحة. استغرق Kimi حوالي 12 دقيقة
00:07:47لإنهاء هذه المهمة. ويمكنني أن أرى أنهم أضافوا الآن بالفعل عداد رموز (tokens) في أحدث
00:07:52إصدار من واجهة سطر الأوامر (CLI) الخاصة بهم. لذا يمكننا الآن تتبع إنفاقنا الفعلي للرموز، وهو أمر رائع. إليكم
00:07:59النتيجة النهائية. وكما ترون هنا، يظهر سمة داكنة لطيفة للموقع. ويمكننا التنقل
00:08:05بين العلامات التجارية الفردية. ويمكننا أيضًا رؤية خيارات أسعار مختلفة من متاجر مختلفة لكل
00:08:11نوع من أنواع الذاكرة. وما هو أكثر روعة هو أنه يمكننا تشغيل تحديث مباشر، والذي يقوم بإعادة كشط
00:08:16بيانات المتجر بنشاط. من المؤسف أنه لم يتمكن من جلب معظم صور المنتج،
00:08:21لكن معظم الوظائف موجودة. ويحتوي أيضًا على قسم للمقارنة. ولكن لا توجد طريقة لإضافة
00:08:27أي شيء إليه. لذا اضطررت لطلب مهمة متابعة من Kimi لإصلاح هذه المشكلة. والآن نحصل على زر
00:08:34إضافة إلى المقارنة (add to compare). وإذا انتقلنا إلى علامة تبويب المقارنة، نحصل الآن على جدول مقارنة رائع
00:08:41لكل أنواع الذاكرة المختارة. هذا جيد جدًا. وبالنظر إلى الكود، أرى أنه اختار
00:08:46بناء الموقع باستخدام Node JS و Express الأساسيين. ولم يستخدم React بل اختار بدلاً من ذلك
00:08:53نسخة JavaScript هذه حيث يقوم كل تغيير بتعديل عنصر inner HTML مباشرة، وهو
00:08:59خيار مثير للاهتمام. ولكن مهلاً، إذا كان يعمل، فلا يمكنني الشكوى. وأخيرًا، أضاف أيضًا دوال الكشط
00:09:05اللطيفة هذه التي تستخدم axios و cheerio لكشط Amazon و Newegg و Best Buy. هذا
00:09:13رائع جدًا. إذن ها قد حصلتم عليه يا رفاق، هذا هو نموذج Kimmy K 2.6 الجديد. ولأكون صادقًا،
00:09:19بناءً على كل الاختبارات التي أجريناها اليوم، لن أقول إنها قفزة هائلة للأمام عن الإصدار 2.5.
00:09:25ولكن هناك بعض التحسينات الجيدة جدًا في جودة الحياة. وأنا أقدر حقيقة أن
00:09:30Moonshot AI تواصل تحسين منصتها كثيرًا. وأحب أيضًا حقيقة أنها توفر بديلًا صلبًا
00:09:36وأرخص لبعض العمالقة الأكثر تكلفة هناك مثل Claude Code. لذا بشكل عام،
00:09:43عمل رائع من Moonshot AI، استمروا في العمل الجيد. وأنا متحمس بالتأكيد لرؤية كيف سيتحسن Kimi في
00:09:48المستقبل. ويا رفاق، إذا وجدتم هذا الفيديو مفيدًا أو غنيًا بالمعلومات، يرجى إخباري بذلك عن طريق
00:09:53الضغط على زر الإعجاب أسفل الفيديو. وتأكدوا أيضًا من الاشتراك في قناتنا حتى
00:09:58لا تفوتوا أيًا من فيديوهات التحليل التقني المستقبلية. كان معكم أندريس من
00:10:04Better Stack وسأراكم في الفيديوهات القادمة.