يمكن لـ Kimi K2.6 تأسيس شركة في 40 دقيقة! (تحليل كامل للنموذج)

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00كما ترون في هذا المثال، يمكنك ببساطة إطلاق وكالتك الصغيرة
00:00:04للويب في 40 دقيقة باستخدام هذه الميزة في Kimi.
00:00:07حسنًا يا رفاق، عادت شركة Moonshot AI بتحديث آخر لنموذجها الرائد Kimi.
00:00:13Kimi K 2.6 هو أحدث طراز لديهم والذي يعد ببرمجة متطورة،
00:00:18وتنفيذ طويل المدى، وقدرات أسراب الوكلاء.
00:00:22في فيديو اليوم، سنلقي نظرة على هذا النموذج الجديد، ونرى كيف يؤدي في مهام
00:00:27الوكلاء المختلفة، ونكتشف ما إذا كان مثيرًا للإعجاب حقًا كما هو معلن.
00:00:32سيكون الأمر ممتعًا للغاية، لذا دعونا نبدأ.
00:00:34منذ بضعة أشهر، قمت بمراجعة Kimi K 2.5 وكان أداؤه رائعًا حقًا في تصميم الواجهات الأمامية.
00:00:44وقد أثارت ميزة أسراب الوكلاء لديهم إعجابي حقًا.
00:00:48أحببت أيضًا حقيقة أنهم بذلوا الكثير من الجهد في تجربة المستخدم على صفحة الدردشة الخاصة بهم.
00:00:54لذا، في هذا التكرار التالي، يعد Kimi ببعض القفزات الهائلة
00:00:57في كيفية استخدامنا لوكلاء الذكاء الاصطناعي في بيئة الإنتاج.
00:01:02أولاً، تضاعف حجم سرب الوكلاء تقريبًا ثلاث مرات.
00:01:05في الإصدار K 2.5، كنا نتحدث عن حوالي 100 وكيل فرعي، لكن K 2.6 يوسع هذا أفقيًا
00:01:12إلى 300 وكيل متخصص يمكنهم تنفيذ ما يصل إلى 4,000 خطوة منسقة.
00:01:18إذن، هذا تحديث ضخم جدًا.
00:01:20لذا، يمكنك الآن تشغيل المزيد من المهام المتوازية في نفس الوقت.
00:01:24لقد أضافوا أيضًا وضع تفكير محفوظ جديد،
00:01:26والذي يحافظ على ثبات مسار تفكير النموذج عبر المهام متعددة الخطوات.
00:01:31إنه يوقف انحراف الذاكرة الذي يحدث عادةً عندما تتعمق في سير عمل معقد.
00:01:36ثم لدينا المهام طويلة المدى.
00:01:39وفي اختباراتهم الخاصة، تمكن النموذج من إنجاز مهمة هندسية استغرقت 13 ساعة مع مكاسب في الإنتاجية بنسبة 185%.
00:01:46وعندما يتعلق الأمر بالجماليات، فقد انتقل النموذج إلى التصميم القائم على الكود.
00:01:51بدلاً من مجرد إنشاء صفحة هبوط جميلة، يستخدم K 2.6 مشفر الرؤية الأصلي الخاص بهم
00:01:57والمسمى MoonVIT ليفكر في هياكل واجهة وتجربة المستخدم على مستوى أعمق.
00:02:03يمكنه الآن التعامل مع سير عمل كامل من المصادقة إلى تسجيل البيانات في قاعدة البيانات،
00:02:08مما يحول مرجعًا بصريًا واحدًا أو مطالبة إلى نموذج أولي تفاعلي وظيفي بالكامل
00:02:14مع رسوم متحركة GSAP وتأثيرات التمرير وكل أنواع الميزات الرائعة.
00:02:19وبالمناسبة، كل هذا مفتوح المصدر، بما في ذلك مشفر الرؤية.
00:02:23لذا، إذا أردت، يمكنك تشغيله بشكل مستقل،
00:02:26منفصلاً عن بنية Kimi إذا حصلت على النموذج من Hugging Face.
00:02:30إذن، كل هذا يبدو مثيرًا للإعجاب للغاية، لكن دعونا نختبره ونرى كيف يعمل بالفعل.
00:02:35ونماذج Kimi مفتوحة المصدر، لذا يمكنك نظريًا استخدامها في أي إعداد تفضله.
00:02:40ولكن لاختبار ميزة "سرب الوكلاء" الخاصة بهم، سأستخدم واجهة الدردشة الخاصة بهم
00:02:46للحصول على أفضل النتائج. أولاً، أريد تجربة ميزة سرب الوكلاء الجديدة.
00:02:50بالنظر إلى أمثلتهم على موقعهم، لفت انتباهي شيء واحد حقًا.
00:02:54كان ذلك القسم الذي تم فيه استخدام K 2.6 لتحديد 30 متجر تجزئة في لوس أنجلوس بدون
00:03:01مواقع رسمية من خرائط جوجل وإنشاء صفحات هبوط عالية التحويل لكل منها.
00:03:06لقد رأيت هذا التوجه ينتشر على إنستغرام، لذا أريد تجربته ومعرفة ما إذا كان بإمكاننا حقًا
00:03:11إنشاء وكالتنا الصغيرة للويب. لذا، قمت بهذه التجربة بقرار القيام بشيء مشابه.
00:03:16أنا أعيش في تورنتو وما لاحظته هو أن العديد من الموثقين في منطقتي لديهم إما
00:03:21مواقع غير موجودة أو قديمة جدًا. لذا، فكرت أنها ستكون فكرة رائعة لتحديد
00:03:2620 موثقًا حول منطقة تورنتو الكبرى والبحث عنهم إما على خرائط جوجل أو في
00:03:32الصفحات الصفراء الكندية وإنشاء صفحات هبوط عالية التحويل لكل منهم.
00:03:37ولهذه المهمة، قام Kimi بتشغيل خمسة وكلاء فرعيين، كل منهم مخصص لإحدى المهام الفرعية.
00:03:43وكان من المثير للاهتمام رؤية كيف قام الوكلاء الفرعيون بالتنقل عبر الويب وزيارة
00:03:48المواقع. بل وحاولوا تقدير ما إذا كان الموقع قديمًا أم لا باستخدام أحكامهم الخاصة.
00:03:53في المجموع، استغرق الأمر من Kimi حوالي 40 دقيقة لإنهاء سير العمل بالكامل.
00:03:58ولكن في النهاية، أنتج Kimi تقرير تحليل مفصل للغاية حول جميع النتائج
00:04:03حول كل موقع. بل وقام أيضًا بإنشاء عينة رسالة تواصل يمكنني إرسالها إلى العملاء المحتملين
00:04:09لتقديم عروض مواقع الويب، جنبًا إلى جنب مع تقرير آخر عن حجم السوق الإجمالي وتأثير الإيرادات
00:04:16المحتمل. وبجانب ذلك، بالطبع، حصلنا على جميع الملفات التي تم إنشاؤها. وهناك أيضًا
00:04:22صفحة مخصصة أنشأها Kimi حيث يمكنني معاينة كل صفحة من صفحات الهبوط. ويجب أن أقول
00:04:27أن جميع صفحات الهبوط هذه تبدو متشابهة تمامًا، وهو أمر مخيب للآمال نوعًا ما. ولكن ربما
00:04:32كان خطئي في عدم تقديم مطالبة مفصلة بما فيه الكفاية، على الرغم من أن موقعهم الخاص كان يحتوي
00:04:38على نفس المطالبة التي استخدمتها. ولكن ربما كان لديهم بعض الأدوات المهيأة مسبقًا. لذا كمهمة متابعة،
00:04:43طلبت من Kimi المرور عبر كل من هذه الصفحات وتطبيق أسلوب فريد لكل منها، وإضافة
00:04:49بعض الصور لجعل صفحات الهبوط أكثر إثارة. وهنا يمكننا أن نرى أن Kimi قام بالفعل بإنشاء
00:04:55صور مخصصة لكل موقع. وكملاحظة جانبية مضحكة، لاحظت أيضًا كيف يحب Kimi
00:05:00مدح نفسه. على سبيل المثال، هنا، جميع الصور العشرين مذهلة. الآن سأبني 20 صفحة هبوط
00:05:06فريدة تمامًا. أعني، حسنًا يا Kimi، لكن دعني أكون الحكم على ذلك. على أي حال، استغرق الأمر من Kimi
00:05:12حوالي 17 دقيقة لإنهاء مهمة المتابعة هذه. ومرة أخرى، نرى هنا Kimi يمدح نفسه
00:05:17بأن صفحات الهبوط تبدو رائعة. حسنًا يا Kimi، حسنًا. إذن لدينا الآن صفحة معاينة جديدة،
00:05:23لكن هذه الصفحة مكسورة بشكل غريب. ربما كانت هناك مشكلة في تنسيق CSS أو شيء من هذا القبيل، ولكن لا بأس.
00:05:28سأتجاهل ذلك. أنا مهتم أكثر بصفحات الويب نفسها. لذا فإن الصفحات الجديدة تبدو أفضل بكثير
00:05:34لأن لدينا الآن رسومًا متحركة CSS لطيفة المظهر، وكل صفحة ويب لديها الآن صورة
00:05:40رأسية، تم إنشاؤها بواسطة الذكاء الاصطناعي، ولكن مع ذلك، إنها رأسية جميلة. لكنني لاحظت أيضًا أن كل صفحة
00:05:45لا تزال تتبع نفس النمط. لدينا نفس الأقسام، ونفس هيكل الموقع. لذا على الرغم من أن
00:05:51جميع هذه الصفحات تبدو مختلفة الآن، إلا أنها لا تزال تحتوي على نفس القالب، وهو أمر
00:05:56مخيب للآمال لأنني كنت آمل حقًا في نهج أكثر فرادة. ولكن هذه بداية جيدة
00:06:02على أي حال. لذا كما ترون في هذا المثال، يمكنك ببساطة إطلاق وكالتك الصغيرة للويب
00:06:07في 40 دقيقة باستخدام ميزة Kimi هذه. فقط اطلب من سرب وكلاء Kimi المرور عبر أعمالك
00:06:13المحلية والتواصل مع كل منهم بموقع ويب مخصص ورسالة تواصل
00:06:18مخصصة وسيكون لديك عمل جانبي جيد. أتخيل أنه بعد هذا الفيديو، ستبدأ كل شركة
00:06:25محلية صغيرة في تلقي المئات من رسائل العروض هذه مع مواقع ويب مخصصة
00:06:29تم إنشاؤها بواسطة الذكاء الاصطناعي. ولكن مهلاً، هذا هو الواقع. ويجب أن ألاحظ أن استخدام ميزة سرب الوكلاء
00:06:36هذه يتطلب أن تكون على خطتهم Allegretto. لكن يجب أن أقول أيضًا أنني متأكد
00:06:41من أنه أرخص بكثير من طلب نفس المهمة من Claude Code. من المؤسف أن إحصائيات استخدام Kimi
00:06:46لا توفر لنا المزيد من التفاصيل حول عدد الرموز (tokens) التي تم إنفاقها في هذه المهمة التي استغرقت 40 دقيقة.
00:06:53لكن لدي شعور بأنني كنت سأستهلك كل حدود الاستخدام الخاصة بي بحلول الآن
00:06:58لو استخدمت Claude للقيام بنفس الشيء. على أي حال، هذا هو سرب الوكلاء المحسّن الجديد. وبالمناسبة،
00:07:04إذا كنت قد استخدمت مؤخرًا سرب وكلاء Kimi لإجراء بعض التجارب المثيرة للاهتمام، شارك
00:07:09نتائجك في التعليقات أدناه. الآن أريد اختبار مدى تحسن Kimi من حيث البرمجة.
00:07:14يدّعون أن الإصدار 2.6 قد شهد تحسينات قوية في مهام البرمجة طويلة المدى مع تعميم موثوق.
00:07:20لذا لهذه المهمة، قررت أن أطلب من Kimi إنشاء تطبيق ويب بسيط مع واجهة أمامية
00:07:26وواجهة خلفية تتعامل أيضًا مع كشط الويب (web scraping). ربما سمعنا جميعًا مدى
00:07:31جنون أسعار ذاكرة الوصول العشوائي (RAM) في الأشهر الأخيرة. لذا فكرت أنها ستكون فكرة رائعة
00:07:36لإنشاء موقع لمقارنة الأسعار يقوم بكشط بيانات الأسعار لمختلف أنواع الذاكرة ويعطيك
00:07:42جدول مقارنة للعثور على أرخص الخيارات المتاحة. استغرق Kimi حوالي 12 دقيقة
00:07:47لإنهاء هذه المهمة. ويمكنني أن أرى أنهم أضافوا الآن بالفعل عداد رموز (tokens) في أحدث
00:07:52إصدار من واجهة سطر الأوامر (CLI) الخاصة بهم. لذا يمكننا الآن تتبع إنفاقنا الفعلي للرموز، وهو أمر رائع. إليكم
00:07:59النتيجة النهائية. وكما ترون هنا، يظهر سمة داكنة لطيفة للموقع. ويمكننا التنقل
00:08:05بين العلامات التجارية الفردية. ويمكننا أيضًا رؤية خيارات أسعار مختلفة من متاجر مختلفة لكل
00:08:11نوع من أنواع الذاكرة. وما هو أكثر روعة هو أنه يمكننا تشغيل تحديث مباشر، والذي يقوم بإعادة كشط
00:08:16بيانات المتجر بنشاط. من المؤسف أنه لم يتمكن من جلب معظم صور المنتج،
00:08:21لكن معظم الوظائف موجودة. ويحتوي أيضًا على قسم للمقارنة. ولكن لا توجد طريقة لإضافة
00:08:27أي شيء إليه. لذا اضطررت لطلب مهمة متابعة من Kimi لإصلاح هذه المشكلة. والآن نحصل على زر
00:08:34إضافة إلى المقارنة (add to compare). وإذا انتقلنا إلى علامة تبويب المقارنة، نحصل الآن على جدول مقارنة رائع
00:08:41لكل أنواع الذاكرة المختارة. هذا جيد جدًا. وبالنظر إلى الكود، أرى أنه اختار
00:08:46بناء الموقع باستخدام Node JS و Express الأساسيين. ولم يستخدم React بل اختار بدلاً من ذلك
00:08:53نسخة JavaScript هذه حيث يقوم كل تغيير بتعديل عنصر inner HTML مباشرة، وهو
00:08:59خيار مثير للاهتمام. ولكن مهلاً، إذا كان يعمل، فلا يمكنني الشكوى. وأخيرًا، أضاف أيضًا دوال الكشط
00:09:05اللطيفة هذه التي تستخدم axios و cheerio لكشط Amazon و Newegg و Best Buy. هذا
00:09:13رائع جدًا. إذن ها قد حصلتم عليه يا رفاق، هذا هو نموذج Kimmy K 2.6 الجديد. ولأكون صادقًا،
00:09:19بناءً على كل الاختبارات التي أجريناها اليوم، لن أقول إنها قفزة هائلة للأمام عن الإصدار 2.5.
00:09:25ولكن هناك بعض التحسينات الجيدة جدًا في جودة الحياة. وأنا أقدر حقيقة أن
00:09:30Moonshot AI تواصل تحسين منصتها كثيرًا. وأحب أيضًا حقيقة أنها توفر بديلًا صلبًا
00:09:36وأرخص لبعض العمالقة الأكثر تكلفة هناك مثل Claude Code. لذا بشكل عام،
00:09:43عمل رائع من Moonshot AI، استمروا في العمل الجيد. وأنا متحمس بالتأكيد لرؤية كيف سيتحسن Kimi في
00:09:48المستقبل. ويا رفاق، إذا وجدتم هذا الفيديو مفيدًا أو غنيًا بالمعلومات، يرجى إخباري بذلك عن طريق
00:09:53الضغط على زر الإعجاب أسفل الفيديو. وتأكدوا أيضًا من الاشتراك في قناتنا حتى
00:09:58لا تفوتوا أيًا من فيديوهات التحليل التقني المستقبلية. كان معكم أندريس من
00:10:04Better Stack وسأراكم في الفيديوهات القادمة.

Key Takeaway

يوفر Kimi K 2.6 بيئة تطوير فعالة وأقل تكلفة من البدائل التجارية من خلال قدرات أسراب الوكلاء المتوسعة ودمج مشفر الرؤية MoonVIT لتنفيذ مشاريع الويب المعقدة في دقائق معدودة.

Highlights

  • توسع النموذج Kimi K 2.6 ليشمل 300 وكيل متخصص قادرين على تنفيذ 4,000 خطوة منسقة.

  • أدى دمج وضع التفكير المحفوظ إلى استقرار مسار التفكير عبر المهام المعقدة ومنع انحراف الذاكرة.

  • أنجز النموذج مهام هندسية استغرقت 13 ساعة بمكاسب إنتاجية بلغت 185%.

  • تولى النموذج تصميم 20 صفحة هبوط لشركات تجزئة محلية في تورنتو في غضون 40 دقيقة.

  • يعتمد النموذج في التصميم على مشفر الرؤية MoonVIT المفتوح المصدر لتحليل هياكل واجهة المستخدم بشكل أعمق.

  • يوفر النموذج واجهة سطر أوامر (CLI) تعرض عداداً لحظياً لاستهلاك الرموز (tokens) أثناء المهام.

Timeline

تحديثات القدرات التقنية للنموذج

  • تضاعف حجم أسراب الوكلاء إلى 300 وكيل فرعي لتنفيذ مهام متوازية.
  • تطبيق وضع تفكير محفوظ يحافظ على ثبات سياق المهام متعددة الخطوات.
  • تكامل مشفر الرؤية MoonVIT لتحسين تصميم الواجهات بناءً على تحليل عميق للهياكل البصرية.

يركز التحديث K 2.6 على التوسع الأفقي في عدد الوكلاء الفرعيين مقارنة بالإصدار السابق. يساهم وضع التفكير المحفوظ في حل مشكلة انحراف الذاكرة التي تظهر في سير العمل المعقد. تحول النموذج في جانب الجماليات إلى التصميم القائم على الكود باستخدام مشفر رؤية متخصص يعمل بشكل مستقل ومفتوح المصدر.

تجربة أتمتة الوكالات الرقمية

  • تحديد 20 موثقاً في تورنتو وإنشاء صفحات هبوط مخصصة لكل منهم في 40 دقيقة.
  • استخدام خمسة وكلاء فرعيين لإنجاز مهام البحث، التحليل، وتصميم المواقع.
  • توليد رسوم متحركة CSS وصور مخصصة للرأسيات باستخدام الذكاء الاصطناعي.

اختبر النموذج القدرة على تحديد الشركات التي تفتقر لمواقع ويب أو تستخدم مواقع قديمة. نتج عن التجربة تقرير تحليل سوق مفصل مع نماذج صفحات هبوط. على الرغم من تشابه القالب الأولي، استطاع النموذج في مهمة المتابعة تطبيق أسلوب بصري متنوع لكل موقع خلال 17 دقيقة إضافية.

أداء البرمجة طويلة المدى

  • إنشاء تطبيق لمقارنة أسعار الذاكرة مع واجهة خلفية للكشط النشط للبيانات في 12 دقيقة.
  • استخدام مكتبات Node.js وExpress مع التعديل المباشر لعنصر inner HTML.
  • دمج دوال كشط البيانات من Amazon وNewegg وBest Buy باستخدام axios وcheerio.

أظهر النموذج قدرة على التعامل مع مهام برمجية تتطلب واجهة أمامية وخلفية. يعرض النظام المقارن تحديثاً مباشراً لبيانات الأسعار، مع معالجة طلبات المتابعة لإضافة ميزات تفاعلية مثل زر 'إضافة إلى المقارنة'. يتيح الإصدار الأحدث تتبع تكاليف الرموز بدقة عبر واجهة سطر الأوامر.

Community Posts

View all posts