لم أرَ شيئاً كهذا من قبل على الإطلاق

AAI LABS
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00هل يمكنك حقاً تدريب نموذج ليكون مديراً أفضل؟
00:00:02أصدرت شركة Moonshot مؤخراً نموذج Kimi 2.5 ووصفته بأنه أقوى نموذج مفتوح المصدر حتى الآن.
00:00:08هذا الادعاء غير دقيق بالفعل لأنه نموذج مفتوح الأوزان (open-weight) وليس مفتوح المصدر.
00:00:11هناك فرق بينهما، لكن ليس هذا هو موضوعنا هنا.
00:00:13يقدم Kimi 2.5 ادعاءين يستحقان الاختبار فعلياً.
00:00:17أولاً، يزعم أنه تم تدريبه من الصفر لإدارة أسراب من الوكلاء الذكيين،
00:00:21مع إمكانية تشغيل ما يصل إلى 100 وكيل فرعي بالتوازي.
00:00:23نظام التعلم المعزز لا يكافئ الإجابات الصحيحة فحسب،
00:00:27بل يكافئ أيضاً مدى فعالية النموذج في توزيع العمل عبر الوكلاء.
00:00:30ثانياً، يدعي امتلاكه لذكاء وكيل بصري،
00:00:33وذكر أنه أنتج رسوماً متحركة عالية المستوى بضغطة واحدة فقط.
00:00:37الآن، بدلاً من ادعاء المستخدمين بناءه بضغطة واحدة، فإن المبتكرين أنفسهم هم من يدعون ذلك.
00:00:42لذا، قمنا بتكليف أحد أعضاء فريقنا باختبار كِلا الأمرين.
00:00:44بعض ما وجدناه كان بمستوى التوقعات، وبعضه لم يكن كذلك.
00:00:48كما ذكرت، يدعي Kimi 2.5 أنه نموذج مفتوح المصدر.
00:00:51في الواقع، Kimi 2.5 ليس نموذجاً مفتوح المصدر.
00:00:54وفقاً للتعريف الصادر عن مبادرة المصدر المفتوح،
00:00:57تعني النماذج مفتوحة المصدر أن الكود وبيانات التدريب والمنهجيات يجب أن تكون متاحة للجمهور،
00:01:02مما يسمح لأي شخص بفحصها وتعديلها وتوزيعها.
00:01:05لكن بالنسبة لهذا النموذج، فهو مجرد نموذج مفتوح الأوزان.
00:01:07يوفر النموذج مفتوح الأوزان الأوزان النهائية فقط،
00:01:10مما يعني أن كود التدريب ومجموعة بيانات التدريب لم يتم طرحهما للجمهور.
00:01:14إنه يحتوي فقط على الأوزان، والتي يتم إصدارها ليتمكن الآخرون من تحسين النموذج أو تكييفه أو استخدامه في مشاريعهم الخاصة.
00:01:20بنية هذا النموذج تشبه إلى حد كبير بنية نموذج DeepSeek القائمة على “خليط الخبراء” (mixture of experts).
00:01:25يحتوي النموذج على تريليون بارامتر، ولكن يتم تفعيل 32 مليار بارامتر فقط منها.
00:01:30هل يعني هذا أننا لا نستخدم النموذج بكامل طاقته؟
00:01:33إنه يعطي نفس دقة نموذج بتريليون بارامتر،
00:01:36ولكن بقوة معالجة وتكلفة أقل بكثير.
00:01:39هذا الفرق بين إجمالي البارامترات والبارامترات المفعلة
00:01:43هو السبب الرئيسي وراء ادعاء أن هذا النموذج هو أحد أسرع النماذج مفتوحة الأوزان المتاحة.
00:01:47تفعيل عدد قليل من البارامترات يعني استخدام عدد قليل منها فقط لكل طلب،
00:01:52وهذا يسرع النموذج بشكل ملحوظ.
00:01:54هذا هو السبب الجوهري لكونه رخيصاً جداً مقارنة بالنماذج الأخرى.
00:01:57يقولون إن هذا نموذج متعدد الوسائط أصيل ويقدم قدرات فائقة في البرمجة والرؤية البصرية.
00:02:03لكن هذا هو نفس الادعاء الذي يطلقه كل نموذج حول كونه الأفضل والأكثر تطوراً.
00:02:08لذا كان على فريقنا اختباره للتحقق بأنفسنا، وسنعرض لكم ما وجدناه.
00:02:12ولكن قبل أن ننتقل إلى قدراته الفريدة حقاً، دعونا نستمع إلى كلمة من الراعي.
00:02:16Opera Neon. هذا هو أول متصفح يعتمد على الوكلاء الذكيين من Opera،
00:02:19صُمم خصيصاً للمستخدمين المحترفين المستعدين لتجربة المستقبل.
00:02:23يستخدم Neon ميزة “المهام” (Tasks)، التي تستبدل التبويبات الفوضوية بمساحات عمل مركزة
00:02:27حيث يمكن للذكاء الاصطناعي التحليل والعمل عبر عدة تبويبات ضمن نفس السياق.
00:02:32تخيل أنك بحاجة إلى أداة سريعة للعمل.
00:02:34بدلاً من فتح بيئة تطوير (IDE)، ما عليك سوى استخدام Neon Make.
00:02:37اكتب أمراً مثل “اصنع مؤقت Pomodoro بنمط Cyberpunk”
00:02:40وسيقوم المتصفح بإنشاء جهاز افتراضي لتوليد خطة العمل،
00:02:43وكتابة الكود، ونشر التطبيق فوراً.
00:02:45إنه يوفر الكثير من الوقت في سير العمل اليومي، مما يسمح لك ببناء نماذج أولية للأفكار
00:02:50أو أتمتة الأبحاث عبر Neon Do دون مقاطعة تركيزك.
00:02:53إنه يعمل كمطور جونيور مدمج مباشرة في الواجهة.
00:02:56سأستخدم بالتأكيد بطاقات Neon هذه لأتمتة أوامري.
00:02:59يمكنك الاشتراك في Opera Neon اليوم. لا تكتفِ بمشاهدة التحول نحو عصر الوكلاء.
00:03:03كن جزءاً منه. الرابط في الوصف.
00:03:05نموذج Kimi قادر على توجيه سرب من الوكلاء وتنسيق المهام بينهم.
00:03:10قد تعتقد أن Claude يفعل ذلك أيضاً ويُنشئ وكلاء فرعيين بناءً على المهمة المطلوبة.
00:03:15ولكن إليكم وجه الاختلاف في هذا النموذج.
00:03:17لقد تعلم Kimi 2.5 كنموذج كيف يوجه ذاتياً سرباً يصل إلى 100 وكيل فرعي،
00:03:23منفذاً مسارات عمل متوازية عبر 1500 خطوة منسقة بواسطة التعلم المعزز للوكلاء المتوازيين.
00:03:29لمن لا يعرف، التعلم المعزز هو عملية يتم فيها مكافأة النموذج
00:03:33عندما يؤدي جيداً ومعاقبته عندما يحيد عن الهدف.
00:03:36تتم مكافأة معظم النماذج بناءً على الأداء وحده.
00:03:39لكن في هذه الحالة، تتم مكافأة النموذج أيضاً بناءً على مدى قدرته على جعل الخطوات متوازية
00:03:43والعمل كمنسق أو مدير للعمليات.
00:03:44ببساطة، تم تدريب نموذج Kimi ليكون منسقاً.
00:03:48معيار نجاحه هو قدرته على إنشاء وكلاء فرعيين وتوزيع المهام.
00:03:53المنسق مزود بأدوات لإنشاء الوكلاء الفرعيين وتعيين المهام ووظائف أخرى ذات صلة.
00:03:58يقوم بإنشاء وكلاء لمهام متنوعة، ويسندها إليهم،
00:04:02ثم يتلقى النتائج منهم وينسق كل شيء في نتيجة نهائية واحدة.
00:04:06وفقاً لهم، استخدموا طريقة السرب هذه لتحسين الأداء في المهام المعقدة.
00:04:11وفي التقييمات الداخلية، أدى ذلك إلى تقليل وقت التنفيذ الكلي بنسبة 80%.
00:04:16هذا يعني أنهم تمكنوا من تنفيذ مهام أكثر تعقيداً وطويلة المدى.
00:04:20لقد قارنوه بأفضل النماذج للمهام طويلة المدى،
00:04:23تحديداً Opus 4.5 و Kimi 2.5 بدون خاصية السرب،
00:04:26ووجدوا أن سرب وكلاء Kimi 2.5 تفوق على جميع النماذج في اختباراتهم.
00:04:32كما تمكنوا من توفير وقت كبير باستخدام الوكلاء بدلاً من تشغيل وكيل واحد.
00:04:36كانت تلك كلها ادعاءات بناءً على ما قالوه.
00:04:39لاختبار هذه الادعاءات، قمنا بتثبيت KimiCode CLI،
00:04:42وهو وكيل برمجي جديد تم إصداره مع هذا النموذج.
00:04:45كنا قد بنينا بالفعل واجهة مستخدم وأردنا نقلها إلى هيكل مكونات مختلف.
00:04:49كانت الواجهة مبنية باستخدام ShadCN، وأردنا إعادة بنائها باستخدام Material UI.
00:04:53كان المشروع يحتوي على صفحات متعددة،
00:04:55لذا طلبنا من Kimi تغيير واجهة المشروع بالكامل من ShadCN إلى Material UI،
00:05:00وأن يستخدم وكلاء للتعامل مع كل صفحة،
00:05:02حتى نتمكن من إنجاز هذا النقل بشكل أسرع وبالتوازي.
00:05:05بدأ في استكشاف المجلدات، تماماً كما يفعل ClaudeCode.
00:05:08أنشأ قائمة مهام تحتوي على كل صفحة تحتاج للتحويل إلى Material UI.
00:05:13قام بتجميع الصفحات المتشابهة معاً،
00:05:15مثل صفحات المصادقة كالتسجيل، تسجيل الدخول، ونسيان كلمة السر للتعامل معها بفعالية أكبر.
00:05:20ومع ذلك، أطلق عدداً من الوكلاء أكثر مما كنا نتوقع،
00:05:23والذي اكتشفنا لاحقاً أنه كان خللاً في واجهة السطر البرمجي (CLI).
00:05:26لقد استخدم خمسة وكلاء فقط لأداء المهمة،
00:05:28وهو أمر كان متوقعاً لمنتج جديد.
00:05:30استغرق الأمر حوالي 15 دقيقة لإكمال المهمة،
00:05:32وهو وقت كنا نظن أنه سيتقلص باستخدام الوكلاء المتوازيين.
00:05:35انتهى بالتحقق من كل شيء وتنظيفه.
00:05:38بعض المكونات لم تعد مستخدمة بعد عملية النقل،
00:05:41وقام بتنظيفها أيضاً.
00:05:43تأكد من تثبيت وتحديث جميع التبعيات (dependencies)،
00:05:45بما في ذلك ملفات الاختبار، وصادق على البقية.
00:05:48بمجرد الانتهاء من ذلك، تأكد من إزالة جميع التبعيات المطلوبة لـ ShadCN،
00:05:53تاركاً المشروع بدون أي تبعيات غير مستخدمة،
00:05:55وهو أمر تميل معظم الوكلاء لنسيانه وينتهي الأمر بتضخيم المشروع بلا داعٍ.
00:05:59قام بتعديل الواجهة قليلاً.
00:06:01على سبيل المثال، كان قسم الواجهة الرئيسي يحتوي في الأصل على نص وصور جنباً إلى جنب،
00:06:05لكنه قام بتغييرها لتصبح متراصة عمودياً.
00:06:07بخلاف ذلك، بدا كل شيء متطابقاً تقريباً،
00:06:10مع مجرد تبديل المكونات.
00:06:12رغم ضخامة المهمة، إلا أنه استخدم 25% فقط من نافذة السياق،
00:06:16مما يعني قدرته على العمل بفعالية مع الوكلاء الذين يعملون لفترات طويلة.
00:06:19إذن، سرب الوكلاء يعمل فعلاً، لكنه ليس أسرع دائماً
00:06:22وقد يستغرق وقتاً أطول في المشاريع البرمجية الضخمة.
00:06:24ربما لاحظتم أننا نبني الكثير في هذه الفيديوهات.
00:06:27كل الأوامر، الأكواد، والقوالب،
00:06:29الأشياء التي تضطر عادةً لإيقاف الفيديو ونسخها من الشاشة.
00:06:32كلها موجودة في مجتمعنا، لهذا الفيديو ولكل فيديو قبله أيضاً.
00:06:35الروابط في الوصف.
00:06:37نقطة البيع الرئيسية لـ Kimi 2.5 هي ذكاؤه الوكيل البصري.
00:06:41يُزعم أنه قوي بشكل خاص في قدرات الواجهة الأمامية.
00:06:44يمكنه التفاعل مع وتنفيذ تخطيطات تفاعلية ورسوم متحركة غنية،
00:06:48مثل التمرير عبر النصوص.
00:06:50لقد قدموا أمثلة متعددة لرسوم متحركة تم إنشاؤها بشكل ممتاز.
00:06:53هنا يتألق حقاً.
00:06:55يتفوق Kimi 2.5 في البرمجة المعتمدة على الرؤية البصرية، متجاوزاً مجرد الأوامر النصية والصورية.
00:07:00يمكنه حتى استقبال فيديوهات كمدخلات وتوليد كود برمجى،
00:07:03مما يجعله من أوائل النماذج القادرة على فعل ذلك.
00:07:06هذا جعل شرح تسلسل الكود أسهل بكثير.
00:07:08هذه القدرة متعددة الوسائط لم تُضف لاحقاً بعد التدريب.
00:07:12بل تم دمجها أثناء تدريب النموذج.
00:07:14تدمج معظم النماذج قدرات إضافية
00:07:16فقط بعد أن تصبح قدراتها النصية قوية بما فيه الكفاية،
00:07:19مما يؤدي غالباً إلى مفاضلة بين قدرات الرؤية والنص.
00:07:23لكن مع منهجية تدريب Kimi 2.5،
00:07:25تختفي هذه المفاضلة وتتطور القدرتان معاً.
00:07:29الآن، كان علينا اختباره بأنفسنا.
00:07:30قمنا بتسجيل الشاشة أثناء التنقل في واجهة صفحة Notion الجديدة واستخدام أوامر الـ slash.
00:07:35أبقينا التسجيل صغيراً لأن التوثيق يذكر أن الفيديوهات محدودة بـ 40 ميغابايت.
00:07:40أعطيناه مسار تسجيل Notion وطلبنا منه استنساخ الموقع الموضح في الفيديو.
00:07:45لم نخبره صراحةً في الأمر بمحتوى التسجيل،
00:07:48لذا استخدم أداة قراءة ملفات الوسائط لتحليل الفيديو.
00:07:52استنتج أن الواجهة تشبه Notion، وحدد جميع الميزات،
00:07:56وقرر أنها نسخة من Notion بنافذة تشبه نظام Mac OS.
00:07:59بمجرد إدراج ما كان في الملف، بدأ في تنفيذه.
00:08:02إذا كنت تستخدم معالجة الفيديو في مشاريعك الخاصة، فتذكر هذا.
00:08:06يمكن للفيديوهات والصور أن تستنفد نافذة السياق بسرعة،
00:08:09لذا كن حذراً مع الملفات الكبيرة وراقب تضخم السياق.
00:08:12عندما قام بمحاكاة الواجهة، كان دقيقاً.
00:08:15كانت الواجهة قابلة للتعديل، بما في ذلك أيقونات الصفحات وميزات من Notion،
00:08:18على الرغم من أن بعضها لم يكن يعمل بكامل طاقته في البداية.
00:08:21أوامر الـ slash لم تكن تعمل بعد، لكن الواجهة العامة كانت دقيقة.
00:08:25كان من الأفضل لو تم تنفيذ أوامر الـ slash، فهي جزء أساسي من سير العمل.
00:08:29لكن هذه كانت مشكلة بسيطة يمكن إصلاحها بالتكرار.
00:08:32لذا أعطيناه أمراً نطلب فيه إصلاح المشاكل التي واجهناها في التنفيذ.
00:08:37من هناك، قام بالتكرار ذاتياً، منفذاً الإصلاحات، ومتحققاً من النتائج،
00:08:41وضمان عمل الميزة بشكل صحيح دون الحاجة إلى أي أمر إضافي منا.
00:08:46أدى هذا التكرار في النهاية إلى إصلاح مشكلة أوامر الـ slash،
00:08:49مما جعل الواجهة بأكملها تبدو كنسخة وظيفية من Notion.
00:08:52لذا فهو يفي بادعاءات النموذج.
00:08:54بعد العمل على بضع مشكلات، نعتقد أنه قد يكون بديلاً أرخص لـ Claude code،
00:08:58بما أن خطط Claude معروفة بكونها باهظة الثمن، وخطط Kimi أقل سعراً.
00:09:03بهذا نصل إلى نهاية هذا الفيديو.
00:09:05إذا كنت ترغب في دعم القناة ومساعدتنا في الاستمرار في صنع فيديوهات كهذه،
00:09:08يمكنك القيام بذلك عبر الانضمام إلى AI Labs Pro.
00:09:10كما هو الحال دائماً، شكراً للمشاهدة، وأراكم في الفيديو القادم.

Key Takeaway

يعتبر Kimi 2.5 قفزة نوعية في نماذج الذكاء الاصطناعي كونه نموذجاً متعد الوسائط أصيل يجمع بين القدرة الفائقة على إدارة أسراب من الوكلاء والذكاء البصري المتقدم لتنفيذ مهام برمجية معقدة بكفاءة عالية وتكلفة منخفضة.

Highlights

نموذج Kimi 2.5 هو نموذج مفتوح الأوزان (open-weight) وليس مفتوح المصدر بالكامل، ويتميز ببنية "خليط الخبراء" (MoE) مع تريليون بارامتر.

القدرة الفريدة على إدارة سرب يصل إلى 100 وكيل ذكي بالتوازي، مع تدريب النموذج بنظام التعلم المعزز ليصبح منسقاً ومديراً للمهام.

يتفوق النموذج في "الذكاء الوكيل البصري"، حيث يمكنه تحليل الفيديوهات واستنتاج الأكواد البرمجية وبناء واجهات مستخدم معقدة بضغطة واحدة.

استخدام تقنيات التعلم المعزز لمكافأة النموذج ليس فقط على النتائج الصحيحة، بل على كفاءة توزيع المهام وتقليل وقت التنفيذ بنسبة 80%.

اختبار النموذج عملياً في تحويل مشروع برمجى من مكتبة ShadCN إلى Material UI بنجاح مع تنظيف التبعيات غير المستخدمة بدقة عالية.

يُعد Kimi 2.5 بديلاً اقتصادياً وفعالاً لنماذج مثل Claude و DeepSeek، خاصة في المهام البرمجية طويلة المدى والمعقدة.

Timeline

مقدمة عن Kimi 2.5 والفرق بين مفتوح المصدر والأوزان

يفتتح الفيديو بمناقشة حول إطلاق شركة Moonshot لنموذج Kimi 2.5، موضحاً اللغط الدائر حول وصفه كنموذج مفتوح المصدر. يصحح المتحدث المعلومة مبيناً أنه نموذج "مفتوح الأوزان" فقط، مما يعني إتاحة الأوزان النهائية دون بيانات التدريب أو الكود المصدري. يركز هذا القسم على الادعاءات الرئيسية للنموذج، وهي القدرة على إدارة 100 وكيل ذكي بالتوازي وامتلاك ذكاء بصري متطور. تعتبر هذه التفرقة التقنية ضرورية للمطورين لفهم حدود التعديل المتاحة لهم في النموذج. يمهد هذا القسم الطريق لاختبار هذه الادعاءات عملياً من قبل فريق القناة.

البنية التقنية: خليط الخبراء وكفاءة المعالجة

يشرح هذا الجزء البنية التحتية لنموذج Kimi 2.5 التي تعتمد على تقنية "خليط الخبراء" (Mixture of Experts) المشابهة لنموذج DeepSeek. بالرغم من امتلاك النموذج لتريليون بارامتر، إلا أنه يقوم بتفعيل 32 مليار بارامتر فقط لكل طلب، مما يضمن سرعة هائلة وتكلفة تشغيل منخفضة. يوضح المتحدث أن هذا التصميم يسمح بالحصول على دقة النماذج العملاقة مع توفير كبير في قوة المعالجة. يتم استعراض كيف أن هذه الميزة تجعل Kimi أحد أسرع النماذج المتاحة حالياً في السوق. ينتهي القسم بالتأكيد على أن النموذج يدعي التفوق في مهام البرمجة والرؤية البصرية بفضل هذه البنية.

فاصل إعلاني: متصفح Opera Neon والوكلاء الذكيون

ينتقل الفيديو لعرض رعاية لمتصفح Opera Neon، وهو أول متصفح مصمم ليعمل بالاعتماد على الوكلاء الذكيين. يتميز المتصفح بميزات مثل "Tasks" التي تنظم مساحات العمل بدلاً من التبويبات التقليدية، وأداة "Neon Make" لإنشاء التطبيقات بالأوامر النصية. يبرز المتحدث كيف يمكن للمتصفح بناء تطبيقات مثل مؤقت Pomodoro ونشرها فوراً عبر أجهزة افتراضية مدمجة. يهدف هذا الجزء إلى إظهار كيف بدأ مفهوم "الوكلاء" في الانتقال من النماذج البحثية إلى التطبيقات اليومية للمستخدمين المحترفين. يختتم الإعلان بدعوة المشاهدين لتجربة مستقبل التصفح عبر الرابط الموفر.

سرب الوكلاء والتعلم المعزز كمدير عمليات

يغوص هذا القسم في أعمق ميزات Kimi 2.5، وهي قدرته على العمل كمنسق أو مدير لأسراب الوكلاء. تم تدريب النموذج باستخدام التعلم المعزز (Reinforcement Learning) لمكافأته عندما ينجح في توزيع المهام بشكل متوازٍ وفعال. يوضح المتحدث أن النموذج يمكنه إدارة 1500 خطوة منسقة وتوزيع العمل على وكلاء فرعيين لتقليل وقت التنفيذ بنسبة تصل إلى 80%. تشير التقييمات الداخلية إلى تفوق هذا النظام على نماذج قوية مثل Claude 3.5 Opus في المهام الطويلة والمعقدة. يعتبر هذا التحول في التدريب من "تقديم الإجابة" إلى "إدارة العملية" جوهر تميز Kimi 2.5.

الاختبار العملي: تحويل مشروع برمجى وتنظيف الكود

يقوم الفريق باختبار أداة KimiCode CLI عبر تكليفها بتحويل واجهة مستخدم كاملة من مكتبة ShadCN إلى Material UI. بدأ النموذج باستكشاف المجلدات وتخطيط المهام، حيث استخدم 5 وكلاء بالتوازي لإنجاز المهمة في غضون 15 دقيقة. يبرز المتحدث دقة النموذج في تنظيف التبعيات (dependencies) غير المستخدمة وإزالة مخلفات المكتبة القديمة، وهو أمر تفتقر إليه معظم النماذج الأخرى. رغم حدوث تغييرات طفيفة في التخطيط البصري، إلا أن النتيجة كانت وظيفية بالكامل وبكفاءة عالية في استخدام نافذة السياق. يختتم القسم بدعوة المشاهدين للانضمام للمجتمع للحصول على الأكواد والقوالب المستخدمة.

الذكاء البصري واستنساخ المواقع من الفيديو

يتناول الجزء الأخير قدرات الرؤية المتقدمة في Kimi 2.5، حيث تم دمج هذه القدرات أثناء التدريب الأساسي وليس كمرحلة لاحقة. تم اختبار النموذج عبر إعطائه تسجيل فيديو لواجهة موقع Notion وطلب استنساخه برمجياً دون تعليمات نصية مفصلة. نجح النموذج في تحليل الفيديو، وتحديد الميزات، وتوليد كود يحاكي الواجهة الأصلية بدقة، بما في ذلك إصلاح المشكلات ذاتياً عبر التكرار (Iteration). يختتم الفيديو بالتأكيد على أن Kimi 2.5 يمثل بديلاً قوياً وأرخص ثمناً للنماذج الرائدة في السوق حالياً. يودع المتحدث الجمهور مع الإشارة إلى دعم القناة عبر AI Labs Pro.

Community Posts

View all posts