00:00:00هل يمكنك حقاً تدريب نموذج ليكون مديراً أفضل؟
00:00:02أصدرت شركة Moonshot مؤخراً نموذج Kimi 2.5 ووصفته بأنه أقوى نموذج مفتوح المصدر حتى الآن.
00:00:08هذا الادعاء غير دقيق بالفعل لأنه نموذج مفتوح الأوزان (open-weight) وليس مفتوح المصدر.
00:00:11هناك فرق بينهما، لكن ليس هذا هو موضوعنا هنا.
00:00:13يقدم Kimi 2.5 ادعاءين يستحقان الاختبار فعلياً.
00:00:17أولاً، يزعم أنه تم تدريبه من الصفر لإدارة أسراب من الوكلاء الذكيين،
00:00:21مع إمكانية تشغيل ما يصل إلى 100 وكيل فرعي بالتوازي.
00:00:23نظام التعلم المعزز لا يكافئ الإجابات الصحيحة فحسب،
00:00:27بل يكافئ أيضاً مدى فعالية النموذج في توزيع العمل عبر الوكلاء.
00:00:30ثانياً، يدعي امتلاكه لذكاء وكيل بصري،
00:00:33وذكر أنه أنتج رسوماً متحركة عالية المستوى بضغطة واحدة فقط.
00:00:37الآن، بدلاً من ادعاء المستخدمين بناءه بضغطة واحدة، فإن المبتكرين أنفسهم هم من يدعون ذلك.
00:00:42لذا، قمنا بتكليف أحد أعضاء فريقنا باختبار كِلا الأمرين.
00:00:44بعض ما وجدناه كان بمستوى التوقعات، وبعضه لم يكن كذلك.
00:00:48كما ذكرت، يدعي Kimi 2.5 أنه نموذج مفتوح المصدر.
00:00:51في الواقع، Kimi 2.5 ليس نموذجاً مفتوح المصدر.
00:00:54وفقاً للتعريف الصادر عن مبادرة المصدر المفتوح،
00:00:57تعني النماذج مفتوحة المصدر أن الكود وبيانات التدريب والمنهجيات يجب أن تكون متاحة للجمهور،
00:01:02مما يسمح لأي شخص بفحصها وتعديلها وتوزيعها.
00:01:05لكن بالنسبة لهذا النموذج، فهو مجرد نموذج مفتوح الأوزان.
00:01:07يوفر النموذج مفتوح الأوزان الأوزان النهائية فقط،
00:01:10مما يعني أن كود التدريب ومجموعة بيانات التدريب لم يتم طرحهما للجمهور.
00:01:14إنه يحتوي فقط على الأوزان، والتي يتم إصدارها ليتمكن الآخرون من تحسين النموذج أو تكييفه أو استخدامه في مشاريعهم الخاصة.
00:01:20بنية هذا النموذج تشبه إلى حد كبير بنية نموذج DeepSeek القائمة على “خليط الخبراء” (mixture of experts).
00:01:25يحتوي النموذج على تريليون بارامتر، ولكن يتم تفعيل 32 مليار بارامتر فقط منها.
00:01:30هل يعني هذا أننا لا نستخدم النموذج بكامل طاقته؟
00:01:33إنه يعطي نفس دقة نموذج بتريليون بارامتر،
00:01:36ولكن بقوة معالجة وتكلفة أقل بكثير.
00:01:39هذا الفرق بين إجمالي البارامترات والبارامترات المفعلة
00:01:43هو السبب الرئيسي وراء ادعاء أن هذا النموذج هو أحد أسرع النماذج مفتوحة الأوزان المتاحة.
00:01:47تفعيل عدد قليل من البارامترات يعني استخدام عدد قليل منها فقط لكل طلب،
00:01:52وهذا يسرع النموذج بشكل ملحوظ.
00:01:54هذا هو السبب الجوهري لكونه رخيصاً جداً مقارنة بالنماذج الأخرى.
00:01:57يقولون إن هذا نموذج متعدد الوسائط أصيل ويقدم قدرات فائقة في البرمجة والرؤية البصرية.
00:02:03لكن هذا هو نفس الادعاء الذي يطلقه كل نموذج حول كونه الأفضل والأكثر تطوراً.
00:02:08لذا كان على فريقنا اختباره للتحقق بأنفسنا، وسنعرض لكم ما وجدناه.
00:02:12ولكن قبل أن ننتقل إلى قدراته الفريدة حقاً، دعونا نستمع إلى كلمة من الراعي.
00:02:16Opera Neon. هذا هو أول متصفح يعتمد على الوكلاء الذكيين من Opera،
00:02:19صُمم خصيصاً للمستخدمين المحترفين المستعدين لتجربة المستقبل.
00:02:23يستخدم Neon ميزة “المهام” (Tasks)، التي تستبدل التبويبات الفوضوية بمساحات عمل مركزة
00:02:27حيث يمكن للذكاء الاصطناعي التحليل والعمل عبر عدة تبويبات ضمن نفس السياق.
00:02:32تخيل أنك بحاجة إلى أداة سريعة للعمل.
00:02:34بدلاً من فتح بيئة تطوير (IDE)، ما عليك سوى استخدام Neon Make.
00:02:37اكتب أمراً مثل “اصنع مؤقت Pomodoro بنمط Cyberpunk”
00:02:40وسيقوم المتصفح بإنشاء جهاز افتراضي لتوليد خطة العمل،
00:02:43وكتابة الكود، ونشر التطبيق فوراً.
00:02:45إنه يوفر الكثير من الوقت في سير العمل اليومي، مما يسمح لك ببناء نماذج أولية للأفكار
00:02:50أو أتمتة الأبحاث عبر Neon Do دون مقاطعة تركيزك.
00:02:53إنه يعمل كمطور جونيور مدمج مباشرة في الواجهة.
00:02:56سأستخدم بالتأكيد بطاقات Neon هذه لأتمتة أوامري.
00:02:59يمكنك الاشتراك في Opera Neon اليوم. لا تكتفِ بمشاهدة التحول نحو عصر الوكلاء.
00:03:03كن جزءاً منه. الرابط في الوصف.
00:03:05نموذج Kimi قادر على توجيه سرب من الوكلاء وتنسيق المهام بينهم.
00:03:10قد تعتقد أن Claude يفعل ذلك أيضاً ويُنشئ وكلاء فرعيين بناءً على المهمة المطلوبة.
00:03:15ولكن إليكم وجه الاختلاف في هذا النموذج.
00:03:17لقد تعلم Kimi 2.5 كنموذج كيف يوجه ذاتياً سرباً يصل إلى 100 وكيل فرعي،
00:03:23منفذاً مسارات عمل متوازية عبر 1500 خطوة منسقة بواسطة التعلم المعزز للوكلاء المتوازيين.
00:03:29لمن لا يعرف، التعلم المعزز هو عملية يتم فيها مكافأة النموذج
00:03:33عندما يؤدي جيداً ومعاقبته عندما يحيد عن الهدف.
00:03:36تتم مكافأة معظم النماذج بناءً على الأداء وحده.
00:03:39لكن في هذه الحالة، تتم مكافأة النموذج أيضاً بناءً على مدى قدرته على جعل الخطوات متوازية
00:03:43والعمل كمنسق أو مدير للعمليات.
00:03:44ببساطة، تم تدريب نموذج Kimi ليكون منسقاً.
00:03:48معيار نجاحه هو قدرته على إنشاء وكلاء فرعيين وتوزيع المهام.
00:03:53المنسق مزود بأدوات لإنشاء الوكلاء الفرعيين وتعيين المهام ووظائف أخرى ذات صلة.
00:03:58يقوم بإنشاء وكلاء لمهام متنوعة، ويسندها إليهم،
00:04:02ثم يتلقى النتائج منهم وينسق كل شيء في نتيجة نهائية واحدة.
00:04:06وفقاً لهم، استخدموا طريقة السرب هذه لتحسين الأداء في المهام المعقدة.
00:04:11وفي التقييمات الداخلية، أدى ذلك إلى تقليل وقت التنفيذ الكلي بنسبة 80%.
00:04:16هذا يعني أنهم تمكنوا من تنفيذ مهام أكثر تعقيداً وطويلة المدى.
00:04:20لقد قارنوه بأفضل النماذج للمهام طويلة المدى،
00:04:23تحديداً Opus 4.5 و Kimi 2.5 بدون خاصية السرب،
00:04:26ووجدوا أن سرب وكلاء Kimi 2.5 تفوق على جميع النماذج في اختباراتهم.
00:04:32كما تمكنوا من توفير وقت كبير باستخدام الوكلاء بدلاً من تشغيل وكيل واحد.
00:04:36كانت تلك كلها ادعاءات بناءً على ما قالوه.
00:04:39لاختبار هذه الادعاءات، قمنا بتثبيت KimiCode CLI،
00:04:42وهو وكيل برمجي جديد تم إصداره مع هذا النموذج.
00:04:45كنا قد بنينا بالفعل واجهة مستخدم وأردنا نقلها إلى هيكل مكونات مختلف.
00:04:49كانت الواجهة مبنية باستخدام ShadCN، وأردنا إعادة بنائها باستخدام Material UI.
00:04:53كان المشروع يحتوي على صفحات متعددة،
00:04:55لذا طلبنا من Kimi تغيير واجهة المشروع بالكامل من ShadCN إلى Material UI،
00:05:00وأن يستخدم وكلاء للتعامل مع كل صفحة،
00:05:02حتى نتمكن من إنجاز هذا النقل بشكل أسرع وبالتوازي.
00:05:05بدأ في استكشاف المجلدات، تماماً كما يفعل ClaudeCode.
00:05:08أنشأ قائمة مهام تحتوي على كل صفحة تحتاج للتحويل إلى Material UI.
00:05:13قام بتجميع الصفحات المتشابهة معاً،
00:05:15مثل صفحات المصادقة كالتسجيل، تسجيل الدخول، ونسيان كلمة السر للتعامل معها بفعالية أكبر.
00:05:20ومع ذلك، أطلق عدداً من الوكلاء أكثر مما كنا نتوقع،
00:05:23والذي اكتشفنا لاحقاً أنه كان خللاً في واجهة السطر البرمجي (CLI).
00:05:26لقد استخدم خمسة وكلاء فقط لأداء المهمة،
00:05:28وهو أمر كان متوقعاً لمنتج جديد.
00:05:30استغرق الأمر حوالي 15 دقيقة لإكمال المهمة،
00:05:32وهو وقت كنا نظن أنه سيتقلص باستخدام الوكلاء المتوازيين.
00:05:35انتهى بالتحقق من كل شيء وتنظيفه.
00:05:38بعض المكونات لم تعد مستخدمة بعد عملية النقل،
00:05:41وقام بتنظيفها أيضاً.
00:05:43تأكد من تثبيت وتحديث جميع التبعيات (dependencies)،
00:05:45بما في ذلك ملفات الاختبار، وصادق على البقية.
00:05:48بمجرد الانتهاء من ذلك، تأكد من إزالة جميع التبعيات المطلوبة لـ ShadCN،
00:05:53تاركاً المشروع بدون أي تبعيات غير مستخدمة،
00:05:55وهو أمر تميل معظم الوكلاء لنسيانه وينتهي الأمر بتضخيم المشروع بلا داعٍ.
00:05:59قام بتعديل الواجهة قليلاً.
00:06:01على سبيل المثال، كان قسم الواجهة الرئيسي يحتوي في الأصل على نص وصور جنباً إلى جنب،
00:06:05لكنه قام بتغييرها لتصبح متراصة عمودياً.
00:06:07بخلاف ذلك، بدا كل شيء متطابقاً تقريباً،
00:06:10مع مجرد تبديل المكونات.
00:06:12رغم ضخامة المهمة، إلا أنه استخدم 25% فقط من نافذة السياق،
00:06:16مما يعني قدرته على العمل بفعالية مع الوكلاء الذين يعملون لفترات طويلة.
00:06:19إذن، سرب الوكلاء يعمل فعلاً، لكنه ليس أسرع دائماً
00:06:22وقد يستغرق وقتاً أطول في المشاريع البرمجية الضخمة.
00:06:24ربما لاحظتم أننا نبني الكثير في هذه الفيديوهات.
00:06:27كل الأوامر، الأكواد، والقوالب،
00:06:29الأشياء التي تضطر عادةً لإيقاف الفيديو ونسخها من الشاشة.
00:06:32كلها موجودة في مجتمعنا، لهذا الفيديو ولكل فيديو قبله أيضاً.
00:06:35الروابط في الوصف.
00:06:37نقطة البيع الرئيسية لـ Kimi 2.5 هي ذكاؤه الوكيل البصري.
00:06:41يُزعم أنه قوي بشكل خاص في قدرات الواجهة الأمامية.
00:06:44يمكنه التفاعل مع وتنفيذ تخطيطات تفاعلية ورسوم متحركة غنية،
00:06:48مثل التمرير عبر النصوص.
00:06:50لقد قدموا أمثلة متعددة لرسوم متحركة تم إنشاؤها بشكل ممتاز.
00:06:53هنا يتألق حقاً.
00:06:55يتفوق Kimi 2.5 في البرمجة المعتمدة على الرؤية البصرية، متجاوزاً مجرد الأوامر النصية والصورية.
00:07:00يمكنه حتى استقبال فيديوهات كمدخلات وتوليد كود برمجى،
00:07:03مما يجعله من أوائل النماذج القادرة على فعل ذلك.
00:07:06هذا جعل شرح تسلسل الكود أسهل بكثير.
00:07:08هذه القدرة متعددة الوسائط لم تُضف لاحقاً بعد التدريب.
00:07:12بل تم دمجها أثناء تدريب النموذج.
00:07:14تدمج معظم النماذج قدرات إضافية
00:07:16فقط بعد أن تصبح قدراتها النصية قوية بما فيه الكفاية،
00:07:19مما يؤدي غالباً إلى مفاضلة بين قدرات الرؤية والنص.
00:07:23لكن مع منهجية تدريب Kimi 2.5،
00:07:25تختفي هذه المفاضلة وتتطور القدرتان معاً.
00:07:29الآن، كان علينا اختباره بأنفسنا.
00:07:30قمنا بتسجيل الشاشة أثناء التنقل في واجهة صفحة Notion الجديدة واستخدام أوامر الـ slash.
00:07:35أبقينا التسجيل صغيراً لأن التوثيق يذكر أن الفيديوهات محدودة بـ 40 ميغابايت.
00:07:40أعطيناه مسار تسجيل Notion وطلبنا منه استنساخ الموقع الموضح في الفيديو.
00:07:45لم نخبره صراحةً في الأمر بمحتوى التسجيل،
00:07:48لذا استخدم أداة قراءة ملفات الوسائط لتحليل الفيديو.
00:07:52استنتج أن الواجهة تشبه Notion، وحدد جميع الميزات،
00:07:56وقرر أنها نسخة من Notion بنافذة تشبه نظام Mac OS.
00:07:59بمجرد إدراج ما كان في الملف، بدأ في تنفيذه.
00:08:02إذا كنت تستخدم معالجة الفيديو في مشاريعك الخاصة، فتذكر هذا.
00:08:06يمكن للفيديوهات والصور أن تستنفد نافذة السياق بسرعة،
00:08:09لذا كن حذراً مع الملفات الكبيرة وراقب تضخم السياق.
00:08:12عندما قام بمحاكاة الواجهة، كان دقيقاً.
00:08:15كانت الواجهة قابلة للتعديل، بما في ذلك أيقونات الصفحات وميزات من Notion،
00:08:18على الرغم من أن بعضها لم يكن يعمل بكامل طاقته في البداية.
00:08:21أوامر الـ slash لم تكن تعمل بعد، لكن الواجهة العامة كانت دقيقة.
00:08:25كان من الأفضل لو تم تنفيذ أوامر الـ slash، فهي جزء أساسي من سير العمل.
00:08:29لكن هذه كانت مشكلة بسيطة يمكن إصلاحها بالتكرار.
00:08:32لذا أعطيناه أمراً نطلب فيه إصلاح المشاكل التي واجهناها في التنفيذ.
00:08:37من هناك، قام بالتكرار ذاتياً، منفذاً الإصلاحات، ومتحققاً من النتائج،
00:08:41وضمان عمل الميزة بشكل صحيح دون الحاجة إلى أي أمر إضافي منا.
00:08:46أدى هذا التكرار في النهاية إلى إصلاح مشكلة أوامر الـ slash،
00:08:49مما جعل الواجهة بأكملها تبدو كنسخة وظيفية من Notion.
00:08:52لذا فهو يفي بادعاءات النموذج.
00:08:54بعد العمل على بضع مشكلات، نعتقد أنه قد يكون بديلاً أرخص لـ Claude code،
00:08:58بما أن خطط Claude معروفة بكونها باهظة الثمن، وخطط Kimi أقل سعراً.
00:09:03بهذا نصل إلى نهاية هذا الفيديو.
00:09:05إذا كنت ترغب في دعم القناة ومساعدتنا في الاستمرار في صنع فيديوهات كهذه،
00:09:08يمكنك القيام بذلك عبر الانضمام إلى AI Labs Pro.
00:09:10كما هو الحال دائماً، شكراً للمشاهدة، وأراكم في الفيديو القادم.