00:00:00أطلقت Minimax لتوها نموذج M2.5، وهو نموذج برمجي يكاد يتفوق على Claude Opus 4.6، ولكن بتكلفة تعادل العشر فقط.
00:00:07تم إطلاقه منذ أيام قليلة، وهو مفتوح الأوزان، ويحتوي على 230 مليار معلمة، ومصمم خصيصاً لمهام الوكلاء الذكيين.
00:00:14إذا كنت تبني وكلاء ذكاء اصطناعي، أو مساعدين برمجيين، أو أدوات أتمتة، فهذا النموذج سيغير تكاليفك بين عشية وضحاها.
00:00:19والأمر المذهل لا يقتصر فقط على نتائج الاختبارات، بل يشمل السعر أيضاً.
00:00:23نحن ننشر فيديوهات باستمرار، لذا تأكدوا من الاشتراك.
00:00:31نموذج Minimax M2.5 هو نموذج “خليط من الخبراء” (MoE) بإجمالي 230 مليار معلمة، لكن 10 مليارات منها فقط تكون نشطة أثناء التشغيل.
00:00:39بذلك تحصل على نموذج ضخم دون الحاجة لدفع تكلفة تشغيله بالكامل في كل مرة.
00:00:43إنه مصمم لمهام التطوير الواقعية، باستخدام Python و Java و Rust، وإعادة هيكلة الملفات المتعددة، واستدعاء الأدوات، وحتى أتمتة Word و Excel.
00:00:53يوجد إصداران منه: النسخة القياسية (Standard) بسرعة 50 رمزاً في الثانية، ونسخة البرق (Lightning) بسرعة 100 رمز في الثانية.
00:01:01النموذج متعدد اللغات، وأوزانه مفتوحة بالكامل على منصة Hugging Face.
00:01:05هذا يعني أنه يمكنك ضبطه بدقة، وتشغيله محلياً، وتجنب الارتباط بمزود واحد، وهنا تصبح الأمور مثيرة للاهتمام بالنسبة للوكلاء.
00:01:12قمت بتجربة نفس الأمر (Prompt) على كل من Opus و Minimax لبناء لوحة “كانبان” كاملة.
00:01:18لم يكن طلباً معقداً للغاية، بل كان كافياً لاختبار قدرتهما على البناء ورؤية الفرق بينهما.
00:01:23وضعت نص الأمر الذي استخدمته في الوصف إذا أردتم الاطلاع عليه، لكن أولاً سننظر إلى نسخة Opus التي استغرقت حوالي 4 دقائق للتنفيذ.
00:01:31حصلنا على ما كنا نتوقعه، لم أضطر لإعطائه أوامر إضافية، وكانت هذه هي النتيجة النهائية.
00:01:37كل شيء هنا يسير بسلاسة تامة، ويعمل بشكل جيد جداً، كما أن واجهة المستخدم تبدو جيدة كبداية.
00:01:44خاصية السحب والإفلات تعمل كما يجب، وتحرير المهام يعمل أيضاً بشكل صحيح. أعجبتني هذه التسمية الصغيرة للمجلد الصحيح، وكيف تتغير عند سحبها. هذه لمسة إضافية رائعة.
00:01:55بشكل عام، أدى Opus عملاً ممتازاً، وهذا ما كنت أتوقعه فعلياً.
00:02:00الآن ننتقل إلى Minimax. استغرق الأمر حوالي 8 دقائق للانتهاء، ربما لأنني قمت باستيراده إلى Cursor بدلاً من تشغيله على موقعهم، لكنني أردت تجربته في Cursor.
00:02:10رغم أنه استغرق وقتاً أطول، إلا أنه كلف عُشر السعر فقط، لذا لن أجادل في ذلك.
00:02:14إجمالاً، أدى عملاً جيداً جداً من أمر واحد فقط. واجهة المستخدم تفتقر لبعض اللمسات مقارنة بـ Opus، لكننا لا نزال نملك نفس الوظائف.
00:02:22يمكنني إنشاء المهام وسحبها وإفلاتها في العمود الصحيح، فكل ذلك يعمل بشكل رائع.
00:02:27الشيء الوحيد الذي لم يفعله هو إضافة تلك التسمية الصغيرة التي أعجبتني على كل بطاقة كما فعل Opus.
00:02:33نقطة أخرى لم يصب فيها هي القدرة على تحرير وصف المربع.
00:02:38إذا حاولت تعديل الوصف، كما ترون هنا، لا يتغير شيء.
00:02:42لذا سأحتاج لتشغيله مرة ثانية لجعله يقوم بما هو مطلوب بالضبط.
00:02:48وهذا لا يزال مقبولاً، لأن التكلفة مجدداً هي العُشر فقط.
00:02:51دعونا نتحدث عما يهم المطورين فعلاً. يستخدم M2.5 التعلم المعزز لتفكيك المهام.
00:02:58لذا فهو يحلل المشكلات بشكل أفضل، مما يؤدي إلى تقليل استدعاءات الأدوات بنسبة 20% وتقليل هدر الرموز (Tokens) بنسبة 5%.
00:03:06إذا سبق لك بناء وكلاء ذكاء اصطناعي، فأنت تعلم أن استدعاءات الأدوات هي النقطة التي تبدأ عندها التكاليف بالارتفاع وقد تؤدي إلى فوضى.
00:03:13كما أنه يتعامل مع تعديلات الملفات المتعددة، ودورات التشغيل وتصحيح الأخطاء، والتبديل بين الأدوات دون أن ينهار الأداء.
00:03:21وفي اختبارات البحث، يقلل النموذج من جولات البحث بنسبة 20% مقارنة بالإصدار السابق M2.1.
00:03:27ويدعم التخزين المؤقت (Caching) أيضاً، مما يعني أن الاستعلامات المتكررة قد تكلف أقل بمرور الوقت.
00:03:32يمكنك دمجه مباشرة مع Llama، أو المجموعات المحلية، أو أتمتة GitHub، أو خطوط أنابيب CI الخاصة بك.
00:03:37الآن بالنسبة لنتائج الاختبارات، أليس كذلك؟ أنا أقارنه بـ Opus هنا.
00:03:40حسناً، في اختبار SWE-bench Verified، سجل M2.5 أكثر من 80%.
00:03:45بينما سجل Claude Opus 4.6 نسبة أعلى قليلاً تتجاوز 80% أيضاً. الفجوة هنا صغيرة جداً.
00:03:52وفي اختبار multi-SWE-bench، سجل أكثر من 51% متفوقاً على النماذج المفتوحة الأخرى.
00:03:58وفي اختبار DROID، تفوق بالفعل على Opus بنسبة 0.2% فقط. لذا فالأمر يعتمد على جانب المقارنة.
00:04:05أما السرعة، فهو أسرع بنسبة 37% من نموذجهم السابق. ومع ذلك استغرق 8 دقائق هنا.
00:04:11يتمتع Opus 4.6 بمتوسط سرعة أعلى قليلاً، لكنهما يتساويان عند تشغيله بالتنسيق الصحيح.
00:04:18ماذا يعني كل هذا بالنسبة لك؟ حسناً، قد يعني عدة أمور.
00:04:20قد يعني محاولات إعادة أقل، وعمليات CI أنظف، واستهلاكاً أقل للرموز، والمزيد من طلبات السحب (PRs) المقبولة.
00:04:26وفي أداء المهام المعتمدة على الوكلاء الذكيين، فإنه يضاهي مستويات GPT-5 أو Gemini 3 Pro،
00:04:32ولكن مع أوزان مفتوحة. والآن لنتحدث عن الجزء الذي يغير قواعد اللعبة حقاً،
00:04:37وهو السعر، حتى لو استغرق وقتاً أطول.
00:04:40تبلغ تكلفة نسخة M2.5 Standard حوالي 0.15 دولار لكل مليون رمز مدخل، و1.20 دولار لكل مليون رمز مخرج.
00:04:47أما نسخة Lightning فتكلف ضعف ذلك؛ أي 0.30 دولار للمدخلات و2.40 دولار للمخرجات.
00:04:53تشغيل نسخة Lightning بسرعة 100 رمز في الثانية لمدة ساعة يكلف حوالي دولار واحد.
00:04:56وإذا استخدمت النسخة القياسية، وهو ما فعلته هنا، فستكلف حوالي 30 سنتاً في الساعة.
00:05:00الآن قارن ذلك بـ Claude Opus 4.6. فرق شاسع.
00:05:045 دولارات لكل مليون رمز مدخل، و25 دولاراً لكل مليون رمز مخرج.
00:05:09لكل مهمة برمجية، تبلغ التكلفة حوالي 10% من تكلفة Opus، بفضل الكفاءة وعدد أقل من استدعاءات الأدوات.
00:05:15هناك أيضاً فئة مجانية لواجهة البرمجيات (API) متاحة الآن. أنا قمت بالدفع مقابل التجربة،
00:05:20ولكن لديهم ذلك الخيار. وهنا تبدأ الجدوى الاقتصادية في التحول فعلياً.
00:05:24فهل يجب عليك الانتقال من Opus 4.6؟ حسناً، من حيث الأداء فهما متطابقان تقريباً.
00:05:30استغرق وقتاً أطول قليلاً، أليس كذلك؟ كنت أستخدم النسخة القياسية وليس Lightning، لكنهما متماثلان نوعاً ما.
00:05:34وقت إنجاز المهام هو نفسه تقريباً، وعمق الاستنتاج كان قابلاً للمقارنة.
00:05:39أما من حيث التكلفة، فهو أرخص بكثير. لذا القرار لك.
00:05:43كما أنه يستخدم استدعاءات أدوات أقل بنسبة 20% ولا يهدر تلك الرموز، كما ذكرت سابقاً.
00:05:47ومن ناحية المرونة، فأوزانه مفتوحة. يمكنك نشره محلياً، مما يعني إمكانية ضبطه بدقة.
00:05:52ولا يزال Opus يتمتع بأفضلية في المستويات العليا جداً من الذكاء الفائق.
00:05:57لذا، يظل هذا هو النموذج المتميز الذي نعمل معه حالياً.
00:06:00وهنا يكمن سبب أهمية هذا الأمر، لأنه يمكنك الآن تشغيل الوكلاء على نطاق واسع دون عبء التكلفة.
00:06:05بما أن M2.5 حقق نسبة فوز 59% في اختبارات الوكلاء المتقدمة، يمكنك بناء بوتات برمجية ذاتية العمل،
00:06:12وتشغيل وكلاء برمجة مستمرين، وأتمتة سير العمل في الشركات. ليس مثالياً تماماً،
00:06:17لكنه جيد جداً بناءً على ما رأيناه هنا. والسعر سيسمح لك بالتجربة والاختبار بشكل كامل.
00:06:22كما أن Minimax تصدر تحديثاتها بسرعة، وتتطور خلال أسابيع بدلاً من شهور.
00:06:27تكاملات Ollama و GitHub بدأت تتسارع بالفعل.
00:06:32يوفر Minimax M2.5 أداءً برمجياً بمستوى Opus وبسعر اقتصادي مع أوزان مفتوحة.
00:06:38هذا المزيج نادر، ولكن في عام 2026 من يدري ما الذي سنراه. يمكنكم تجربته مجاناً عبر Minimax أو تشغيله على Ollama أو استخدام واجهة البرمجيات كما فعلت.
00:06:43هل سيكون هذا هو النموذج الافتراضي الجديد لوكلاء التطوير؟ سنرى كيف ستسير الأمور.
00:06:48نراكم في فيديو آخر.