00:00:00يمكنكم تصفير عداد الأيام الآن، لأن هناك نموذجاً جديداً يتربع على العرش.
00:00:03هذه المرة هو GPT 5.4، وقد كنت أختبره، لذا إليكم كل ما تحتاجون معرفته
00:00:07إلى جانب الإيجابيات والسلبيات في 5 دقائق و 40 ثانية.
00:00:11إليكم النقاط الأساسية.
00:00:17يعد GPT 5.4 أفضل في العمل المعرفي والبحث على الويب، كما يتمتع بقدرات أصلية لاستخدام الكمبيوتر،
00:00:22هناك ميزة جديدة للبحث عن الأدوات سأشرحها بعد قليل، ويمكن توجيهه أثناء الاستجابة،
00:00:26هناك وضع سريع جديد ويحتوي أيضاً على نافذة سياق بسعة مليون توكن.
00:00:30يبدو أن الهدف من إصدار 5.4 كان دمج قدرات البرمجة في Codex 5.3 مع المعرفة،
00:00:34والبحث على الويب ومهارات العمل الاحترافية في GPT 5.2 لجعل 5.4 النموذج المتكامل
00:00:40الذي ينجز كل شيء.
00:00:41ووفقاً لتحليلات Benchmarks المستقلة من جهات خارجية، فقد حققوا
00:00:45ذلك الهدف بالفعل.
00:00:46فهو مصنف كأفضل نموذج برمجة، وأفضل نموذج وكيل (Agentic)، كما يتعادل
00:00:49مع Gemini كأفضل نموذج ذكاء.
00:00:51وإذا ركزنا على النقطة التي وجدتها الأكثر إثارة للاهتمام، فهي
00:00:55قدرته الأصلية على استخدام الكمبيوتر.
00:00:56يبدو أن OpenAI صممت هذا كأول نموذج متعدد الأغراض بقدرات مدمجة
00:01:00لاستخدام الكمبيوتر، لذا يفترض أن يتفوق في كتابة الأكواد لتشغيل الأجهزة عبر مكتبات مثل
00:01:04Playwright، بالإضافة إلى إصدار أوامر الماوس ولوحة المفاتيح استجابةً لصور الشاشة.
00:01:08لقد أصدروا مهارة Playwright تجريبية، لذا قمت بتجربتها.
00:01:12في Codex وباستخدام 5.4 والاستدلال العالي، أعطيته أمراً لإنشاء تجربة ثلاثية الأبعاد تفاعلية
00:01:16لجسر البرج (Tower Bridge) في لندن.
00:01:18استخدمت أيضاً المهارة الجديدة بالإضافة إلى مهارة توليد الصور حتى يتمكن من إنشاء
00:01:22أصوله الخاصة لاستخدامها كقوام (Textures).
00:01:24الآن، كانت التجربة نفسها مشابهة جداً لـ Codex 5.3 الذي كان حتى الآن
00:01:29نموذجي المفضل.
00:01:30بعد حوالي 20 دقيقة من العمل على المهمة، بدأ في استخدام
00:01:33مهارة Playwright الجديدة وكانت التجربة جيدة جداً.
00:01:37كان يفتح المتصفح، وينقر في الأرجاء، ويتنقل في المشهد، ويحدد أي مشاكل بصرية
00:01:41يحتاج لإصلاحها، مثل عدم اندماج هذه الخلفية في المشهد، ثم يعود
00:01:45إلى الكود ويصلحها ويكرر العملية، وكان كل شيء يبدو سلساً وطبيعياً جداً.
00:01:50استغرقت النسخة الأولى من هذا المشروع حوالي 30 دقيقة لتكتمل بالكامل من
00:01:54ذلك الأمر الوحيد، وبعد ذلك أرسلت بعض المتابعات لطلب المزيد من التفاصيل
00:01:58وبعض الإصلاحات مثل القوارب التي كانت مقلوبة وتداخل الطريق مع أنسجة أخرى،
00:02:03ومرة أخرى انطلق للعمل على تلك المهام لمدة 30 دقيقة تقريباً لكل أمر، حيث يفتح
00:02:07متصفح كروم ويتحقق ويجري التغييرات، ليعطيني هذه النسخة النهائية في حوالي ساعة
00:02:11ونصف من العمل و 3 أوامر فقط، وهي ليست مثالية بأي حال ولكن
00:02:16بالنسبة لتطوير تم دون أي تدخل يدوي، لا أظن الأمر سيئاً، وبالنسبة لي هذا النموذج
00:02:20هو ترقية بديهية لأولئك الذين يحبون Codex 5.3 بالفعل.
00:02:24وجدت من المضحك أنه بعد حوالي ساعتين من الاستخدام، نبهني النظام
00:02:27بأنه كان بإمكاني توفير ساعة من وقتي إذا انتقلت إلى الوضع السريع الجديد.
00:02:31هذا في الواقع هو نفس النموذج، بنفس الذكاء والتجربة، لكنه فقط
00:02:35يقدم سرعة توكن أسرع بـ 1.5 مرة لأنه يحاسبك بضعف الاستهلاك، فهو أساساً
00:02:41مجرد فئة ذات أولوية وليس نموذجاً مختلفاً على الإطلاق.
00:02:44النقطة الأخرى التي وجدتها مثيرة للاهتمام بشكل خاص في هذا الإصدار كانت البحث عن الأدوات.
00:02:48هذا يحل مشكلة تحميل جميع تعريفات الأدوات في موجه النظام
00:02:52بشكل مسبق، فإذا كان لديك الكثير من الأدوات وخوادم MCP، ينتهي بك الأمر بهدر التوكنز
00:02:56وتضخم السياق، مما قد يؤثر على جودة المخرجات.
00:03:00الآن مع GPT 5.4، يحتوي الموجه بدلاً من ذلك على قائمة خفيفة بالأدوات المتاحة ولدى النموذج
00:03:05بالفعل قدرة على البحث عن الأدوات، فعندما يحتاج النموذج إلى أداة ما، يمكنه ببساطة البحث عن
00:03:09تعريف تلك الأداة وإلحاقه بالمحادثة في اللحظة التي يحتاجه فيها.
00:03:13تقول OpenAI أن هذا يقلل من استخدام التوكنز بنسبة تصل إلى 47% وقد أظهروا ذلك في اختبار
00:03:18مع 36 خادم MCP حيث حافظ على نفس الدقة.
00:03:22إلى جانب تلك الميزات الجديدة التي استعرضناها، يركز هذا النموذج حقاً على تحسين
00:03:26الأدوات، سواء في كيفية استخدام النموذج لها أو متى يختار استخدامها،
00:03:30وقد أتى هذا بثماره في الاختبارات، ولكن لأكون صادقاً معكم، ليس هناك الكثير
00:03:34لذكره هنا سوى أن نعم، النموذج الجديد أفضل من النموذج السابق.
00:03:38أعتقد أنه يمكن تلخيص إيجابيات هذا النموذج في أنه أذكى، ويعمل لفترة أطول،
00:03:42ويستخدم الأدوات بشكل أفضل مما يعني أنه يمكنه إكمال مهام أصعب مما كان يستطيعه النموذج السابق.
00:03:47نعم، خبر عاجل للجميع: هذا النموذج أفضل من الإصدار السابق، ولكن لننتقل الآن
00:03:51للحديث عن بعض السلبيات.
00:03:52أبرز سلبية بالنسبة لي كانت السرعة.
00:03:54بينما أحب أن تستغرق نماذجي وقتاً أطول قليلاً في التفكير أحياناً، يبدو أن GPT 5.4
00:03:59يفعل ذلك أكثر من اللازم، أو ربما هو بطيء في التفكير الفعلي، ولست
00:04:04الوحيد الذي لاحظ ذلك بالتأكيد.
00:04:05أظهرت نتائج Artificial Analysis أن GPT 5.4 يستغرق أطول وقت لإرجاع
00:04:09التوكن بفارق كبير، وينطبق الشيء نفسه على الوقت المستغرق لإرجاع
00:04:14أول 500 توكن أيضاً.
00:04:15لست متأكداً ما إذا كانت هذه مشكلة في النموذج أم في المزود حالياً، لذا ربما
00:04:19يتحسن هذا بمرور الوقت، ولكن ربما النظرة الأكثر تشاؤماً هي أنه أبطأ لتضطر
00:04:24لاستخدام الوضع السريع الجديد.
00:04:26سلبية أخرى هي زيادة السعر بالنسبة لمن يستخدمون واجهة البرمجيات (API).
00:04:29النموذج الأساسي يكلف حالياً 2.50 دولار لكل مليون توكن مدخل و 15 دولاراً لكل مليون توكن مخرج،
00:04:34أما النموذج الاحترافي (Pro) فهو باهظ الثمن حقاً.
00:04:37يتم احتسابه بـ 30 دولاراً لكل مليون توكن مدخل و 180 دولاراً لكل مليون توكن مخرج، والأدهى من ذلك
00:04:43أنه إذا أردت الاستفادة من نافذة سياق المليون توكن الجديدة، فإن أي مدخلات
00:04:47تتجاوز 272,000 توكن ستتم محاسبتها بضعف السعر العادي.
00:04:52لذا ربما يجدر بك تقليص سياقك في الوقت الحالي.
00:04:55السلبية الأخيرة هي تصميم واجهة المستخدم، ورغم أن هذا أمر ذاتي بعض الشيء، فقد طلبت
00:04:59من Opus 4.6 و GPT 5.4 تصميم موقع لمقهى، وأعتقد أنني أفضل Opus هنا رغم أن
00:05:05أياً منهما لم يبهرني حقاً.
00:05:07أعتقد أن المشكلة الأساسية التي أواجهها مع GPT 5.4 وبعض نماذج GPT الأخرى
00:05:11هي أنها جميعاً تبدو بواجهة مستخدم متشابهة جداً.
00:05:14يبدو أنها تعشق هذا النوع من الواجهات التي تشبه البطاقات الضبابية، وبالطبع تعشق التدرجات اللونية.
00:05:19واضح أن هذا كان مجرد اختبار واحد قمت به، ولكن في Design Arena لا يحقق هذا النموذج
00:05:23مركزاً متقدماً أيضاً، لذا فهو أمر لا تبدو OpenAI قوية فيه حالياً.
00:05:27بشكل عام، سأعتمد هذا النموذج كنموذجي اليومي الأساسي بما أنني من عشاق Codex، ولكن يهمنا
00:05:32معرفة آرائكم.
00:05:33ما هو نموذجكم المفضل؟
00:05:34أخبروني في التعليقات أدناه، ولا تنسوا الاشتراك، وكالعادة نراكم
00:05:37في الفيديو القادم.