إطلاق أفضل نموذج ذكاء اصطناعي جديد (GPT-5.4)

BBetter Stack
Computing/SoftwareSmall Business/StartupsBusiness NewsInternet Technology

Transcript

00:00:00يمكنكم تصفير عداد الأيام الآن، لأن هناك نموذجاً جديداً يتربع على العرش.
00:00:03هذه المرة هو GPT 5.4، وقد كنت أختبره، لذا إليكم كل ما تحتاجون معرفته
00:00:07إلى جانب الإيجابيات والسلبيات في 5 دقائق و 40 ثانية.
00:00:11إليكم النقاط الأساسية.
00:00:17يعد GPT 5.4 أفضل في العمل المعرفي والبحث على الويب، كما يتمتع بقدرات أصلية لاستخدام الكمبيوتر،
00:00:22هناك ميزة جديدة للبحث عن الأدوات سأشرحها بعد قليل، ويمكن توجيهه أثناء الاستجابة،
00:00:26هناك وضع سريع جديد ويحتوي أيضاً على نافذة سياق بسعة مليون توكن.
00:00:30يبدو أن الهدف من إصدار 5.4 كان دمج قدرات البرمجة في Codex 5.3 مع المعرفة،
00:00:34والبحث على الويب ومهارات العمل الاحترافية في GPT 5.2 لجعل 5.4 النموذج المتكامل
00:00:40الذي ينجز كل شيء.
00:00:41ووفقاً لتحليلات Benchmarks المستقلة من جهات خارجية، فقد حققوا
00:00:45ذلك الهدف بالفعل.
00:00:46فهو مصنف كأفضل نموذج برمجة، وأفضل نموذج وكيل (Agentic)، كما يتعادل
00:00:49مع Gemini كأفضل نموذج ذكاء.
00:00:51وإذا ركزنا على النقطة التي وجدتها الأكثر إثارة للاهتمام، فهي
00:00:55قدرته الأصلية على استخدام الكمبيوتر.
00:00:56يبدو أن OpenAI صممت هذا كأول نموذج متعدد الأغراض بقدرات مدمجة
00:01:00لاستخدام الكمبيوتر، لذا يفترض أن يتفوق في كتابة الأكواد لتشغيل الأجهزة عبر مكتبات مثل
00:01:04Playwright، بالإضافة إلى إصدار أوامر الماوس ولوحة المفاتيح استجابةً لصور الشاشة.
00:01:08لقد أصدروا مهارة Playwright تجريبية، لذا قمت بتجربتها.
00:01:12في Codex وباستخدام 5.4 والاستدلال العالي، أعطيته أمراً لإنشاء تجربة ثلاثية الأبعاد تفاعلية
00:01:16لجسر البرج (Tower Bridge) في لندن.
00:01:18استخدمت أيضاً المهارة الجديدة بالإضافة إلى مهارة توليد الصور حتى يتمكن من إنشاء
00:01:22أصوله الخاصة لاستخدامها كقوام (Textures).
00:01:24الآن، كانت التجربة نفسها مشابهة جداً لـ Codex 5.3 الذي كان حتى الآن
00:01:29نموذجي المفضل.
00:01:30بعد حوالي 20 دقيقة من العمل على المهمة، بدأ في استخدام
00:01:33مهارة Playwright الجديدة وكانت التجربة جيدة جداً.
00:01:37كان يفتح المتصفح، وينقر في الأرجاء، ويتنقل في المشهد، ويحدد أي مشاكل بصرية
00:01:41يحتاج لإصلاحها، مثل عدم اندماج هذه الخلفية في المشهد، ثم يعود
00:01:45إلى الكود ويصلحها ويكرر العملية، وكان كل شيء يبدو سلساً وطبيعياً جداً.
00:01:50استغرقت النسخة الأولى من هذا المشروع حوالي 30 دقيقة لتكتمل بالكامل من
00:01:54ذلك الأمر الوحيد، وبعد ذلك أرسلت بعض المتابعات لطلب المزيد من التفاصيل
00:01:58وبعض الإصلاحات مثل القوارب التي كانت مقلوبة وتداخل الطريق مع أنسجة أخرى،
00:02:03ومرة أخرى انطلق للعمل على تلك المهام لمدة 30 دقيقة تقريباً لكل أمر، حيث يفتح
00:02:07متصفح كروم ويتحقق ويجري التغييرات، ليعطيني هذه النسخة النهائية في حوالي ساعة
00:02:11ونصف من العمل و 3 أوامر فقط، وهي ليست مثالية بأي حال ولكن
00:02:16بالنسبة لتطوير تم دون أي تدخل يدوي، لا أظن الأمر سيئاً، وبالنسبة لي هذا النموذج
00:02:20هو ترقية بديهية لأولئك الذين يحبون Codex 5.3 بالفعل.
00:02:24وجدت من المضحك أنه بعد حوالي ساعتين من الاستخدام، نبهني النظام
00:02:27بأنه كان بإمكاني توفير ساعة من وقتي إذا انتقلت إلى الوضع السريع الجديد.
00:02:31هذا في الواقع هو نفس النموذج، بنفس الذكاء والتجربة، لكنه فقط
00:02:35يقدم سرعة توكن أسرع بـ 1.5 مرة لأنه يحاسبك بضعف الاستهلاك، فهو أساساً
00:02:41مجرد فئة ذات أولوية وليس نموذجاً مختلفاً على الإطلاق.
00:02:44النقطة الأخرى التي وجدتها مثيرة للاهتمام بشكل خاص في هذا الإصدار كانت البحث عن الأدوات.
00:02:48هذا يحل مشكلة تحميل جميع تعريفات الأدوات في موجه النظام
00:02:52بشكل مسبق، فإذا كان لديك الكثير من الأدوات وخوادم MCP، ينتهي بك الأمر بهدر التوكنز
00:02:56وتضخم السياق، مما قد يؤثر على جودة المخرجات.
00:03:00الآن مع GPT 5.4، يحتوي الموجه بدلاً من ذلك على قائمة خفيفة بالأدوات المتاحة ولدى النموذج
00:03:05بالفعل قدرة على البحث عن الأدوات، فعندما يحتاج النموذج إلى أداة ما، يمكنه ببساطة البحث عن
00:03:09تعريف تلك الأداة وإلحاقه بالمحادثة في اللحظة التي يحتاجه فيها.
00:03:13تقول OpenAI أن هذا يقلل من استخدام التوكنز بنسبة تصل إلى 47% وقد أظهروا ذلك في اختبار
00:03:18مع 36 خادم MCP حيث حافظ على نفس الدقة.
00:03:22إلى جانب تلك الميزات الجديدة التي استعرضناها، يركز هذا النموذج حقاً على تحسين
00:03:26الأدوات، سواء في كيفية استخدام النموذج لها أو متى يختار استخدامها،
00:03:30وقد أتى هذا بثماره في الاختبارات، ولكن لأكون صادقاً معكم، ليس هناك الكثير
00:03:34لذكره هنا سوى أن نعم، النموذج الجديد أفضل من النموذج السابق.
00:03:38أعتقد أنه يمكن تلخيص إيجابيات هذا النموذج في أنه أذكى، ويعمل لفترة أطول،
00:03:42ويستخدم الأدوات بشكل أفضل مما يعني أنه يمكنه إكمال مهام أصعب مما كان يستطيعه النموذج السابق.
00:03:47نعم، خبر عاجل للجميع: هذا النموذج أفضل من الإصدار السابق، ولكن لننتقل الآن
00:03:51للحديث عن بعض السلبيات.
00:03:52أبرز سلبية بالنسبة لي كانت السرعة.
00:03:54بينما أحب أن تستغرق نماذجي وقتاً أطول قليلاً في التفكير أحياناً، يبدو أن GPT 5.4
00:03:59يفعل ذلك أكثر من اللازم، أو ربما هو بطيء في التفكير الفعلي، ولست
00:04:04الوحيد الذي لاحظ ذلك بالتأكيد.
00:04:05أظهرت نتائج Artificial Analysis أن GPT 5.4 يستغرق أطول وقت لإرجاع
00:04:09التوكن بفارق كبير، وينطبق الشيء نفسه على الوقت المستغرق لإرجاع
00:04:14أول 500 توكن أيضاً.
00:04:15لست متأكداً ما إذا كانت هذه مشكلة في النموذج أم في المزود حالياً، لذا ربما
00:04:19يتحسن هذا بمرور الوقت، ولكن ربما النظرة الأكثر تشاؤماً هي أنه أبطأ لتضطر
00:04:24لاستخدام الوضع السريع الجديد.
00:04:26سلبية أخرى هي زيادة السعر بالنسبة لمن يستخدمون واجهة البرمجيات (API).
00:04:29النموذج الأساسي يكلف حالياً 2.50 دولار لكل مليون توكن مدخل و 15 دولاراً لكل مليون توكن مخرج،
00:04:34أما النموذج الاحترافي (Pro) فهو باهظ الثمن حقاً.
00:04:37يتم احتسابه بـ 30 دولاراً لكل مليون توكن مدخل و 180 دولاراً لكل مليون توكن مخرج، والأدهى من ذلك
00:04:43أنه إذا أردت الاستفادة من نافذة سياق المليون توكن الجديدة، فإن أي مدخلات
00:04:47تتجاوز 272,000 توكن ستتم محاسبتها بضعف السعر العادي.
00:04:52لذا ربما يجدر بك تقليص سياقك في الوقت الحالي.
00:04:55السلبية الأخيرة هي تصميم واجهة المستخدم، ورغم أن هذا أمر ذاتي بعض الشيء، فقد طلبت
00:04:59من Opus 4.6 و GPT 5.4 تصميم موقع لمقهى، وأعتقد أنني أفضل Opus هنا رغم أن
00:05:05أياً منهما لم يبهرني حقاً.
00:05:07أعتقد أن المشكلة الأساسية التي أواجهها مع GPT 5.4 وبعض نماذج GPT الأخرى
00:05:11هي أنها جميعاً تبدو بواجهة مستخدم متشابهة جداً.
00:05:14يبدو أنها تعشق هذا النوع من الواجهات التي تشبه البطاقات الضبابية، وبالطبع تعشق التدرجات اللونية.
00:05:19واضح أن هذا كان مجرد اختبار واحد قمت به، ولكن في Design Arena لا يحقق هذا النموذج
00:05:23مركزاً متقدماً أيضاً، لذا فهو أمر لا تبدو OpenAI قوية فيه حالياً.
00:05:27بشكل عام، سأعتمد هذا النموذج كنموذجي اليومي الأساسي بما أنني من عشاق Codex، ولكن يهمنا
00:05:32معرفة آرائكم.
00:05:33ما هو نموذجكم المفضل؟
00:05:34أخبروني في التعليقات أدناه، ولا تنسوا الاشتراك، وكالعادة نراكم
00:05:37في الفيديو القادم.

Key Takeaway

يعد GPT-5.4 نموذجاً متكاملاً يجمع بين قوة البرمجة والذكاء الوكيل وقدرات التحكم المباشر في الكمبيوتر، رغم تحديات البطء والتكلفة العالية.

Highlights

إطلاق نموذج GPT-5.4 الجديد الذي يدمج قدرات البرمجة المتطورة من Codex 5.3 مع المعرفة العامة والبحث من GPT-5.2.

يتميز النموذج بقدرات أصلية لاستخدام الكمبيوتر والتحكم في الماوس ولوحة المفاتيح استجابةً لصور الشاشة.

إدخال ميزة "البحث عن الأدوات" (Tool Search) التي تقلل استهلاك التوكنز بنسبة 47% عبر تحميل تعريفات الأدوات عند الحاجة فقط.

يتضمن النموذج وضعاً سريعاً (Fast Mode) يوفر سرعة أكبر بنسبة 1.5 مرة مقابل تكلفة مضاعفة.

نافذة سياق ضخمة تصل إلى مليون توكن، مع نظام تسعير يتصاعد عند تجاوز حد 272 ألف توكن.

رغم تفوقه التقني، يعاني النموذج من بطء في الاستجابة وارتفاع كبير في تكاليف واجهة البرمجيات (API) خاصة للنسخة الاحترافية.

Timeline

مقدمة واستعراض القدرات الأساسية

يبدأ الفيديو بالإعلان عن تربع نموذج GPT-5.4 على عرش نماذج الذكاء الاصطناعي كأفضل نموذج حالي. يوضح المتحدث أن هذا الإصدار يهدف لدمج مهارات Codex 5.3 البرمجية مع قدرات GPT-5.2 في البحث والعمل الاحترافي. تشمل الميزات الرئيسية نافذة سياق بمليون توكن، ووضعاً سريعاً، وقدرات متقدمة في العمل المعرفي. تشير الاختبارات المستقلة إلى تفوقه كأفضل نموذج برمجة ونموذج وكيل (Agentic) على مستوى السوق. يركز هذا القسم على أن الهدف هو خلق نموذج شامل ينجز كافة المهام بفعالية.

تجربة استخدام الكمبيوتر وتطوير البرمجيات

يستعرض المتحدث القدرة الأكثر إثارة وهي التحكم الأصلي في جهاز الكمبيوتر عبر أوامر الماوس ولوحة المفاتيح. قام بتجربة عملية لإنشاء مشروع ثلاثي الأبعاد لجسر البرج في لندن باستخدام مكتبة Playwright وتوليد الأنسجة ذاتياً. استغرق العمل حوالي ساعة ونصف وثلاثة أوامر فقط، حيث كان النموذج يصحح أخطاءه البصرية تلقائياً عبر المتصفح. يوضح الفيديو أن العملية كانت سلسة جداً وتشبه العمل اليدوي للمبرمجين المحترفين. يخلص المتحدث إلى أن النموذج يمثل ترقية بديهية وقوية لمستخدمي نماذج Codex السابقة.

الوضع السريع وميزة البحث عن الأدوات

يتناول هذا القسم ميزة "الوضع السريع" الذي يوفر سرعة معالجة أكبر بنسبة 50% مقابل تكلفة استهلاك مضاعفة. كما يشرح ميزة "البحث عن الأدوات" الثورية التي تحل مشكلة تضخم السياق وهدر التوكنز في الأنظمة المعقدة. بدلاً من تحميل كافة الأدوات مسبقاً، يقوم النموذج بالبحث عن تعريف الأداة المطلوبة وإلحاقها بالمحادثة لحظياً. أثبتت التجارب أن هذه الطريقة تقلل استهلاك التوكنز بنسبة 47% مع الحفاظ على دقة الأداء. يؤكد المتحدث أن النموذج الجديد يتفوق بوضوح على النسخ السابقة في كيفية وتوقيت استخدام الأدوات الملحقة.

السلبيات: السرعة، التكلفة، وواجهة المستخدم

ينتقل الفيديو لنقد السلبيات، وأبرزها البطء الملحوظ في زمن الاستجابة مقارنة بالمنافسين وفقاً لتحليلات Artificial Analysis. كما ينتقد الارتفاع الحاد في أسعار API، حيث تصل تكلفة المخرجات في النسخة الاحترافية إلى 180 دولاراً لكل مليون توكن. يذكر المتحدث أيضاً فرض رسوم مضاعفة على المدخلات التي تتجاوز سياق 272 ألف توكن، مما يجعل استخدامه مكلفاً جداً. من الناحية الجمالية، يرى المتحدث أن واجهة المستخدم مكررة وتعتمد بشكل مفرط على التدرجات والبطاقات الضبابية. يختتم الفيديو بدعوة المشاهدين لمشاركة آرائهم حول نموذجهم المفضل والاشتراك في القناة.

Community Posts

View all posts