انتهى الجدال.. مقارنة Claude Code ضد Codex وأيهما الأفضل للبرمجة

AAI LABS
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00لفترة طويلة، كان الجميع يعتمد على نموذج Claude كخيارهم الأول للبرمجة.
00:00:03ليس فقط بسبب أدائه الجيد، بل لعدم وجود خيارات أخرى في نفس مستواه.
00:00:07ثم تقدمت نماذج GPT وقلصت الفجوة، خاصة مع إصدار GPT 5.5، الذي
00:00:12جعل الفارق يكاد ينعدم.
00:00:14لمقارنة الاثنين، احتجنا لوضعهما في البيئات المصممة لهما بشكل أفضل، وهو ما
00:00:18يعني واجهات السطر البرمجي (CLIs) الخاصة بكل منهما.
00:00:19لذلك نضع Opus 4.7 وGPT 5.5 قيد الاختبار، لنرى كيف سيكون أداؤهما مقابل
00:00:25بعضهما البعض.
00:00:26سنختبرهما عبر 9 فئات لنكتشف أيهما يتفوق فعلياً،
00:00:29وفي النهاية، ستعرف أيهما يستحق مكاناً في سير عملك.
00:00:33سهولة الاستخدام هي النقطة التي يبدأ فيها Claude Code بالانهيار بالنسبة لنا.
00:00:36لقد استخدمناه في معظم مهامنا، البرمجية وغير البرمجية، لكنه كان جيداً فقط
00:00:40حتى تحديث الإصدار 2.1.0.
00:00:43بعد ذلك، بدأت الأمور تتدهور بالنسبة لـ Claude Code.
00:00:46واجهة المستخدم هي الجزء الأكثر إحباطاً لأنها تؤثر بشكل أكبر على التجربة.
00:00:50تحدث أعطال في مبنى الأوامر، وتتوقف معالجة الرسوم، والكثير مما كان يبدو متقناً بات الآن
00:00:55غير مضبوط.
00:00:56لقد كان واحداً من أفضل واجهات المستخدم النصية (TUIs)، لكن فقط حتى بدأ التلاعب في أكواده.
00:00:59الآن يبدو أكثر تعطلاً مع وجود أخطاء متعددة مثل مشاكل الرسوم وتسريبات الذاكرة المخبئية،
00:01:03والتي لم نكن نحن الوحيدين الذين يشتكون منها.
00:01:05المشكلة الأكبر هي أنهم أزالوا وضع "تخطي الأذونات الخطرة" واستبدلوه
00:01:09بالوضع التلقائي بشكل افتراضي.
00:01:11كنا نشغل وضع تجاوز الأذونات في معظم مهامنا، مع إعداد استدعاءات تلقائية لأي
00:01:15ملفات لا نريد من Claude لمسها.
00:01:17الآن يطلب الأذونات حتى في ذلك الوضع؛ فعندما أعطينا Claude أمراً لإنشاء مهارات،
00:01:22انتقلنا إلى جلسة Claude أخرى للقيام بشيء آخر، لنكتشف لاحقاً أن عملية إنشاء المهارة
00:01:27توقفت بسبب طلب إذن للكتابة في مجلد .claude طوال ذلك الوقت.
00:01:32عدنا ونحن نتوقع إنشاء المهارات، لنجده مجرد متوقف ينتظر.
00:01:36يتعامل Codex مع هذا بشكل أفضل لأن وضع YOLO الخاص به لا يطلب أي أذونات بالطريقة
00:01:40التي يفعلها الوضع التلقائي في Claude Code.
00:01:42واجهة السطر البرمجي مبنية بلغة Rust، لذا فالواجهة أكثر سلاسة بكثير من إعداد Claude Code المبني على React،
00:01:47وحتى بعد جلسة طويلة، لا شيء يتعطل.
00:01:49تعديل الشخصية هو نقطة أخرى يتفوق فيها Codex.
00:01:53يمكننا ضبط الشخصية لاستخدام لغة أكثر مباشرة وإيجازاً.
00:01:56هذا لأن GPT 5.5 يتسم بمداهنة أكبر بكثير وموافقته على كل أمر
00:02:02مقارنةً بنموذج Opus 4.7.
00:02:04لهذا السبب، فإن تغيير الشخصية في Codex يمنع هذا السلوك الافتراضي في النموذج.
00:02:08لجعل Opus 4.7 مباشراً، علينا الاعتماد على التعليمات في ملف Claude.md، بينما يقوم Codex
00:02:14بذلك بمجرد تغيير في الإعدادات.
00:02:16المهارات المثبتة مسبقاً هي فرق آخر.
00:02:18يأتي Codex مزوداً بالكثير من المهارات التي لا يملكها Claude Code، بما في ذلك مهارة متصفح الوكيل.
00:02:22هذا يهم أي شخص يبني تطبيقات، لأننا في Codex لا نحتاج لربط بروتوكولات MCP
00:02:26يدوياً من أجل التحقق عبر المتصفح.
00:02:29هو يفعل ذلك تلقائياً بعد تنفيذ أي ميزة.
00:02:31كما يحتوي على منشئ مهارات مدمج، فعندما نريد مهارة جديدة، يقوم بإنشاء واحدة
00:02:35كاملة بالهيكل الصحيح وملفات المراجع.
00:02:38في Claude، سنحتاج لتثبيت منشئ المهارات بشكل منفصل للحصول على مهارة
00:02:42ذات هيكل صحيح.
00:02:43وإلا، فإنه يكتفي بكتابة ملف MD فقط.
00:02:45والآن، لا يزال هناك أمران يتفوق فيهما Claude Code.
00:02:47لا يوفر Codex خاصية التراجع، وهي الميزة التي نستخدمها كثيراً، لذا فعدم وجودها
00:02:51يعد سلبية حقيقية.
00:02:52كما يتيح لنا Claude Code رؤية تفكيره من خلال توسيعه باستخدام Ctrl+O، وهو ما لا يفعله
00:02:57Codex بشكل جيد.
00:02:58رؤية التفكير مفيدة لأننا نستطيع تصحيح النهج في منتصف المهمة بدلاً من
00:03:02انتظار انتهاء التنفيذ ثم إعادته من جديد.
00:03:05لذا، بالنظر إلى كيفية تدهور تجربة مستخدم Claude Code مع كل تحديث جديد، يحصل Codex على
00:03:10نقطة لصالح سهولة الاستخدام.
00:03:11من حيث التكلفة، Claude Code هو الأداة الأغلى بفارق كبير.
00:03:15ليس من حيث الأسعار الفعلية، بل من حيث سهولة الاستخدام مقابل نفس السعر.
00:03:19Claude Code غير متوفر في الخطة المجانية على الإطلاق، وهو متاح فقط بدءاً من
00:03:23خطتي Pro و Max.
00:03:24أسعار هذه الخطط متطابقة تقريباً.
00:03:26خطة Pro غير قابلة للاستخدام أساساً لأي تطبيق ذو حجم جيد لأنها تصل
00:03:30إلى حدودها القصوى بعد مهام قليلة فقط.
00:03:32لا يمكننا حتى استخدام Opus 4.7 بشكل لائق لأي مهمة ذات قيمة في خطة Pro.
00:03:36الحدود تنفد بسرعة كبيرة حتى في خطة Max التي نستخدمها.
00:03:39Codex في وضع أفضل منذ البداية.
00:03:41فهو متاح حتى في الخطة المجانية مع استخدام محدود.
00:03:44كلاهما يستخدم آلية نافذة الـ 5 ساعات المتشابهة، لذا لنرى أيهما ينجز عملاً أكثر،
00:03:49قمنا بتشغيلهما في مهام بنفس الحجم.
00:03:51يمتلك Claude Code بالفعل أمر سياق يوضح عدد الرموز (tokens) التي استهلكتها الجلسة،
00:03:56لكن Codex لا يملك ما يعادل ذلك مدمجاً، لذا اضطررنا لإيجاد حل بديل للمقارنة.
00:04:00كلا الأداتين تخزنان جلساتهما كملفات JSON، لكن بتنظيم مختلف فقط.
00:04:04لذا بنينا أداة صغيرة تقرأ هذه الملفات وتحسب الرموز المستخدمة في كل جلسة.
00:04:08على نفس التطبيق وبمستوى مماثل من تصحيح الأخطاء، استهلك Opus 4.7 حوالي 173,000 رمز بينما
00:04:15استخدم GPT 5.5 حوالي 82,000 فقط.
00:04:18هذا لأن GPT 5.5 ينجز العمل بعدد أقل من الرموز ومحاولات إعادة أقل بكثير.
00:04:23لذلك صمد Codex لفترة أطول بكثير وتبين أنه أكثر كفاءة من حيث التكلفة لنفس العمل.
00:04:28ولكن قبل أن نمضي قدماً، لنستمع إلى كلمة من راعينا، Stream.
00:04:32أنت تبني تطبيقاً ويحتاج مستخدموك للتحدث، والبث، والتواصل.
00:04:35تحاول التعامل مع ذلك بنفسك وبعد 3 أشهر، تجد نفسك لا تزال تصحح الأخطاء بدلاً من الإطلاق.
00:04:39Stream يختصر كل ذلك.
00:04:40يمنحك Stream كل شيء جاهزاً؛ من الدردشة داخل التطبيق ومكالمات الفيديو إلى خلاصات
00:04:44النشاط والإشراف بالذكاء الاصطناعي، لتطلق الميزات بدلاً من بناء البنية التحتية من الصفر.
00:04:49نحن نتحدث عن مراسلة بأسلوب WhatsApp، ومكالمات فيديو بأسلوب Zoom، وخلاصات بأسلوب Instagram، كلها مدمجة.
00:04:55ما يميز Stream حقاً هو إطلاقه الجديد، Vision Agents.
00:04:58يمكنك بناء وكلاء ذكاء اصطناعي أذكياء يرون ويسمعون ويتفاعلون مع الفيديو والصوت المباشر،
00:05:02كل ذلك بلغة Python وببضعة أسطر برمجية فقط.
00:05:05كل شيء يعمل على شبكة حافة عالمية لضمان زمن وصول منخفض في كل مكان.
00:05:08من الشركات الناشئة إلى التطبيقات الكبيرة، تعتمد المنصات الرائدة في مجالات التواصل واللياقة والمجتمع
00:05:13على Stream لخدمة أكثر من مليار مستخدم نهائي.
00:05:16إذا كنت مطوراً تبني التطبيق الكبير القادم، فإن Stream يتوسع معك منذ اليوم الأول.
00:05:20ابدأ مجاناً عبر getstream.io، الروابط في التعليق المثبت.
00:05:24الاختبار الحقيقي لكلا النموذجين يكمن في كيفية بنائهما للمنتجات.
00:05:27كما ذكرنا سابقاً، GPT 5.5 أسرع ويستهلك رموزاً أقل، لذا يطلق تطبيقات تعمل بشكل أسرع.
00:05:33يستهلك Opus 4.7 رموزاً أكثر في التفكير، ويخطط بعمق أكبر، ويكرر العمل على كافة جوانب
00:05:38التطبيق في نفس الوقت.
00:05:40كان التخطيط هو أول شيء أردنا اختباره.
00:05:42لقد كنا نستخدم وضع التخطيط في Claude Code لفترة طويلة.
00:05:45إنه يغطي معظم الأشياء، وبه بعض العيوب، لكنه لا يزال قابلاً للاستخدام تماماً.
00:05:48لذا أردنا رؤية كيفية أداء GPT 5.5 في التخطيط، لأن OpenAI تدعي أنه يؤدي بشكل أفضل
00:05:53في مهام التخطيط وتنفيذها.
00:05:55قمنا بتفعيل وضع التخطيط وفتحناه في مجلد يحتوي بالفعل على خلفية برمجية لتطبيق
00:06:00وهي واجهة برمجة تطبيقات مبنية باستخدام FastAPI، وطلبنا منه بناء الواجهة الأمامية لها.
00:06:04لقد استكشف المشروع بدقة وطرح بضعة أسئلة، لكن الأسئلة كانت بسيطة
00:06:08إلى حد ما.
00:06:09كان بإمكانه التعمق أكثر في كيفية رغبتنا في شكل الواجهة الأمامية، لأنه بالنسبة لأعمال
00:06:13الواجهة الأمامية، هذا الأمر يهم.
00:06:14كانت الخطة التي أنتجها بسيطة للغاية.
00:06:16لقد تضمنت ملخصاً للمسار الرئيسي، والتغييرات الجوهرية، والصفحات المراد إضافتها، وكيفية اختبارها.
00:06:20اختبارها.
00:06:21الشيء الوحيد الذي فعله بشكل جيد هو فصل افتراضاته بوضوح، لذا عرفنا بالضبط ما الذي
00:06:25كان يعتبره من المسلمات.
00:06:26أخبرناه بالمتابعة وانتهى في حوالي 8 دقائق.
00:06:28نفس المهمة في Claude Code استغرقت 24 دقيقة.
00:06:31لكن خطة Opus 4.7 كانت أكثر تعمقاً بكثير، وراعت جوانب أكثر من التطبيق،
00:06:36بل وجلبت ShadC و UI لتحسين تجربة المستخدم.
00:06:39لذا فإن Opus 4.7 يؤدي بشكل أفضل من حيث التخطيط.
00:06:42بعد ذلك، أردنا اختبار كليهما على تطبيق جديد تماماً.
00:06:45أعطيناهما نفس الأمر وهو إنشاء مستودع أحادي بخلفية Python Flask و
00:06:50واجهة أمامية Next.js، جنباً إلى جنب مع خط الإنتاج الكامل والمتطلبات الأساسية لكيفية
00:06:55عمل التطبيق.
00:06:56لقد انتقل إلى وضع التخطيط من تلقاء نفسه بسبب تصميم بيئة العمل الخاصة به.
00:06:59لم ينتقل Codex إلى وضع التخطيط وبدأ بدلاً من ذلك في التنفيذ مباشرة.
00:07:04لقد انتهى أسرع بكثير من Claude Code، الذي استغرق حوالي 16 دقيقة بسبب خطوة
00:07:08التخطيط.
00:07:09نسخة GPT 5.5 من التطبيق كانت ذات واجهة مستخدم أبسط بكثير وركزت بشكل أساسي على التأكد من
00:07:14عمل التطبيق.
00:07:15لم يعمل بشكل صحيح في البداية، لذا قمنا بتصحيحه بشكل تكراري.
00:07:17أحد الأشياء التي لاحظناها هو أن مطالبات المقابلة كانت مكتوبة برمجياً بشكل ثابت لأننا لم نقدم
00:07:22أي مفتاح واجهة برمجة تطبيقات.
00:07:23حددت المطالبة استخدام واجهة برمجة تطبيقات Gemini كخلفية، ولكن نظراً لعدم توفر مفتاح،
00:07:27فقد نفذ آلية احتياطية حتى لا يتعطل التطبيق تماماً.
00:07:30لقد استخدم Codex بالفعل أسئلة متابعة محلية دون أي توجيه صريح.
00:07:35نحن نحب هذا لأن آليات الاحتياط مثل هذه مفيدة في مرحلة الإنتاج لأنها تمنع
00:07:39الأعطال.
00:07:40بعد بضع تكرارات وإضافة مفتاح واجهة برمجة التطبيقات، عمل مسار التطبيق بشكل صحيح رغم أن
00:07:44واجهة المستخدم كانت لا تزال بسيطة.
00:07:46لذا نظر GPT 5.5 في الحالات الاستثنائية ونفذ آليات لسد الفجوات.
00:07:51من ناحية أخرى، طلب منا Opus 4.7 إعطاءه مفتاح واجهة برمجة التطبيقات قبل أن يبدأ التنفيذ
00:07:57وبنى التطبيق بالكامل حول ذلك.
00:07:59لذا فإن Opus 4.7، على عكس GPT 5.5، لم يستعد للبدائل واحتاج فقط إلى توفر كل شيء
00:08:05مقدماً.
00:08:06بسبب هذا، عندما لم تكن واجهة برمجة التطبيقات موجودة بالفعل، لم يكن للتطبيق أي بديل وأعطى خطأ فقط.
00:08:10يركز Claude Code على تجربة المستخدم والوظائف معاً، لذا بدا تنفيذه
00:08:15أكثر واقعية.
00:08:16هذا يظهر قوة Opus 4.7 في واجهة المستخدم، والتي غطيناها في فيديونا السابق حيث
00:08:21قلنا إن Opus 4.7 أفضل بكثير في التعامل مع واجهة المستخدم، لكن تنفيذه كان به مشكلات أيضاً.
00:08:26عندما طلبنا منه تصحيح الأخطاء، لم يفحص التنفيذ مباشرة كما فعل Codex.
00:08:31بدلاً من ذلك، بدأ في طرح أسئلة علينا حول ما قد يسبب المشكلة واعتمد
00:08:35على اختبارنا.
00:08:36لقد أضاف نقاط تصحيح مثل مؤشرات في واجهة المستخدم وسجلات وحدة التحكم وطلب منا التحقق من الحالات
00:08:41وإخباره بالنتائج.
00:08:42بعد أخذ ورد، قام أخيراً بإصلاح المشكلة وعملت ميزة المقابلة.
00:08:46لقد فضلنا الطريقة التي استخدم بها Codex متصفح الوكيل لتصحيح الأخطاء بمفرده.
00:08:49لذا من حيث العمل المستقل، كان تنفيذ Codex أفضل، ومن حيث
00:08:53تجربة المستخدم، قام Claude Code بعمل أفضل بكثير.
00:08:56أردنا أيضاً اختبار كيفية تعامل كليهما مع أمر المبادأة (init).
00:08:59يعمل init الخاص بـ Claude Code دون توسيع المطالبة بشكل مضمن.
00:09:02فهو ينشئ ملف Claude.md بسيطاً يتكون من حوالي 90 سطراً ويتضمن المعمارية، ومسار التطبيق،
00:09:08وهيكل الواجهة الأمامية والخلفية، وجميع الأوامر المطلوبة لتشغيل التطبيق.
00:09:12الكثير من هذه المعلومات فائض عن الحاجة ولا يفيد الوكيل حقاً، وهذا
00:09:15هو السبب في أنه ليس من الضروري دائماً الاحتفاظ بكل ذلك.
00:09:18كان إعداد Codex أكثر دقة.
00:09:20لقد تضمن إرشادات الالتزام (commit)، وإرشادات طلب السحب، وتعليمات الأمان بشكل صحيح
00:09:24مع إبقاء قسم هيكل المشروع موجزاً بدلاً من إثقاله بالتفاصيل.
00:09:28لم يكن أي منهما مثالياً، لكن Codex تعامل مع agents.md بشكل أفضل.
00:09:32الآن أردنا أيضاً اختبار كيفية أداء كليهما في مراجعة الكود.
00:09:35أعطينا نفس المطالبة لمراجعة الموثوقية لكل من Codex و Claude Code، وطلبنا منهما
00:09:40توثيق المراجعة في ملفات منفصلة أثناء العمل على نفس قاعدة الكود.
00:09:44بمجرد أن أنشأ كلاهما تقاريرهما، فتحنا جلسة جديدة وطلبنا من Claude إخراج
00:09:48الفروقات بين الملفين، ومقارنة النتائج.
00:09:51كانت مراجعة Claude أكثر تفصيلاً بكثير.
00:09:53لقد نظم كل نتيجة حسب الأولوية وتضمن المكونات، ومقتطفات الكود الدقيقة
00:09:57التي تكمن وراء المشكلات.
00:09:59ذكر تقرير Codex أرقام الأسطر لكنه لم يتضمن مقتطفات الكود الفعلية.
00:10:03كان كلا التقريرين شاملين، وشاركا عدة نتائج بينما اكتشف كل منهما القليل مما
00:10:07فاته الآخر.
00:10:08أبلغ Claude Code أيضاً عن مشكلات أمنية مثل تسريب مفتاح واجهة برمجة التطبيقات وثغرة أمنية.
00:10:12كانت المهمة مراجعة للموثوقية ومع ذلك كانت تلك المشكلات خارج النطاق.
00:10:17أبلغ Claude Code عن كل مشكلة إضافية واجهها على طول الطريق بينما ظل Codex ملتزماً تماماً
00:10:21بالموثوقية.
00:10:22لذا كان تقرير Codex أكثر تماشياً مع الطلب الأصلي بينما كان تقرير Claude Code أوسع
00:10:27ولكنه أقل تركيزاً على المهمة المحددة.
00:10:29إذا كان علينا وصف كليهما من حيث البناء، فإن GPT 5.5 يبدو أشبه بمهندس خلفية برمجية
00:10:34يركز على تقديم وظائف التطبيق بشكل صحيح أولاً، بينما يبدو Opus 4.7
00:10:40أقرب لمهندس شامل يحاول الموازنة بين الوظائف وتجربة المستخدم.
00:10:45في إدارة السياق، كان أداء Codex أفضل بكثير من Claude Code.
00:10:48يتمتع Claude Code بميزة تحرير السياق داخل الجلسة والتي تزيل نداءات الأدوات وخطوات التفكير
00:10:53التي لم تعد تهم من المحادثة.
00:10:55فهو يمسح المعلومات الزائدة من الجلسة لتجنب التضخم.
00:10:58عملية الضغط ليست مثالية ولكن على الأقل لا تبقي الأجزاء غير الضرورية في السياق
00:11:02أثناء الضغط.
00:11:03Codex لا يقوم بتحرير سياقه.
00:11:05إنه يضغط المحادثة بأكملها تماماً كما حدثت.
00:11:08الشيء الوحيد الذي يفعله بشكل أفضل هو الحفاظ على آخر 20,000 رمز في الذاكرة وعدم ضغط
00:11:13ذلك الجزء على الإطلاق.
00:11:14يساعد ذلك في منع تدهور الأداء في Codex بعد الضغط حتى تتدفق المحادثة
00:11:18بسلاسة من المطالبة التالية فصاعداً.
00:11:21لقد اختبرنا أداءه وكان أداء Codex بعد الضغط أفضل مما كان عليه Claude Code.
00:11:25لذا، على الرغم من أن Claude Code يتبع عملية ضغط متعددة الخطوات وأكثر تفصيلاً، فإن الجزء المحفوظ
00:11:30في Codex يبقي الوكيل أكثر فائدة في الممارسة العملية.
00:11:33تعمل الذاكرة بشكل مختلف بين الاثنين.
00:11:35تعتبر بيئة Claude Code عديمة الحالة غالباً عبر الجلسات، مما يعني أن كل جلسة تبدأ
00:11:39بدون أي سياق من الجلسة السابقة.
00:11:41لديه الآن ميزة ذاكرة يمكنها تخزين التفضيلات أو التعليمات الدائمة.
00:11:46لذا إذا طلبنا منه تجنب القيام بشيء ما بطريقة معينة، فإنه يخزن ذلك ويطبقه
00:11:50مرة أخرى لاحقاً ضمن نفس المشروع.
00:11:52يساعد ذلك عند العمل بشكل متكرر في مشروع واحد.
00:11:54لكن الذاكرة محصورة بنطاق المشروع، لذا فإن تبديل المشاريع يؤدي لفقدان ذلك السلوك المخزن.
00:11:58يتخذ Codex المسار المعاكس.
00:12:00فهو يدمج المعلومات من جلسات متعددة بمرور الوقت ويبني ذاكرة عالمية عبر
00:12:05التفاعلات بحيث يمكنه الاحتفاظ بالأنماط لما يتجاوز مشروعاً واحداً.
00:12:08يمكن أن يساعد ذلك في تحقيق الاتساق عبر المهام المختلفة.
00:12:11باختصار، يبقي Claude Code الذاكرة محتواة أكثر داخل المشروع بينما يتخذ Codex
00:12:15نهجاً عابراً للجلسات والمشاريع، مما يغير كيفية تكيف كل منهما بمرور
00:12:19الوقت.
00:12:20بما أن Claude Code موجود منذ فترة أطول ويتم تطويره باستمرار لتحسين
00:12:24تجربة المطور، فلديه الكثير ليقدمه مقارنة بـ Codex.
00:12:27يحتوي Claude Code على نظام خطافات (hooks) يتيح لنا تشغيل البرمجيات الخاصة بنا في نقاط معينة من
00:12:32دورة حياة الوكيل، مثل قبل أو بعد تشغيل أداة ما، من بين نقاط أخرى، لأمور
00:12:36مثل حظر الأوامر غير الآمنة، وتشغيل أدوات التنسيق، والمزيد.
00:12:39يمكننا أيضاً تشغيل وكلاء فرعيين في شجرة عمل مخصصة بحيث لا يؤثر أداؤهم
00:12:43على بعضهم البعض.
00:12:44يمكننا التحكم في مستوى الجهد المبذول للنماذج، ويمكننا حتى استخدام كلمات مفتاحية مثل "التفكير الفائق"
00:12:48لدفع الاستنتاج إلى أقصى حدوده في مهمة محددة.
00:12:51لا يوجد ما يعادل ذلك في Codex حالياً.
00:12:54النظام البيئي هو الفوز الواضح الآخر لـ Claude Code.
00:12:56يمكننا تشغيل الجلسات عبر تطبيق Claude لسطح المكتب وتفويض المهام من تطبيق الهاتف المحمول.
00:13:01عبر Claude Code وتطبيق سطح المكتب وتطبيق الويب وإضافات المتصفح، يكون النطاق
00:13:06أوسع بكثير من Codex، الذي يتكون أساساً من تطبيق ويب وتطبيق سطح مكتب تم إصداره
00:13:11مؤخراً فقط ولم يشعرنا بالقوة الكافية في الوقت الذي اختبرناه فيه.
00:13:14تنتقل الجلسات أيضاً بين البيئات بسهولة أكبر في Claude Code، مما يجعله أكثر
00:13:18ملاءمة للعمل عبر واجهات مختلفة.
00:13:20يتمتع Codex أيضاً بالعديد من الميزات المثيرة للاهتمام.
00:13:22في السحابة، يحتوي على علامة محاولة (attempt flag) تقوم بتشغيل نفس المهمة عدداً من المرات.
00:13:26حيث ينتج عدة تطبيقات ويختار الأفضل منها.
00:13:29يمكن لـ Claude Code القيام بشيء مشابه ولكن فقط من خلال الإعدادات والتعليمات، وليس
00:13:33كعلامة تشغيل.
00:13:34الميزة الأخرى الحصرية لـ Codex، والتي تميزه عن البقية، هي تكامله مع
00:13:38نماذج الصور من OpenAI.
00:13:39يمكنه استخدامها مباشرة في واجهة سطر الأوامر لإنشاء صور للمواقع التي يعمل عليها.
00:13:44يعتمد Claude في الغالب على التوليد القائم على SVG للمرئيات، وهو ما لا ينافس حتى في
00:13:49الجودة لأنه لا يملك أي نموذج صور بعد.
00:13:52إذا كنا نبني واجهة مستخدم تحتاج إلى صور حقيقية، فإن Codex هو الوحيد من بين الاثنين الذي يفعل
00:13:56ذلك، دون حتى أن يُطلب منه ذلك صراحة.
00:13:58أيضاً، إذا كنت تستمتع بمحتوانا، ففكر في الضغط على زر التشجيع لأنه يساعدنا
00:14:03على إنشاء المزيد من المحتوى مثل هذا والوصول إلى المزيد من الناس.
00:14:06كلاهما يستخدم وكلاء فرعيين، رغم أن المفهوم قدمه Claude أولاً.
00:14:10بما أنه ظهر أولاً في Claude Code، فإن تكامله أكثر نضجاً لأنه كان متمحوراً حول الوكلاء
00:14:15ومركزاً على تجربة البرمجة لفترة أطول بكثير من OpenAI.
00:14:19فهو يدعم الوكلاء الذين يمكن تنسيقهم عبر جلسات عن بعد، بينما يدعم Codex بشكل أساسي
00:14:23سير عمل الوكلاء المتعددين داخل بيئة الطرفية.
00:14:27الاختلاف الأكبر يكمن في كيفية استدعاء كل منهما للوكلاء الفرعيين.
00:14:29يمكن لـ Claude Code إنشاء وكلاء دون استدعاء صريح، بينما ينشئ Codex وكيلاً فقط
00:14:35إذا طلبنا ذلك صراحة في التعليمات.
00:14:37عندما ينشئ Codex وكلاء، فإنه يطلق عليهم أسماءً ويمرر لهم تعليمات مناسبة أيضاً.
00:14:41في أداء البرمجة، الاثنين متشابهان تماماً، لكن اختيارات التصميم وراءهما مختلفة.
00:14:46يستخدم وكلاء Claude Code الفرعيون قائمة سماح صريحة، مما يعني أن الوكيل الرئيسي يحدد بالضبط
00:14:51الأدوات التي يمكن للوكيل الفرعي الوصول إليها، بينما يرث وكلاء Codex الفرعيون الوصول للأدوات من
00:14:55الرئيسي بشكل افتراضي.
00:14:57يمنح Claude Code أيضاً كل وكيل فرعي نافذة سياق جديدة تماماً.
00:15:01فالوكيل الفرعي لا يملك وصولاً إلى سجل المحادثة ويرى فقط التعليمات من الرئيسي،
00:15:06بالإضافة إلى تعليمات النظام وأي قواعد عالمية، لأن Claude يركز على عزل السياق.
00:15:10تفعل واجهة سطر أوامر Codex العكس تماماً.
00:15:12فهي تفرع السجل الكامل إلى جلسة الوكيل الفرعي، مع وضع تعليمات الرئيسي في الأعلى.
00:15:17يحتفظ وكلاء Codex بمزيد من السياق حول ما تمت مناقشته بالفعل، مما يساعد حقاً في تحسين
00:15:22أدائهم.
00:15:23في الممارسة العملية، أضر العزل الصارم لـ Claude Code بوكلائنا الفرعيين للبحث.
00:15:27عندما استخدمناها، لم تكن النتائج جيدة بما يكفي، لأنهم رأوا فقط التعليمات
00:15:30الفورية ولم يكن لديهم أي سياق سابق.
00:15:33تحصل وكالات Codex على السجل بالكامل، ويمكنها التكرار بشكل أكثر فعالية، وتؤدي بشكل أفضل في المهام
00:15:38التي تهم فيها الاستمرارية.
00:15:39بهذا نصل إلى نهاية هذا الفيديو.
00:15:41إذا كنت ترغب في دعم القناة ومساعدتنا في الاستمرار في صنع فيديوهات مثل هذه، يمكنك فعل
00:15:45ذلك باستخدام زر "شكراً" أدناه.
00:15:48كما هو الحال دائماً، شكراً لكم على المشاهدة وسأراكم في الفيديو القادم.

Key Takeaway

بينما يتفوق Claude Code في تجربة المستخدم وتنسيق الوكلاء الفرعيين، يعد Codex الخيار الأكثر كفاءة من حيث التكلفة والسرعة، حيث يستهلك رموزاً أقل بنسبة تزيد عن 50% وينجز المهام بآليات مستقلة أكثر نضجاً.

Highlights

  • يستهلك Codex (المعتمد على GPT 5.5) حوالي 82,000 رمز بينما يستهلك Claude Code (النموذج Opus 4.7) حوالي 173,000 رمز لنفس المهمة البرمجية.

  • يتطلب إعداد تطبيق جديد باستخدام Claude Code حوالي 24 دقيقة للتخطيط والتنفيذ مقارنة بـ 8 دقائق لـ Codex.

  • يعتمد Claude Code نظام سماح صريح للوكلاء الفرعيين، بينما يرث وكلاء Codex صلاحيات الوكيل الرئيسي تلقائياً.

  • يحتوي Codex على ميزة مدمجة لإنشاء الصور للمواقع باستخدام نماذج OpenAI، بينما يعتمد Claude Code على رسوميات SVG.

  • يواجه Claude Code حالياً مشاكل تقنية في واجهة المستخدم (TUI) تشمل تعطل معالجة الرسوم وتسريبات الذاكرة المخبئية منذ الإصدار 2.1.0.

  • يتميز Codex بقدرة أفضل على إدارة السياق بعد الضغط، حيث يحتفظ بآخر 20,000 رمز في الذاكرة دون ضغط لمنع تدهور الأداء.

Timeline

مقارنة الأداء وسهولة الاستخدام

  • يواجه Claude Code تراجعاً في استقرار واجهة المستخدم بعد تحديث الإصدار 2.1.0.
  • يتطلب Claude Code إذناً يدوياً متكرراً حتى في الوضع التلقائي مما يعطل سير العمل.
  • يتميز Codex ببناء واجهة سطر الأوامر بلغة Rust مما يضمن استقرار الأداء مقارنة بـ React في Claude.

انخفض مستوى استقرار Claude Code مع التحديثات الأخيرة، حيث تظهر أعطال في معالجة الرسوم وتسريبات في الذاكرة المخبئية. أدى تغيير سياسة الأذونات إلى إجبار المستخدمين على التدخل اليدوي المتكرر، مما يعيق التنفيذ التلقائي للمهام. في المقابل، يوفر Codex واجهة مبنية بلغة Rust تتسم بالثبات وعدم طلب أذونات معقدة في وضع YOLO.

كفاءة التكلفة واستهلاك الرموز

  • يقتصر Claude Code على خطط Pro و Max المدفوعة فقط.
  • يستهلك Opus 4.7 ضعف عدد الرموز التي يستهلكها GPT 5.5 في تنفيذ نفس المهمة.
  • يؤدي Codex المهام بكفاءة أعلى مما يجعله أكثر توفيراً للموارد والميزانية.

تعد تكلفة الاستخدام الفعلي أعلى في Claude Code بسبب استهلاك الرموز المكثف في عمليات التفكير والتكرار. أثبتت الاختبارات أن تنفيذ مهمة برمجية موحدة تطلب 173,000 رمز لـ Claude Code مقابل 82,000 رمز فقط لـ Codex. كما يتيح Codex الوصول للمستخدمين في الخطة المجانية، مما يجعله متاحاً بشكل أوسع.

التخطيط وبناء التطبيقات

  • يتفوق Opus 4.7 في جودة التخطيط والعمق المعماري للتطبيقات.
  • ينفذ Codex المهام أسرع بكثير لأنه يبدأ في البرمجة مباشرة دون خطوة تخطيط طويلة.
  • يتمتع Codex بآليات احتياطية تلقائية لمنع تعطل التطبيق عند فقدان مفاتيح واجهة البرمجة.

أظهر Claude Code دقة أكبر في التخطيط ودمج مكتبات UI إضافية مثل ShadC، لكنه استغرق وقتاً أطول بـ 16 دقيقة من Codex. يركز Codex على التشغيل الوظيفي السريع، مع دمج آليات تصحيح أخطاء ذاتية باستخدام متصفح الوكيل دون الحاجة لتدخل بشري مستمر.

إدارة السياق والذاكرة والوكلاء الفرعيين

  • يبني Codex ذاكرة عالمية عابرة للمشاريع، بينما تظل ذاكرة Claude Code محصورة بنطاق المشروع.
  • يسمح Codex للوكلاء الفرعيين بالوصول إلى سجل المحادثة الكامل مما يحسن الاستمرارية.
  • يتفوق Claude Code في توفير نظام خطافات (hooks) متقدم لتخصيص دورة حياة الوكيل.

يحتفظ Codex بآخر 20,000 رمز في الذاكرة لمنع تدهور الأداء أثناء ضغط المحادثة، مما يعزز فاعليته. بينما يركز Claude Code على عزل سياق الوكلاء الفرعيين لضمان عدم تداخل المهام، أدى ذلك إلى ضعف الأداء في مهام البحث. يتفوق Claude Code في التكامل مع أدوات سطح المكتب وتعدد المنصات، بينما يتميز Codex بتكامل أصلي مع نماذج توليد الصور.

Community Posts

View all posts