هندسة الربط: المهارة التي ستحدد ملامح عام 2026 للمطورين المستقلين

SSolo Swift Crafter
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00حسنًا، إذًا.
00:00:02ما هو أفضل نموذج ذكاء اصطناعي حاليًا؟
00:00:04هل هو Claude، أم GPT، أم Gemini؟
00:00:07بصراحة، أعتقد أن هذا هو السؤال الخاطئ.
00:00:11في الواقع، إنه سؤال خاطئ تمامًا.
00:00:14سريعًا، أنا دانيال.
00:00:16أعمل في مجال تطوير تطبيقات iOS منذ أكثر من ثماني سنوات.
00:00:20بدأت كعمل حر، أصمم واجهات المستخدم،
00:00:24أنتقل من عميل لآخر،
00:00:25أقوم بتنفيذ أفكار الآخرين
00:00:27بينما أحاول العثور على أفكاري الخاصة.
00:00:28وبعد عام 2025، قررت العمل بمفردي تمامًا.
00:00:33بلا عملاء، وبلا شبكة أمان.
00:00:36ومنذ ذلك الحين، صممت أكثر من 15 تطبيقًا خاصًا بي،
00:00:39كلها بلغة SwiftUI، وبنيتها جميعًا أمام الملأ.
00:00:41وحاليًا، أضع كل ذرة طاقة أملكها
00:00:44لتحويل هذا الاستوديو الفردي
00:00:46إلى شيء يدوم حقًا.
00:00:49ليس مجرد نماذج أولية سريعة أو محتوى رديء مولد بالذكاء الاصطناعي،
00:00:52بل تطبيقات حقيقية تصمد مع التوسع.
00:00:55ونعم، كل تفاصيل تلك العملية.
00:00:57هذه الرحلة الفوضوية برمتها موجودة على crafterslab.
00:01:00موقعه هو crafterslab.dev،
00:01:01وهو ليس مجرد مقبرة للدروس التعليمية أو مصنع لنسخ الذكاء الاصطناعي.
00:01:06إنه حقًا قاعدتي الأساسية،
00:01:08بنيته للمطورين المستقلين الذين يستخدمون الذكاء الاصطناعي كزميل عمل حقيقي.
00:01:12ليس كآلة بيع تنقر عليها عندما تتعثر
00:01:14وتأمل في الحصول على الأفضل.
00:01:16إذا كنت تهتم بالحرفة،
00:01:18وإذا كنت جادًا بشأن تطوير مستواك
00:01:20وبناء أشياء تدوم حقًا،
00:01:23فنعم، ستشعر أنك في مكانك المناسب هنا.
00:01:24ويا من لا تزالون على Patreon،
00:01:26شكرًا جزيلًا لكم، ولكن انتبهوا.
00:01:29لقد انتقل كل شيء إلى crafterslab.dev.
00:01:32هناك يتواجد الفريق بأكمله الآن.
00:01:33تعالوا لنبني معًا.
00:01:35إليكم ما جعلني أفكر في كل هذا.
00:01:38صدرت دراسة مؤخرًا.
00:01:41نشر الباحثون معيار تقييم يسمى "Epic's Agent".
00:01:45وما يجعله مختلفًا عن أي معيار تقييم آخر
00:01:49تراه يتسبب في جدال الناس عبر الإنترنت،
00:01:51هو أنه يختبر الوكلاء في عمل مهني حقيقي،
00:01:55وليس مجرد ألغاز برمجية أو أسئلة اختيار من متعدد.
00:01:58نحن نتحدث عن مهام فعلية يقوم بها المستشارون والمحامون
00:02:03والمحللون بشكل يومي.
00:02:05تستغرق كل مهمة من الإنسان حوالي ساعة إلى ساعتين لإكمالها.
00:02:08لذا قاموا باختبار كل النماذج الرائدة من خلاله.
00:02:11أفضل نموذج استطاع إكمال تلك المهام
00:02:13بنسبة 24% فقط، أي مرة واحدة من كل أربع.
00:02:17وبعد ثماني محاولات لنفس النموذج،
00:02:20ارتفعت النسبة فقط إلى حوالي 40%.
00:02:23تذكروا أن هذه هي نفس النماذج
00:02:26التي تسجل أكثر من 90% في معايير التقييم
00:02:29التي يفقد الجميع صوابهم بسببها.
00:02:32إذًا، إما أن تلك المعايير غير دقيقة
00:02:33أو أننا نقيس الشيء الخاطئ.
00:02:36وأعتقد أنه الاحتمال الثاني، أليس كذلك؟
00:02:37ولكن حسنًا، هنا يبدأ الأمر بالتحول لواقع ملموس بالنسبة لنا.
00:02:41تعمق الباحثون بالفعل في سبب فشل هؤلاء الوكلاء.
00:02:46ولم تكن الإجابة أن النماذج غبية.
00:02:49فقد كانت تمتلك كل المعرفة التي تحتاجها.
00:02:51وكان بإمكانها التفكير في المشكلات بشكل جيد تمامًا.
00:02:54لكن الإخفاقات كانت تتعلق بالكامل تقريبًا
00:02:56بالتنفيذ والتنسيق.
00:03:00كان الوكلاء يتوهون بعد خطوات كثيرة.
00:03:02وكانوا يعودون لتكرار أساليب فشلت بالفعل.
00:03:05كانوا يفقدون التركيز على ما كان يفترض بهم
00:03:09القيام به في المقام الأول.
00:03:11وإذا كنت مطورًا مستقلًا تستخدم Claude code
00:03:14أو Cursor يوميًا، فأنت تعرف هذا الشعور.
00:03:18لقد شاهدت الوكيل وهو يتخبط ويعيد محاولة نفس
00:03:21الشيء المعطل ثلاث مرات،
00:03:23وينسى تمامًا سياق الحديث قبل 20 خطوة.
00:03:26وتجلس أنت هناك قائلًا،
00:03:28"ربما يجب أن أنتقل إلى Opus".
00:03:30"ربما أحتاج إلى مزود خدمة مختلف"،
00:03:32لكن البيانات تقول إن هذه ليست المشكلة.
00:03:34النموذج ليس هو العائق.
00:03:36بل العائق هو كل ما يحيط به.
00:03:38وهناك كلمة لوصف ذلك.
00:03:40وأعتقد أنها ستحدد ملامح عام 2026
00:03:43مثلما حدد الوكلاء ملامح عام 2025.
00:03:46الكلمة هي "Harness" (هيكل التشغيل).
00:03:47هيكل تشغيل الوكيل يشمل كل البنية التحتية
00:03:50المحيطة بالنموذج، وما يمكنه رؤيته،
00:03:52والأدوات المتاحة له،
00:03:54وكيفية تعافيه عندما تسوء الأمور،
00:03:56وكيف يتتبع ما يفعله خلال جلسة طويلة.
00:03:59نشرت OpenAI حرفيًا مقالًا
00:04:02بعنوان "هندسة هيكل التشغيل".
00:04:04وأصدرت Anthropic دليلًا كاملاً حول بناء
00:04:07هياكل تشغيل فعالة للوكلاء الذين يعملون لفترات طويلة.
00:04:09شركة Manus، شركة الذكاء الاصطناعي التي استحوذت عليها Meta مؤخرًا،
00:04:13نشروا دروسهم في هندسة السياق
00:04:16بعد إعادة بناء إطار عمل الوكيل الخاص بهم بالكامل
00:04:19خمس مرات في ستة أشهر، نعم خمس مرات.
00:04:22وجميعهم يقولون الشيء نفسه تمامًا.
00:04:24هيكل التشغيل هو المكان الذي يكمن فيه العمل الهندسي الحقيقي،
00:04:27وليس النموذج نفسه.
00:04:28حسنًا، وهذا هو الجزء الذي فاجأني بصراحة
00:04:32لأنه يتعارض تمامًا
00:04:34مع الطريقة التي يفكر بها معظمنا عند البناء بهذه الأدوات.
00:04:38هناك هذه القصة من Vercel.
00:04:41كان لديهم وكيل لتحويل النص إلى SQL.
00:04:43تطرح سؤالًا، فيكتب هو استعلام SQL،
00:04:46وقد بنوه بالطريقة التي يبني بها معظم الناس الوكلاء، أليس كذلك؟
00:04:49أعطوه مجموعة من الأدوات المتخصصة،
00:04:51أداة لفهم مخطط قاعدة البيانات،
00:04:54وأخرى لكتابة الاستعلامات، وأخرى للتحقق من النتائج.
00:04:58كل هذا التعامل مع الأخطاء كان ملفوفًا حوله
00:05:01وكان يعمل بنسبة 80% من الوقت.
00:05:04ثم جربوا شيئًا جذريًا بعض الشيء.
00:05:06قاموا بإزالة 80% من الأدوات، انتزعوها فحسب،
00:05:11وأعطوا الوكيل أشياء أساسية: تشغيل أوامر bash، وقراءة الملفات،
00:05:15وأدوات سطر الأوامر القياسية مثل grep و cat،
00:05:18من النوع الذي قد نستخدمه أنا أو أنت فعليًا.
00:05:20وارتفعت الدقة من 80% إلى 100%.
00:05:25واستخدم رموزًا (tokens) أقل بنسبة 40%،
00:05:28وكان أسرع بثلاث مرات ونصف.
00:05:31لن أكذب، هذا مذهل حقًا، أليس كذلك؟
00:05:33والمهندس الذي بناه قال شيئًا
00:05:36علق بذاكرتي حقًا.
00:05:38النماذج تزداد ذكاءً.
00:05:40ونوافذ السياق تزداد اتساعًا.
00:05:42لذا ربما تكون أفضل بنية للوكيل
00:05:44هي عدم وجود بنية على الإطلاق تقريبًا.
00:05:46وهذا يقلب كل الموازين، أتعرف ما أعنيه؟
00:05:50لأن الغريزة، خاصة عندما تعمل بمفردك
00:05:54وتحاول جعل هذا الشيء موثوقًا،
00:05:57هي الاستمرار في إضافة المزيد من الأدوات، والمزيد من القيود،
00:06:01والمزيد من منطق التوجيه.
00:06:02تظن أن المزيد من الهيكلة سيساعد،
00:06:04لكن تلك الأدوات لم تكن تساعد النموذج.
00:06:06بل كانت تعيقه.
00:06:08وهذا ليس مجرد حادثة معزولة.
00:06:10فشركة Manus مرت بنفس الاكتشاف تمامًا.
00:06:13لقد أعادوا بناء إطار عمل الوكيل الخاص بهم بالكامل
00:06:16خمس مرات في ستة أشهر،
00:06:19وأكبر مكاسب الأداء لديهم
00:06:21لم تأتِ من إضافة ميزات جديدة.
00:06:23بل جاءت من إزالتها.
00:06:25لقد استبعدوا استرجاع المستندات المعقد،
00:06:28وألغوا منطق التوجيه المتكلف،
00:06:29واستبدلوا وكلاء الإدارة بعمليات تسليم بسيطة ومنظمة.
00:06:34مع كل محاولة، كان الأمر يصبح أبسط ويصبح أفضل.
00:06:37وهنا الجزء الذي أعتقد أن كل مطور مستقل
00:06:40يدير جلسات مطولة على Claude code يحتاج لسماعه.
00:06:42وجدت Manus أن وكيلهم كان يقوم بمتوسط
00:06:45حوالي 50 استدعاء للأدوات في كل مهمة.
00:06:49هذا عدد كبير من الخطوات.
00:06:50وحتى مع النماذج التي تدعم تقنيًا
00:06:53نوافذ سياق ضخمة،
00:06:54إلا أن الأداء يتدهور بعد نقطة معينة.
00:06:58النموذج لا ينسى كل شيء فجأة.
00:07:01الأمر أشبه بأن الإشارة تضيع وسط الضجيج.
00:07:04تعليماتك المهمة في بداية الجلسة
00:07:07تضيع تحت وطأة مئات النتائج الوسيطة.
00:07:10لذا كان حلهم بسيطًا للغاية.
00:07:12بدأوا في معاملة نظام الملفات
00:07:14كذكرة خارجية للنموذج.
00:07:17بدلًا من حشر كل شيء في نافذة السياق،
00:07:20يقوم الوكيل بكتابة المعلومات الأساسية في ملف
00:07:23ويقرأها مرة أخرى عند الحاجة.
00:07:25ونعم، إذا كنت تستخدم Claude code،
00:07:27فقد رأيت هذا حرفيًا.
00:07:29ملفات CLAUDE.md، وقوائم المهام، وتتبع التقدم،
00:07:34هذا هو بالضبط نفس النمط الذي تراه
00:07:36في واجهة الأوامر الخاصة بك كل يوم.
00:07:37حسنًا، تذكروا ما قلته
00:07:40عن التقاء الجميع حول نفس الفكرة؟
00:07:44لأنه عندما تنظر
00:07:45إلى أنجح ثلاث أنظمة وكلاء حاليًا،
00:07:49تجد أنها وصلت جميعًا لنفس النتيجة
00:07:51من اتجاهات مختلفة تمامًا.
00:07:53نظام Codex من OpenAI يعتمد على هذا النهج الطبقي.
00:07:57منسق يضع الخطط،
00:07:59ومنفذ يتعامل مع المهام الفردية،
00:08:02وطبقة تعافي تلتقط الإخفاقات.
00:08:06إنه نظام متين.
00:08:07يمكنك تسليمه المهام والذهاب بعيدًا.
00:08:09هذه فلسفة واحدة.
00:08:10أما Claude code، وأنا أستخدمه يوميًا.
00:08:14فجوهره يتكون حرفيًا من أربع أدوات فقط.
00:08:16قراءة ملف، كتابة ملف، تعديل ملف،
00:08:19وتشغيل أمر bash، هذا كل شيء.
00:08:21معظم الذكاء يكمن في النموذج نفسه.
00:08:23ويبقى هيكل التشغيل بسيطًا.
00:08:25وعندما تحتاج للمزيد، تأتي القابلية للتوسع عبر MCP
00:08:28والمهارات التي يكتسبها الوكيل حسب الحاجة.
00:08:30ثم استقرت Manus على ما أسميه
00:08:33"التقليل، الترحيل، العزل": تقليص السياق بنشاط،
00:08:38استخدام نظام الملفات للذاكرة،
00:08:40تشغيل وكلاء فرعيين للمهام الثقيلة،
00:08:43والعودة بالملخص فقط.
00:08:45ثلاثة مناهج مختلفة تمامًا،
00:08:47تلتقي جميعًا عند نفس الرؤية.
00:08:50هيكل التشغيل أهم من النموذج.
00:08:52وبالنسبة للمطورين المستقلين،
00:08:55هذا يغير ما يجب عليك فعليًا
00:08:57بما يجب أن تقضي وقتك فيه حقاً.
00:08:59لأننا، كما تعلم، لا نملك ساعات غير محدودة.
00:09:01فكل ساعة تقضيها على "ريديت" في جدال
00:09:05حول الأفضل بين "كلود" و"جي بي تي" هي ساعة لا تنجز فيها عملاً.
00:09:08وهناك هذه الفكرة من ريتشارد ساتون،
00:09:11أحد مبتكري التعلم المعزز،
00:09:14تُسمى "الدرس المرير".
00:09:16والحجة الجوهرية هي أن
00:09:18الأساليب التي تتوسع مع قوة الحوسبة
00:09:21تنتهي دائماً بالتفوق على الأساليب
00:09:23التي تعتمد على المعرفة المصممة يدوياً.
00:09:26تطبيق ذلك على ما نفعله
00:09:27يعني شيئاً محدداً للغاية.
00:09:29فكلما زاد ذكاء النماذج،
00:09:31يجب أن يصبح "الهيكل التشغيلي" أبسط،
00:09:33وليس أكثر تعقيداً.
00:09:34إذا كنت تضيف المزيد من المنطق البرمجي اليدوي،
00:09:36والمزيد من خطوط العمل المخصصة مع كل ترقية للنموذج،
00:09:40فأنت تسبح عكس التيار.
00:09:42وبصراحة، هذا الإفراط في الهندسة
00:09:44هو على الأرجح السبب في تعطل عميلك البرمجي المستمر.
00:09:47لذا، إليك ما سأجربه فعلياً.
00:09:49أولاً، قم بتجربة "فيرسل" بنفسك.
00:09:52إذا كان لديك أي نوع من إعدادات العميل الذكي،
00:09:54فقم بتبسيطه، وأزل الأدوات المتخصصة،
00:09:57ومنحه طرفية "باش" وصلاحية وصول أساسية للملفات
00:10:00وانظر فقط ماذا سيحدث.
00:10:02النموذج على الأرجح أكثر ذكاءً
00:10:03من خط الأدوات الذي بنيته حوله.
00:10:06ثانياً، أضف ملفاً لتتبع التقدم.
00:10:08اجعل عميلك يحافظ على قائمة مهام جارية
00:10:10يقوم بتحديثها بعد كل خطوة.
00:10:13يقرأ الملف في بداية كل إجراء،
00:10:15ويكتب فيه عند الانتهاء.
00:10:17هذا بالضبط ما يفعله "كلود كود"
00:10:19باستخدام ملفات "مارك داون" تلك.
00:10:20وهو نفس النمط الذي توصل إليه مانيش
00:10:22بعد خمس عمليات إعادة كتابة كاملة.
00:10:24لدي بالفعل نظام كامل لهذا
00:10:26مُعد في المختبر مع كل تعليمات العميل
00:10:29وقوالب ملفات MD جاهزة إذا كنت مهتماً.
00:10:33وثالثاً، ابدأ في التعلم عن بروتوكول MCP والمهارات.
00:10:37فهذه تمنح النموذج طرقاً نظيفة وموحدة
00:10:40للعمل مع الأدوات الخارجية
00:10:42دون أن تضطر لبرمجة كل تكامل يدوياً.
00:10:44هنا يكمن سر قابلية التوسع الآن.
00:10:46عام 2025 كان عام العملاء الأذكياء.
00:10:50وبالنسبة للجزء الأكبر، نعم، لقد حدث ذلك.
00:10:53لكن عام 2026، أعتقد أنه سيكون عام "الهياكل التشغيلية"
00:10:58فالنموذج نفسه، نفس النموذج تماماً
00:11:03يتصرف بشكل مختلف تماماً في "كلود كود"
00:11:06مقارنة بـ "كيرسر" أو مقارنة بـ "كوديكس".
00:11:08لذا اختر هيكلك التشغيلي بعناية،
00:11:11سواء كنت تستخدم عميلاً برمجياً أو تبني واحداً.
00:11:14لذا، نعم، إذا كنت لا تزال هنا،
00:11:17فأنت حقاً أسطورة.
00:11:18وأنا أعلم أن الجدل حول النماذج صاخب الآن.
00:11:22كل أسبوع هناك إصدار جديد، واختبار جديد،
00:11:24ونقاش جديد حول أيهم يتربع على العرش.
00:11:27لكن البيانات الفعلية، والهندسة الحقيقية
00:11:30الصادرة عن الشركات التي تبني هذه التقنيات،
00:11:32تشير جميعها إلى مكان آخر.
00:11:34الهيكل التشغيلي هو المكان الذي تتحقق فيه النجاحات.
00:11:37وبالنسبة للمطورين المستقلين، فهذه أخبار رائعة
00:11:40لأن بناء هيكل تشغيلي أفضل
00:11:42هو شيء يمكنك القيام به الآن اليوم
00:11:45دون انتظار إصدار النموذج التالي.
00:11:47وإذا كنت تريد التعمق أكثر في كيفية
00:11:51إعداد كل هذا، ملفات MD، وسير عمل العميل،
00:11:56وكيف أربط كل شيء معاً لتطبيقاتي الخاصة،
00:11:59تفضل بزيارة crafterslab.dev.
00:12:02إنه ليس مجرد مستودع دروس أو مزرعة محتوى ذكاء اصطناعي.
00:12:06بل هو قاعدتي الأساسية المبنية للمطورين المستقلين
00:12:09الذين يعاملون الذكاء الاصطناعي كزميل حقيقي في الفريق
00:12:11ويهتمون حقاً بما ينجزونه.
00:12:13بالداخل، ستحصل على شروحات كاملة،
00:12:15ودروس فيديو قصيرة، ومجموعة من مهارات "كلود كود"
00:12:19التي يمكنك الحصول عليها واستخدامها على الفور،
00:12:21وموارد قابلة للتنزيل يمكنك إضافتها
00:12:24مباشرة في مشاريعك.
00:12:26الأعضاء يتناقشون في التعليقات، ويطرحون المتابعات،
00:12:29ويتبادلون الأفكار.
00:12:30إنه حوار حقيقي، وليس مجرد تغذية محتوى من طرف واحد.
00:12:34لكن الجوهر الحقيقي هو مساحات فريق Notion،
00:12:37خطة عملي المباشرة، حيث تحصل على مقعد في الصف الأول
00:12:40لترى كيف أدير كل تطبيق أقوم ببنائه،
00:12:42وملفات MD الفعلية التي أستخدمها في المشاريع الحقيقية،
00:12:46ومكتبة التوجيهات، والوثائق التي أكتبها أثناء العمل،
00:12:49وكل عمليات الأتمتة التي تعمل خلف الكواليس،
00:12:51لا شيء منمق للكاميرا، بل هي العملية الحقيقية بكل عيوبها،
00:12:55وهناك أيضاً "Swift Brain"،
00:12:58وهي مكتبة منسقة لـ Swift و Swift UI
00:13:01أقوم ببنائها منذ سنوات، وعروض تقديمية متعمقة،
00:13:04ومحادثات خاصة أنفقت أموالاً حقيقية لتنسيقها،
00:13:07وهي نوع المواد التي لا تجدها منتشرة
00:13:10في بيانات التدريب العامة.
00:13:11هذا ما أستخدمه فعلياً لبناء بروتوكولات MCP مخصصة
00:13:16ولإعداد مهارات لـ "كلود كود"، و"كيرسر"، وكل شيء،
00:13:20أقوم دائماً بالتجربة ومشاركة ما ينجح،
00:13:23ثم هناك Ops Lab.
00:13:25حيث توجد جميع تعليمات عملاء الذكاء الاصطناعي،
00:13:28وقوالب Notion، ومهارات "كلود كود"،
00:13:31وسير العمل، وعمليات الأتمتة كلها جاهزة
00:13:33لكي تنسخها، أو تفككها،
00:13:36أو حتى تعيد بناءها بطريقتك الخاصة.
00:13:38الهدف الأساسي هو إبقاء المطور المستقل متصلاً
00:13:41لكي لا تبني أبداً بمفردك،
00:13:44حتى لو كنت وحيداً أمام لوحة المفاتيح.
00:13:46لذا، إذا كنت ترغب في الانضمام بينما لا يزال الفريق صغيراً
00:13:49والأسعار ثابتة، فالآن هو الوقت المثالي.
00:13:52المكان يشبه صالون مطورين خلف الكواليس
00:13:55أكثر من كونه منتدى عملاقاً مجهول الهوية
00:13:57وسيسعدني حقاً رؤيتك هناك.
00:14:00لنتبادل الآراء حول موضوع الهياكل التشغيلية هذا،
00:14:02وربما نتعلم شيئاً مما ستبنيه تالياً.
00:14:05استمر في الإبداع، واستمر في التجربة،
00:14:08ولا تدع ضجيج اختبارات الأداء يشتتك
00:14:10عما يهم حقاً.
00:14:12مع السلامة.

Key Takeaway

يكمن سر النجاح في تطوير البرمجيات بالذكاء الاصطناعي لعام 2026 في بناء هياكل تشغيل بسيطة وفعالة تحيط بالنموذج، بدلاً من الاعتماد فقط على تحديثات النماذج أو زيادة تعقيد الأدوات.

Highlights

مفهوم "هندسة هيكل التشغيل" (Harness Engineering) هو العامل الحاسم لتطور الذكاء الاصطناعي في عام 2026 بدلاً من مجرد قوة النموذج.

فشل نماذج الذكاء الاصطناعي في المهام المهنية المعقدة يعود غالباً لمشاكل في التنفيذ والتنسيق وليس لنقص في المعرفة.

التبسيط في تصميم الأدوات والوكلاء يؤدي إلى نتائج أدق وأسرع، كما أثبتت تجربة شركة Vercel بتحقيق دقة 100%.

استخدام نظام الملفات كذاكرة خارجية للنموذج (مثل ملفات CLAUDE.md) يتفوق على حشر المعلومات في نافذة السياق.

هناك ثلاثة مناهج ناجحة حالياً (OpenAI وClaude وManus) تتفق جميعاً على أن الهيكل التشغيلي البسيط هو الأفضل.

الدرس المرير في الحوسبة يؤكد أن الأساليب التي تتوسع مع القوة الحسابية تتفوق على الأنظمة المصممة يدوياً والمعقدة.

Timeline

مقدمة: ما هو السؤال الصحيح في عصر الذكاء الاصطناعي؟

يبدأ دانيال، مطور تطبيقات iOS ذو الخبرة الطويلة، بتحدي السؤال الشائع حول أفضل نموذج ذكاء اصطناعي حالياً. يستعرض مسيرته من العمل الحر إلى بناء أكثر من 15 تطبيقاً بمفرده باستخدام لغة SwiftUI أمام الجمهور. يركز في حديثه على تحويل استوديو العمل الفردي إلى كيان مستدام يبني تطبيقات حقيقية تدوم طويلاً. يدعو المطورين الجادين للانضمام إلى منصته crafterslab.dev التي تعامل الذكاء الاصطناعي كزميل عمل حقيقي. يوضح أن الهدف ليس مجرد دروس تعليمية، بل بناء حرفة برمجية متينة بمساعدة التقنيات الحديثة.

معيار Epic's Agent وفجوة الأداء في المهام الحقيقية

يستعرض المتحدث دراسة حديثة استخدمت معيار تقييم يسمى Epic's Agent لاختبار الوكلاء في مهام مهنية حقيقية تستغرق وقتاً طويلاً. أظهرت النتائج أن أفضل النماذج نجحت بنسبة 24% فقط في المرة الأولى، ووصلت إلى 40% بعد محاولات متعددة. هذا يتناقض بشكل صارخ مع نتائج المعايير التقليدية التي تسجل فيها النماذج أكثر من 90%. يجادل دانيال بأننا إما نستخدم معايير غير دقيقة أو أننا نقيس الجوانب الخاطئة من قدرات الذكاء الاصطناعي. هذا القسم يسلط الضوء على الفرق الكبير بين حل الألغاز البرمجية البسيطة والقيام بعمل مهني متكامل.

لماذا يفشل الوكلاء؟ ظهور مفهوم هندسة هيكل التشغيل

يوضح الباحثون أن سبب فشل الوكلاء ليس الغباء، بل مشاكل في التنفيذ والتنسيق وفقدان السياق بعد خطوات عديدة. يصف دانيال شعور المطورين عند تخبط الوكيل وتكرار الأخطاء، مشيراً إلى أن العائق هو ما يحيط بالنموذج وليس النموذج نفسه. يقدم مصطلح "Harness" أو هيكل التشغيل، والذي يشمل البنية التحتية والأدوات وكيفية تعافي الوكيل من الأخطاء. يشير إلى أن شركات كبرى مثل OpenAI وAnthropic بدأت تنشر أدلة حول هندسة هذه الهياكل لضمان استمرارية العمل. يؤكد أن العمل الهندسي الحقيقي في عام 2026 سينصب على بناء هذه الأطر التشغيلية بذكاء.

مفارقة التبسيط: تجربة Vercel وشركة Manus

يروي المتحدث قصة مذهلة من شركة Vercel حيث قاموا بتبسيط وكيل SQL عن طريق إزالة 80% من أدواته المتخصصة. بدلاً من الأدوات المعقدة، منحوا الوكيل صلاحيات أساسية مثل أوامر bash وقراءة الملفات، مما رفع الدقة إلى 100%. أدى هذا التغيير أيضاً إلى تسريع العمل بثلاث مرات ونصف وتقليل استهلاك الرموز بنسبة 40%. يربط هذا بتجربة شركة Manus التي أعادت بناء إطار عملها خمس مرات لتكتشف أن التبسيط هو مفتاح الأداء العالي. تظهر هذه الأمثلة أن القيود الكثيرة والمنطق البرمجي اليدوي قد يعيق ذكاء النموذج بدلاً من مساعدته.

إدارة السياق والذاكرة الخارجية في الجلسات الطويلة

يتناول هذا الجزء مشكلة تدهور أداء النماذج في المهام التي تتطلب استدعاء أدوات كثيرة، حيث تضيع الإرشادات المهمة وسط الضجيج. وجدت شركة Manus أن الحل يكمن في معاملة نظام الملفات كذاكرة خارجية للوكيل بدلاً من الاعتماد الكلي على نافذة السياق. يربط دانيال هذا النمط بما يراه المستخدمون في أداة Claude code عبر ملفات مثل CLAUDE.md لتتبع التقدم. يساعد هذا الأسلوب النموذج على استعادة التركيز وقراءة المعلومات الأساسية فقط عند الحاجة إليها. هذا التحول من "حشر السياق" إلى "إدارة الملفات" يعد ركيزة أساسية في هندسة الوكلاء الحديثة.

تحليل أنجح أنظمة الوكلاء: OpenAI وClaude وManus

يقارن المتحدث بين ثلاثة مناهج رائدة وصلت لنفس النتيجة رغم اختلاف بداياتها: نظام Codex وClaude code وManus. يعتمد Codex على نهج طبقي يضم منسقاً ومنفذاً وطبقة تعافي، بينما يعتمد Claude code على أربع أدوات بسيطة للغاية. أما Manus فتركز على تقليص السياق واستخدام الوكلاء الفرعيين للمهام الثقيلة مع إعادة الملخصات فقط. يشدد دانيال على أن المطور المستقل يجب أن يتوقف عن الجدال حول النماذج ويركز على اختيار الهيكل التشغيلي المناسب. الوقت الذي يقضيه المطور في المفاضلة بين كلود وجي بي تي هو وقت ضائع من الإنتاج الفعلي. الهيكل التشغيلي هو الذي يحدد كيف سيتصرف نفس النموذج في بيئات عمل مختلفة.

الدرس المرير وتوصيات عملية للمطورين لعام 2026

يستشهد دانيال بمفهوم "الدرس المرير" لريتشارد ساتون، مؤكداً أن الأنظمة التي تعتمد على قوة الحوسبة تتفوق دائماً على التصميم اليدوي المعقد. يقدم ثلاث نصائح عملية: أولاً، تبسيط إعدادات العميل الذكي ومنحه صلاحيات وصول أساسية للملفات. ثانياً، إضافة ملف تتبع تقدم (Task List) يتم تحديثه باستمرار ليكون ذاكرة خارجية للوكيل. ثالثاً، البدء في تعلم بروتوكول MCP لربط النماذج بالأدوات الخارجية بطريقة موحدة ونظيفة. يؤكد أن عام 2026 سيكون عام الهياكل التشغيلية بامتياز، حيث يتفوق الهيكل الجيد على قوة النموذج الخام. هذه الخطوات تمكن المطورين من تحسين أدائهم فوراً دون انتظار تحديثات من شركات الذكاء الاصطناعي.

خاتمة: دعوة للانضمام إلى Crafters Lab والعمل الجماعي

في الختام، يجدد دانيال دعوته للمطورين لزيارة crafterslab.dev للتعمق في التقنيات التي ناقشها، مثل إعداد ملفات MD وسير عمل الوكلاء. يستعرض محتويات المنصة من دروس فيديو قصيرة، ومهارات جاهزة لـ Claude code، ومساحات عمل Notion الحقيقية. يوضح أن المنصة توفر نظرة خلف الكواليس لعملية بناء التطبيقات بكل عيوبها وتجاربها الناجحة، بما في ذلك مكتبة "Swift Brain". يهدف المختبر إلى خلق مجتمع من المطورين المستقلين الذين يدعمون بعضهم البعض لضمان عدم العمل بإنفراد تام. ينهي الفيديو بنصيحة للمبدعين بالاستمرار في التجربة وعدم الانشغال بضجيج اختبارات الأداء عن جوهر الحرفة.

Community Posts

View all posts