00:00:00حسنًا، إذًا.
00:00:02ما هو أفضل نموذج ذكاء اصطناعي حاليًا؟
00:00:04هل هو Claude، أم GPT، أم Gemini؟
00:00:07بصراحة، أعتقد أن هذا هو السؤال الخاطئ.
00:00:11في الواقع، إنه سؤال خاطئ تمامًا.
00:00:14سريعًا، أنا دانيال.
00:00:16أعمل في مجال تطوير تطبيقات iOS منذ أكثر من ثماني سنوات.
00:00:20بدأت كعمل حر، أصمم واجهات المستخدم،
00:00:24أنتقل من عميل لآخر،
00:00:25أقوم بتنفيذ أفكار الآخرين
00:00:27بينما أحاول العثور على أفكاري الخاصة.
00:00:28وبعد عام 2025، قررت العمل بمفردي تمامًا.
00:00:33بلا عملاء، وبلا شبكة أمان.
00:00:36ومنذ ذلك الحين، صممت أكثر من 15 تطبيقًا خاصًا بي،
00:00:39كلها بلغة SwiftUI، وبنيتها جميعًا أمام الملأ.
00:00:41وحاليًا، أضع كل ذرة طاقة أملكها
00:00:44لتحويل هذا الاستوديو الفردي
00:00:46إلى شيء يدوم حقًا.
00:00:49ليس مجرد نماذج أولية سريعة أو محتوى رديء مولد بالذكاء الاصطناعي،
00:00:52بل تطبيقات حقيقية تصمد مع التوسع.
00:00:55ونعم، كل تفاصيل تلك العملية.
00:00:57هذه الرحلة الفوضوية برمتها موجودة على crafterslab.
00:01:00موقعه هو crafterslab.dev،
00:01:01وهو ليس مجرد مقبرة للدروس التعليمية أو مصنع لنسخ الذكاء الاصطناعي.
00:01:06إنه حقًا قاعدتي الأساسية،
00:01:08بنيته للمطورين المستقلين الذين يستخدمون الذكاء الاصطناعي كزميل عمل حقيقي.
00:01:12ليس كآلة بيع تنقر عليها عندما تتعثر
00:01:14وتأمل في الحصول على الأفضل.
00:01:16إذا كنت تهتم بالحرفة،
00:01:18وإذا كنت جادًا بشأن تطوير مستواك
00:01:20وبناء أشياء تدوم حقًا،
00:01:23فنعم، ستشعر أنك في مكانك المناسب هنا.
00:01:24ويا من لا تزالون على Patreon،
00:01:26شكرًا جزيلًا لكم، ولكن انتبهوا.
00:01:29لقد انتقل كل شيء إلى crafterslab.dev.
00:01:32هناك يتواجد الفريق بأكمله الآن.
00:01:33تعالوا لنبني معًا.
00:01:35إليكم ما جعلني أفكر في كل هذا.
00:01:38صدرت دراسة مؤخرًا.
00:01:41نشر الباحثون معيار تقييم يسمى "Epic's Agent".
00:01:45وما يجعله مختلفًا عن أي معيار تقييم آخر
00:01:49تراه يتسبب في جدال الناس عبر الإنترنت،
00:01:51هو أنه يختبر الوكلاء في عمل مهني حقيقي،
00:01:55وليس مجرد ألغاز برمجية أو أسئلة اختيار من متعدد.
00:01:58نحن نتحدث عن مهام فعلية يقوم بها المستشارون والمحامون
00:02:03والمحللون بشكل يومي.
00:02:05تستغرق كل مهمة من الإنسان حوالي ساعة إلى ساعتين لإكمالها.
00:02:08لذا قاموا باختبار كل النماذج الرائدة من خلاله.
00:02:11أفضل نموذج استطاع إكمال تلك المهام
00:02:13بنسبة 24% فقط، أي مرة واحدة من كل أربع.
00:02:17وبعد ثماني محاولات لنفس النموذج،
00:02:20ارتفعت النسبة فقط إلى حوالي 40%.
00:02:23تذكروا أن هذه هي نفس النماذج
00:02:26التي تسجل أكثر من 90% في معايير التقييم
00:02:29التي يفقد الجميع صوابهم بسببها.
00:02:32إذًا، إما أن تلك المعايير غير دقيقة
00:02:33أو أننا نقيس الشيء الخاطئ.
00:02:36وأعتقد أنه الاحتمال الثاني، أليس كذلك؟
00:02:37ولكن حسنًا، هنا يبدأ الأمر بالتحول لواقع ملموس بالنسبة لنا.
00:02:41تعمق الباحثون بالفعل في سبب فشل هؤلاء الوكلاء.
00:02:46ولم تكن الإجابة أن النماذج غبية.
00:02:49فقد كانت تمتلك كل المعرفة التي تحتاجها.
00:02:51وكان بإمكانها التفكير في المشكلات بشكل جيد تمامًا.
00:02:54لكن الإخفاقات كانت تتعلق بالكامل تقريبًا
00:02:56بالتنفيذ والتنسيق.
00:03:00كان الوكلاء يتوهون بعد خطوات كثيرة.
00:03:02وكانوا يعودون لتكرار أساليب فشلت بالفعل.
00:03:05كانوا يفقدون التركيز على ما كان يفترض بهم
00:03:09القيام به في المقام الأول.
00:03:11وإذا كنت مطورًا مستقلًا تستخدم Claude code
00:03:14أو Cursor يوميًا، فأنت تعرف هذا الشعور.
00:03:18لقد شاهدت الوكيل وهو يتخبط ويعيد محاولة نفس
00:03:21الشيء المعطل ثلاث مرات،
00:03:23وينسى تمامًا سياق الحديث قبل 20 خطوة.
00:03:26وتجلس أنت هناك قائلًا،
00:03:28"ربما يجب أن أنتقل إلى Opus".
00:03:30"ربما أحتاج إلى مزود خدمة مختلف"،
00:03:32لكن البيانات تقول إن هذه ليست المشكلة.
00:03:34النموذج ليس هو العائق.
00:03:36بل العائق هو كل ما يحيط به.
00:03:38وهناك كلمة لوصف ذلك.
00:03:40وأعتقد أنها ستحدد ملامح عام 2026
00:03:43مثلما حدد الوكلاء ملامح عام 2025.
00:03:46الكلمة هي "Harness" (هيكل التشغيل).
00:03:47هيكل تشغيل الوكيل يشمل كل البنية التحتية
00:03:50المحيطة بالنموذج، وما يمكنه رؤيته،
00:03:52والأدوات المتاحة له،
00:03:54وكيفية تعافيه عندما تسوء الأمور،
00:03:56وكيف يتتبع ما يفعله خلال جلسة طويلة.
00:03:59نشرت OpenAI حرفيًا مقالًا
00:04:02بعنوان "هندسة هيكل التشغيل".
00:04:04وأصدرت Anthropic دليلًا كاملاً حول بناء
00:04:07هياكل تشغيل فعالة للوكلاء الذين يعملون لفترات طويلة.
00:04:09شركة Manus، شركة الذكاء الاصطناعي التي استحوذت عليها Meta مؤخرًا،
00:04:13نشروا دروسهم في هندسة السياق
00:04:16بعد إعادة بناء إطار عمل الوكيل الخاص بهم بالكامل
00:04:19خمس مرات في ستة أشهر، نعم خمس مرات.
00:04:22وجميعهم يقولون الشيء نفسه تمامًا.
00:04:24هيكل التشغيل هو المكان الذي يكمن فيه العمل الهندسي الحقيقي،
00:04:27وليس النموذج نفسه.
00:04:28حسنًا، وهذا هو الجزء الذي فاجأني بصراحة
00:04:32لأنه يتعارض تمامًا
00:04:34مع الطريقة التي يفكر بها معظمنا عند البناء بهذه الأدوات.
00:04:38هناك هذه القصة من Vercel.
00:04:41كان لديهم وكيل لتحويل النص إلى SQL.
00:04:43تطرح سؤالًا، فيكتب هو استعلام SQL،
00:04:46وقد بنوه بالطريقة التي يبني بها معظم الناس الوكلاء، أليس كذلك؟
00:04:49أعطوه مجموعة من الأدوات المتخصصة،
00:04:51أداة لفهم مخطط قاعدة البيانات،
00:04:54وأخرى لكتابة الاستعلامات، وأخرى للتحقق من النتائج.
00:04:58كل هذا التعامل مع الأخطاء كان ملفوفًا حوله
00:05:01وكان يعمل بنسبة 80% من الوقت.
00:05:04ثم جربوا شيئًا جذريًا بعض الشيء.
00:05:06قاموا بإزالة 80% من الأدوات، انتزعوها فحسب،
00:05:11وأعطوا الوكيل أشياء أساسية: تشغيل أوامر bash، وقراءة الملفات،
00:05:15وأدوات سطر الأوامر القياسية مثل grep و cat،
00:05:18من النوع الذي قد نستخدمه أنا أو أنت فعليًا.
00:05:20وارتفعت الدقة من 80% إلى 100%.
00:05:25واستخدم رموزًا (tokens) أقل بنسبة 40%،
00:05:28وكان أسرع بثلاث مرات ونصف.
00:05:31لن أكذب، هذا مذهل حقًا، أليس كذلك؟
00:05:33والمهندس الذي بناه قال شيئًا
00:05:36علق بذاكرتي حقًا.
00:05:38النماذج تزداد ذكاءً.
00:05:40ونوافذ السياق تزداد اتساعًا.
00:05:42لذا ربما تكون أفضل بنية للوكيل
00:05:44هي عدم وجود بنية على الإطلاق تقريبًا.
00:05:46وهذا يقلب كل الموازين، أتعرف ما أعنيه؟
00:05:50لأن الغريزة، خاصة عندما تعمل بمفردك
00:05:54وتحاول جعل هذا الشيء موثوقًا،
00:05:57هي الاستمرار في إضافة المزيد من الأدوات، والمزيد من القيود،
00:06:01والمزيد من منطق التوجيه.
00:06:02تظن أن المزيد من الهيكلة سيساعد،
00:06:04لكن تلك الأدوات لم تكن تساعد النموذج.
00:06:06بل كانت تعيقه.
00:06:08وهذا ليس مجرد حادثة معزولة.
00:06:10فشركة Manus مرت بنفس الاكتشاف تمامًا.
00:06:13لقد أعادوا بناء إطار عمل الوكيل الخاص بهم بالكامل
00:06:16خمس مرات في ستة أشهر،
00:06:19وأكبر مكاسب الأداء لديهم
00:06:21لم تأتِ من إضافة ميزات جديدة.
00:06:23بل جاءت من إزالتها.
00:06:25لقد استبعدوا استرجاع المستندات المعقد،
00:06:28وألغوا منطق التوجيه المتكلف،
00:06:29واستبدلوا وكلاء الإدارة بعمليات تسليم بسيطة ومنظمة.
00:06:34مع كل محاولة، كان الأمر يصبح أبسط ويصبح أفضل.
00:06:37وهنا الجزء الذي أعتقد أن كل مطور مستقل
00:06:40يدير جلسات مطولة على Claude code يحتاج لسماعه.
00:06:42وجدت Manus أن وكيلهم كان يقوم بمتوسط
00:06:45حوالي 50 استدعاء للأدوات في كل مهمة.
00:06:49هذا عدد كبير من الخطوات.
00:06:50وحتى مع النماذج التي تدعم تقنيًا
00:06:53نوافذ سياق ضخمة،
00:06:54إلا أن الأداء يتدهور بعد نقطة معينة.
00:06:58النموذج لا ينسى كل شيء فجأة.
00:07:01الأمر أشبه بأن الإشارة تضيع وسط الضجيج.
00:07:04تعليماتك المهمة في بداية الجلسة
00:07:07تضيع تحت وطأة مئات النتائج الوسيطة.
00:07:10لذا كان حلهم بسيطًا للغاية.
00:07:12بدأوا في معاملة نظام الملفات
00:07:14كذكرة خارجية للنموذج.
00:07:17بدلًا من حشر كل شيء في نافذة السياق،
00:07:20يقوم الوكيل بكتابة المعلومات الأساسية في ملف
00:07:23ويقرأها مرة أخرى عند الحاجة.
00:07:25ونعم، إذا كنت تستخدم Claude code،
00:07:27فقد رأيت هذا حرفيًا.
00:07:29ملفات CLAUDE.md، وقوائم المهام، وتتبع التقدم،
00:07:34هذا هو بالضبط نفس النمط الذي تراه
00:07:36في واجهة الأوامر الخاصة بك كل يوم.
00:07:37حسنًا، تذكروا ما قلته
00:07:40عن التقاء الجميع حول نفس الفكرة؟
00:07:44لأنه عندما تنظر
00:07:45إلى أنجح ثلاث أنظمة وكلاء حاليًا،
00:07:49تجد أنها وصلت جميعًا لنفس النتيجة
00:07:51من اتجاهات مختلفة تمامًا.
00:07:53نظام Codex من OpenAI يعتمد على هذا النهج الطبقي.
00:07:57منسق يضع الخطط،
00:07:59ومنفذ يتعامل مع المهام الفردية،
00:08:02وطبقة تعافي تلتقط الإخفاقات.
00:08:06إنه نظام متين.
00:08:07يمكنك تسليمه المهام والذهاب بعيدًا.
00:08:09هذه فلسفة واحدة.
00:08:10أما Claude code، وأنا أستخدمه يوميًا.
00:08:14فجوهره يتكون حرفيًا من أربع أدوات فقط.
00:08:16قراءة ملف، كتابة ملف، تعديل ملف،
00:08:19وتشغيل أمر bash، هذا كل شيء.
00:08:21معظم الذكاء يكمن في النموذج نفسه.
00:08:23ويبقى هيكل التشغيل بسيطًا.
00:08:25وعندما تحتاج للمزيد، تأتي القابلية للتوسع عبر MCP
00:08:28والمهارات التي يكتسبها الوكيل حسب الحاجة.
00:08:30ثم استقرت Manus على ما أسميه
00:08:33"التقليل، الترحيل، العزل": تقليص السياق بنشاط،
00:08:38استخدام نظام الملفات للذاكرة،
00:08:40تشغيل وكلاء فرعيين للمهام الثقيلة،
00:08:43والعودة بالملخص فقط.
00:08:45ثلاثة مناهج مختلفة تمامًا،
00:08:47تلتقي جميعًا عند نفس الرؤية.
00:08:50هيكل التشغيل أهم من النموذج.
00:08:52وبالنسبة للمطورين المستقلين،
00:08:55هذا يغير ما يجب عليك فعليًا
00:08:57بما يجب أن تقضي وقتك فيه حقاً.
00:08:59لأننا، كما تعلم، لا نملك ساعات غير محدودة.
00:09:01فكل ساعة تقضيها على "ريديت" في جدال
00:09:05حول الأفضل بين "كلود" و"جي بي تي" هي ساعة لا تنجز فيها عملاً.
00:09:08وهناك هذه الفكرة من ريتشارد ساتون،
00:09:11أحد مبتكري التعلم المعزز،
00:09:14تُسمى "الدرس المرير".
00:09:16والحجة الجوهرية هي أن
00:09:18الأساليب التي تتوسع مع قوة الحوسبة
00:09:21تنتهي دائماً بالتفوق على الأساليب
00:09:23التي تعتمد على المعرفة المصممة يدوياً.
00:09:26تطبيق ذلك على ما نفعله
00:09:27يعني شيئاً محدداً للغاية.
00:09:29فكلما زاد ذكاء النماذج،
00:09:31يجب أن يصبح "الهيكل التشغيلي" أبسط،
00:09:33وليس أكثر تعقيداً.
00:09:34إذا كنت تضيف المزيد من المنطق البرمجي اليدوي،
00:09:36والمزيد من خطوط العمل المخصصة مع كل ترقية للنموذج،
00:09:40فأنت تسبح عكس التيار.
00:09:42وبصراحة، هذا الإفراط في الهندسة
00:09:44هو على الأرجح السبب في تعطل عميلك البرمجي المستمر.
00:09:47لذا، إليك ما سأجربه فعلياً.
00:09:49أولاً، قم بتجربة "فيرسل" بنفسك.
00:09:52إذا كان لديك أي نوع من إعدادات العميل الذكي،
00:09:54فقم بتبسيطه، وأزل الأدوات المتخصصة،
00:09:57ومنحه طرفية "باش" وصلاحية وصول أساسية للملفات
00:10:00وانظر فقط ماذا سيحدث.
00:10:02النموذج على الأرجح أكثر ذكاءً
00:10:03من خط الأدوات الذي بنيته حوله.
00:10:06ثانياً، أضف ملفاً لتتبع التقدم.
00:10:08اجعل عميلك يحافظ على قائمة مهام جارية
00:10:10يقوم بتحديثها بعد كل خطوة.
00:10:13يقرأ الملف في بداية كل إجراء،
00:10:15ويكتب فيه عند الانتهاء.
00:10:17هذا بالضبط ما يفعله "كلود كود"
00:10:19باستخدام ملفات "مارك داون" تلك.
00:10:20وهو نفس النمط الذي توصل إليه مانيش
00:10:22بعد خمس عمليات إعادة كتابة كاملة.
00:10:24لدي بالفعل نظام كامل لهذا
00:10:26مُعد في المختبر مع كل تعليمات العميل
00:10:29وقوالب ملفات MD جاهزة إذا كنت مهتماً.
00:10:33وثالثاً، ابدأ في التعلم عن بروتوكول MCP والمهارات.
00:10:37فهذه تمنح النموذج طرقاً نظيفة وموحدة
00:10:40للعمل مع الأدوات الخارجية
00:10:42دون أن تضطر لبرمجة كل تكامل يدوياً.
00:10:44هنا يكمن سر قابلية التوسع الآن.
00:10:46عام 2025 كان عام العملاء الأذكياء.
00:10:50وبالنسبة للجزء الأكبر، نعم، لقد حدث ذلك.
00:10:53لكن عام 2026، أعتقد أنه سيكون عام "الهياكل التشغيلية"
00:10:58فالنموذج نفسه، نفس النموذج تماماً
00:11:03يتصرف بشكل مختلف تماماً في "كلود كود"
00:11:06مقارنة بـ "كيرسر" أو مقارنة بـ "كوديكس".
00:11:08لذا اختر هيكلك التشغيلي بعناية،
00:11:11سواء كنت تستخدم عميلاً برمجياً أو تبني واحداً.
00:11:14لذا، نعم، إذا كنت لا تزال هنا،
00:11:17فأنت حقاً أسطورة.
00:11:18وأنا أعلم أن الجدل حول النماذج صاخب الآن.
00:11:22كل أسبوع هناك إصدار جديد، واختبار جديد،
00:11:24ونقاش جديد حول أيهم يتربع على العرش.
00:11:27لكن البيانات الفعلية، والهندسة الحقيقية
00:11:30الصادرة عن الشركات التي تبني هذه التقنيات،
00:11:32تشير جميعها إلى مكان آخر.
00:11:34الهيكل التشغيلي هو المكان الذي تتحقق فيه النجاحات.
00:11:37وبالنسبة للمطورين المستقلين، فهذه أخبار رائعة
00:11:40لأن بناء هيكل تشغيلي أفضل
00:11:42هو شيء يمكنك القيام به الآن اليوم
00:11:45دون انتظار إصدار النموذج التالي.
00:11:47وإذا كنت تريد التعمق أكثر في كيفية
00:11:51إعداد كل هذا، ملفات MD، وسير عمل العميل،
00:11:56وكيف أربط كل شيء معاً لتطبيقاتي الخاصة،
00:11:59تفضل بزيارة crafterslab.dev.
00:12:02إنه ليس مجرد مستودع دروس أو مزرعة محتوى ذكاء اصطناعي.
00:12:06بل هو قاعدتي الأساسية المبنية للمطورين المستقلين
00:12:09الذين يعاملون الذكاء الاصطناعي كزميل حقيقي في الفريق
00:12:11ويهتمون حقاً بما ينجزونه.
00:12:13بالداخل، ستحصل على شروحات كاملة،
00:12:15ودروس فيديو قصيرة، ومجموعة من مهارات "كلود كود"
00:12:19التي يمكنك الحصول عليها واستخدامها على الفور،
00:12:21وموارد قابلة للتنزيل يمكنك إضافتها
00:12:24مباشرة في مشاريعك.
00:12:26الأعضاء يتناقشون في التعليقات، ويطرحون المتابعات،
00:12:29ويتبادلون الأفكار.
00:12:30إنه حوار حقيقي، وليس مجرد تغذية محتوى من طرف واحد.
00:12:34لكن الجوهر الحقيقي هو مساحات فريق Notion،
00:12:37خطة عملي المباشرة، حيث تحصل على مقعد في الصف الأول
00:12:40لترى كيف أدير كل تطبيق أقوم ببنائه،
00:12:42وملفات MD الفعلية التي أستخدمها في المشاريع الحقيقية،
00:12:46ومكتبة التوجيهات، والوثائق التي أكتبها أثناء العمل،
00:12:49وكل عمليات الأتمتة التي تعمل خلف الكواليس،
00:12:51لا شيء منمق للكاميرا، بل هي العملية الحقيقية بكل عيوبها،
00:12:55وهناك أيضاً "Swift Brain"،
00:12:58وهي مكتبة منسقة لـ Swift و Swift UI
00:13:01أقوم ببنائها منذ سنوات، وعروض تقديمية متعمقة،
00:13:04ومحادثات خاصة أنفقت أموالاً حقيقية لتنسيقها،
00:13:07وهي نوع المواد التي لا تجدها منتشرة
00:13:10في بيانات التدريب العامة.
00:13:11هذا ما أستخدمه فعلياً لبناء بروتوكولات MCP مخصصة
00:13:16ولإعداد مهارات لـ "كلود كود"، و"كيرسر"، وكل شيء،
00:13:20أقوم دائماً بالتجربة ومشاركة ما ينجح،
00:13:23ثم هناك Ops Lab.
00:13:25حيث توجد جميع تعليمات عملاء الذكاء الاصطناعي،
00:13:28وقوالب Notion، ومهارات "كلود كود"،
00:13:31وسير العمل، وعمليات الأتمتة كلها جاهزة
00:13:33لكي تنسخها، أو تفككها،
00:13:36أو حتى تعيد بناءها بطريقتك الخاصة.
00:13:38الهدف الأساسي هو إبقاء المطور المستقل متصلاً
00:13:41لكي لا تبني أبداً بمفردك،
00:13:44حتى لو كنت وحيداً أمام لوحة المفاتيح.
00:13:46لذا، إذا كنت ترغب في الانضمام بينما لا يزال الفريق صغيراً
00:13:49والأسعار ثابتة، فالآن هو الوقت المثالي.
00:13:52المكان يشبه صالون مطورين خلف الكواليس
00:13:55أكثر من كونه منتدى عملاقاً مجهول الهوية
00:13:57وسيسعدني حقاً رؤيتك هناك.
00:14:00لنتبادل الآراء حول موضوع الهياكل التشغيلية هذا،
00:14:02وربما نتعلم شيئاً مما ستبنيه تالياً.
00:14:05استمر في الإبداع، واستمر في التجربة،
00:14:08ولا تدع ضجيج اختبارات الأداء يشتتك
00:14:10عما يهم حقاً.
00:14:12مع السلامة.