وكلاء الذكاء الاصطناعي عشوائيون... هذا الحل يجعلهم حتميين (Archon)
BBetter Stack
컴퓨터/소프트웨어창업/스타트업가전제품/카메라AI/미래기술
Transcript
00:00:00أصبحت وكلاء الذكاء الاصطناعي قوية بشكل جنوني، لكنها لا تزال فوضوية.
00:00:04نمنحهم نفس المهمة بالضبط، فنحصل على كود مختلف تمامًا، وجودة مختلفة، و
00:00:09حتى قرارات مختلفة في كل مرة.
00:00:12هذا هو واقع العمل مع الوكلاء حاليًا.
00:00:15لكن اتضح أن الأمر لا يجب أن يكون كذلك.
00:00:17هذا هو Archon، ويمكنه الآن تشغيل وكلاء متعددين بالتوازي دون أي تعارضات في الدمج
00:00:22وبنتائج متسقة.
00:00:24سأريكم بالضبط كيفية إعداده وكيفية عمله في الدقائق القليلة القادمة.
00:00:30الآن، عند استخدام Claude code أو Cursor أو Codex، نعلم أن التشغيل الأول يبدو رائعًا.
00:00:39لكن التشغيل الثاني قد يأتي بخطة مختلفة تمامًا.
00:00:42قد ينحرف السياق.
00:00:44وقد يغير الوكيل اتجاهه في منتصف الطريق.
00:00:47ثم تحاول توسيع النطاق.
00:00:49وكيلان، ربما ثلاثة وكلاء، أربعة وكلاء.
00:00:51والآن أصبح المستودع الخاص بك في فوضى عارمة.
00:00:54وهنا تكمن المشكلة الحقيقية.
00:00:55أنت لا توفر الوقت حقًا بعد الآن.
00:00:57بل تعيد تشغيل الأوامر.
00:00:58وتصلح الأكواد المعطلة، آملًا ألا يتعطل هذا التشغيل ببساطة.
00:01:02وإذا كنت تبني أي شيء، فإن هذا يقتل سرعتنا تمامًا.
00:01:06يصلح Archon هذا من خلال ما يسمى “هندسة التسخير” (harness engineering).
00:01:10فبدلًا من الأمل في أن يتصرف الوكيل جيدًا، أنت تحدد العملية فعليًا.
00:01:14التخطيط، البرمجة، الاختبار، المراجعة، كلها في ملف YAML.
00:01:18ومهارات الوكيل هي حزم تعليمات قابلة لإعادة الاستخدام يحملها الوكيل تلقائيًا.
00:01:23لذا بدلًا من التخمين، يتبع وكيلك نظامًا محددًا.
00:01:28إذا كنت تستمتع بأدوات البرمجة التي تسرع سير عملك، فتأكد من الاشتراك.
00:01:32لدينا فيديوهات جديدة تنشر باستمرار.
00:01:34حسنًا، دعوني أريكم الآن.
00:01:36هذا يعمل محليًا على جهازي M4 Pro، بدون سحابة.
00:01:40يمكنني إدخال الأمر archonserv.
00:01:43سيؤدي ذلك لظهور واجهة المستخدم هذه.
00:01:45سأقوم بتثبيت مهارة archon في هذا المستودع باستخدام Claude.
00:01:49الآن أقوم بتشغيل سير عمل بسيط لإصلاح هذه المشكلة.
00:01:54راقبوا هذا الجزء الآن.
00:01:55يجد الوكيل المهارة بنفسه، ويحمل سير العمل وينفذه خطوة بخطوة.
00:02:02يمكنكم مراقبته هنا في التيرمينال أو هناك في واجهة المستخدم.
00:02:04إنه يبدو أفضل بكثير.
00:02:05لا يوجد تعديل مستمر للأوامر هنا.
00:02:07حتى عندما يفشل، تحصل على شفافية كاملة داخل واجهة المستخدم.
00:02:11يمكنك رؤية الخطوة التي تعطلت بالضبط وإصلاح سير العمل.
00:02:15هذا أفضل بكثير من كود Claude الخام حيث تحصل فقط على سجل دردشة مربك.
00:02:20هذا الجزء أساسي.
00:02:21إنه يعمل أيضًا على شجرة عمل Git الخاصة به، لذا لا يلمس الفرع الرئيسي أبدًا.
00:02:26إنه يمر عبر الأوامر ويمكنك أن ترى هنا أنه يولدها.
00:02:29انتهى الأمر، طلب سحب (PR) نظيف، بنفس الهيكل، ونفس النتيجة.
00:02:33يمكننا رؤية السجلات، والعملية التي تمر بها الأوامر والمخرجات بالكامل.
00:02:38هذا هو معنى الاتساق.
00:02:40إذًا، ما الذي تغير فعليًا هنا؟
00:02:42حسنًا، هناك ثلاثة أشياء تغيرت باستخدام Archon.
00:02:45أولًا، سير العمل.
00:02:47يستخدم Archon رسومًا بيانية موجهة غير حلقية (DAGs) بصيغة YAML.
00:02:50فكر فيها كقائمة مهام يجب على الوكيل اتباعها.
00:02:53بعض الخطوات تستخدم الذكاء الاصطناعي، بالتأكيد.
00:02:56وبعض الخطوات ثابتة.
00:02:58هذا المزيج هو ما يجعله أكثر موثوقية.
00:03:00ثم لدينا العزل.
00:03:01كل تشغيل يحدث في شجرة عمل Git منفصلة، فلا يمكن للوكلاء الكتابة فوق بعضهم البعض.
00:03:06هذا هو السبب في عدم وجود تعارضات في الدمج.
00:03:08وفي المهارات، بدلًا من حشو الأوامر في كل مرة، يحمل الوكيل السياق تلقائيًا.
00:03:14لذا مقارنة بالوكلاء الخام، أنت تزيل كل هذه العشوائية.
00:03:19وبالمقارنة مع أدوات مثل LangChain على سبيل المثال.
00:03:22LangChain رائع، لكن Archon مبني خصيصًا للكود، وليس للبوتات العامة.
00:03:27وبالمقارنة مع السكربتات، هذا قابل لإعادة الاستخدام.
00:03:30إنه يدعم الإصدارات.
00:03:31وقابل للاكتشاف.
00:03:32الوكيل لم يعد يخمن بعد الآن.
00:03:34لدينا سير عمل كامل يمر به.
00:03:36إنه يتبع هذا النظام الفعلي.
00:03:38الآن يمكننا تشغيل وكلاء متعددين في نفس الوقت دون القلق من تخريب المستودع.
00:03:42يمكنك إنشاء طلبات سحب تبدو متشابهة في كل مرة.
00:03:45والأهم هنا، أنك تتوقف عن فقدان المعرفة في سجل الدردشة.
00:03:49عمليتك تعيش في سير العمل الآن، مما يعني أن كل تشغيل يصبح أكثر اتساقًا.
00:03:55باستخدام هذا.
00:03:56مع هذا، ستحصل على طلبات سحب نظيفة ونتائج أكثر قابلية للتوقع.
00:03:58نفس المدخلات، تعطي نفس المخرجات.
00:04:00هذا هو الجزء الذي كان يفتقده الوكلاء.
00:04:02بالطبع هذا ليس مثاليًا، أليس كذلك؟
00:04:04لكن ما الجيد فيه؟
00:04:05حسنًا، إنه مفتوح المصدر، ويعمل بشكل رائع محليًا، خاصة على معالجات M، صح؟
00:04:10هناك نسخ معينة تتطلب إعداد سيرفر VPS.
00:04:13أنا لا أحتاج لذلك هنا.
00:04:14ملفات YAML تجعل كل شيء مرئيًا.
00:04:16فوز كبير لنا، وأشجار عمل Git تحل مشكلة حقيقية.
00:04:19لكن مجددًا، هذا يعني أيضًا بضعة أشياء.
00:04:21يجب عليك التفكير مسبقًا.
00:04:23تصميم سير العمل سيستغرق بعض الجهد وهو لا يزال قيد التطوير، صح؟
00:04:28الأشياء ستتغير.
00:04:29سوف تتطور، لكنها تنمو حاليًا.
00:04:31وإذا كنت تقوم فقط بأوامر سريعة، فربما لا تحتاج لهذا أبدًا.
00:04:34سيكون هذا بصراحة مجرد مضيعة للوقت.
00:04:36أيضًا، لا يزال النموذج المستخدم مهمًا.
00:04:38لذا فمن الواضح أن النموذج الأفضل سيعطينا نتائج أفضل.
00:04:42إذا مللت من إصلاح أخطاء الوكلاء، فهذا يستحق التجربة بالتأكيد.
00:04:46إذا أردت شيئًا يمكنك الاعتماد عليه فعليًا دون التشكيك في نفسك، فهذا يستحق العناء أيضًا.
00:04:50إنه يستحق العناء حقًا.
00:04:52إذا كنت مجرد مجرب، أقصد، نعم، كنت أجرب من أجل هذا.
00:04:55لقد أبقيت الأمر بسيطًا.
00:04:56إنه يعمل بشكل رائع.
00:04:57تمكنت من رؤية ما يدور حوله الأمر.
00:04:58لكن إذا كنت جادًا بشأن البناء باستخدام الوكلاء، فهذه واحدة من أقوى الأدوات التي
00:05:02صادفتها في الوقت الحالي.
00:05:04هذا ما يحول الوكلاء من مجرد عروض توضيحية إلى شيء يمكننا شحنه فعليًا
00:05:08بموثوقية أكبر، من خلال دمجه في سير عملنا.
00:05:13إنه أمر بسيط للغاية.
00:05:14بدلًا من مجرد الأمل في أن يفعل الوكيل الشيء الصحيح، صح؟
00:05:16إنه مجرد وكيل.
00:05:17الآن نحن نحدد كيفية عمله.
00:05:20هذا ما يدعونه أو هذا هو جوهر “هندسة التسخير”.
00:05:23إذا كنت تستمتع بأدوات البرمجة والنصائح مثل هذه، فتأكد من الاشتراك في قناة Better Stack.
00:05:27نراكم في فيديو آخر.