وكلاء الذكاء الاصطناعي عشوائيون... هذا الحل يجعلهم حتميين (Archon)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업가전제품/카메라AI/미래기술

Transcript

00:00:00أصبحت وكلاء الذكاء الاصطناعي قوية بشكل جنوني، لكنها لا تزال فوضوية.
00:00:04نمنحهم نفس المهمة بالضبط، فنحصل على كود مختلف تمامًا، وجودة مختلفة، و
00:00:09حتى قرارات مختلفة في كل مرة.
00:00:12هذا هو واقع العمل مع الوكلاء حاليًا.
00:00:15لكن اتضح أن الأمر لا يجب أن يكون كذلك.
00:00:17هذا هو Archon، ويمكنه الآن تشغيل وكلاء متعددين بالتوازي دون أي تعارضات في الدمج
00:00:22وبنتائج متسقة.
00:00:24سأريكم بالضبط كيفية إعداده وكيفية عمله في الدقائق القليلة القادمة.
00:00:30الآن، عند استخدام Claude code أو Cursor أو Codex، نعلم أن التشغيل الأول يبدو رائعًا.
00:00:39لكن التشغيل الثاني قد يأتي بخطة مختلفة تمامًا.
00:00:42قد ينحرف السياق.
00:00:44وقد يغير الوكيل اتجاهه في منتصف الطريق.
00:00:47ثم تحاول توسيع النطاق.
00:00:49وكيلان، ربما ثلاثة وكلاء، أربعة وكلاء.
00:00:51والآن أصبح المستودع الخاص بك في فوضى عارمة.
00:00:54وهنا تكمن المشكلة الحقيقية.
00:00:55أنت لا توفر الوقت حقًا بعد الآن.
00:00:57بل تعيد تشغيل الأوامر.
00:00:58وتصلح الأكواد المعطلة، آملًا ألا يتعطل هذا التشغيل ببساطة.
00:01:02وإذا كنت تبني أي شيء، فإن هذا يقتل سرعتنا تمامًا.
00:01:06يصلح Archon هذا من خلال ما يسمى “هندسة التسخير” (harness engineering).
00:01:10فبدلًا من الأمل في أن يتصرف الوكيل جيدًا، أنت تحدد العملية فعليًا.
00:01:14التخطيط، البرمجة، الاختبار، المراجعة، كلها في ملف YAML.
00:01:18ومهارات الوكيل هي حزم تعليمات قابلة لإعادة الاستخدام يحملها الوكيل تلقائيًا.
00:01:23لذا بدلًا من التخمين، يتبع وكيلك نظامًا محددًا.
00:01:28إذا كنت تستمتع بأدوات البرمجة التي تسرع سير عملك، فتأكد من الاشتراك.
00:01:32لدينا فيديوهات جديدة تنشر باستمرار.
00:01:34حسنًا، دعوني أريكم الآن.
00:01:36هذا يعمل محليًا على جهازي M4 Pro، بدون سحابة.
00:01:40يمكنني إدخال الأمر archonserv.
00:01:43سيؤدي ذلك لظهور واجهة المستخدم هذه.
00:01:45سأقوم بتثبيت مهارة archon في هذا المستودع باستخدام Claude.
00:01:49الآن أقوم بتشغيل سير عمل بسيط لإصلاح هذه المشكلة.
00:01:54راقبوا هذا الجزء الآن.
00:01:55يجد الوكيل المهارة بنفسه، ويحمل سير العمل وينفذه خطوة بخطوة.
00:02:02يمكنكم مراقبته هنا في التيرمينال أو هناك في واجهة المستخدم.
00:02:04إنه يبدو أفضل بكثير.
00:02:05لا يوجد تعديل مستمر للأوامر هنا.
00:02:07حتى عندما يفشل، تحصل على شفافية كاملة داخل واجهة المستخدم.
00:02:11يمكنك رؤية الخطوة التي تعطلت بالضبط وإصلاح سير العمل.
00:02:15هذا أفضل بكثير من كود Claude الخام حيث تحصل فقط على سجل دردشة مربك.
00:02:20هذا الجزء أساسي.
00:02:21إنه يعمل أيضًا على شجرة عمل Git الخاصة به، لذا لا يلمس الفرع الرئيسي أبدًا.
00:02:26إنه يمر عبر الأوامر ويمكنك أن ترى هنا أنه يولدها.
00:02:29انتهى الأمر، طلب سحب (PR) نظيف، بنفس الهيكل، ونفس النتيجة.
00:02:33يمكننا رؤية السجلات، والعملية التي تمر بها الأوامر والمخرجات بالكامل.
00:02:38هذا هو معنى الاتساق.
00:02:40إذًا، ما الذي تغير فعليًا هنا؟
00:02:42حسنًا، هناك ثلاثة أشياء تغيرت باستخدام Archon.
00:02:45أولًا، سير العمل.
00:02:47يستخدم Archon رسومًا بيانية موجهة غير حلقية (DAGs) بصيغة YAML.
00:02:50فكر فيها كقائمة مهام يجب على الوكيل اتباعها.
00:02:53بعض الخطوات تستخدم الذكاء الاصطناعي، بالتأكيد.
00:02:56وبعض الخطوات ثابتة.
00:02:58هذا المزيج هو ما يجعله أكثر موثوقية.
00:03:00ثم لدينا العزل.
00:03:01كل تشغيل يحدث في شجرة عمل Git منفصلة، فلا يمكن للوكلاء الكتابة فوق بعضهم البعض.
00:03:06هذا هو السبب في عدم وجود تعارضات في الدمج.
00:03:08وفي المهارات، بدلًا من حشو الأوامر في كل مرة، يحمل الوكيل السياق تلقائيًا.
00:03:14لذا مقارنة بالوكلاء الخام، أنت تزيل كل هذه العشوائية.
00:03:19وبالمقارنة مع أدوات مثل LangChain على سبيل المثال.
00:03:22LangChain رائع، لكن Archon مبني خصيصًا للكود، وليس للبوتات العامة.
00:03:27وبالمقارنة مع السكربتات، هذا قابل لإعادة الاستخدام.
00:03:30إنه يدعم الإصدارات.
00:03:31وقابل للاكتشاف.
00:03:32الوكيل لم يعد يخمن بعد الآن.
00:03:34لدينا سير عمل كامل يمر به.
00:03:36إنه يتبع هذا النظام الفعلي.
00:03:38الآن يمكننا تشغيل وكلاء متعددين في نفس الوقت دون القلق من تخريب المستودع.
00:03:42يمكنك إنشاء طلبات سحب تبدو متشابهة في كل مرة.
00:03:45والأهم هنا، أنك تتوقف عن فقدان المعرفة في سجل الدردشة.
00:03:49عمليتك تعيش في سير العمل الآن، مما يعني أن كل تشغيل يصبح أكثر اتساقًا.
00:03:55باستخدام هذا.
00:03:56مع هذا، ستحصل على طلبات سحب نظيفة ونتائج أكثر قابلية للتوقع.
00:03:58نفس المدخلات، تعطي نفس المخرجات.
00:04:00هذا هو الجزء الذي كان يفتقده الوكلاء.
00:04:02بالطبع هذا ليس مثاليًا، أليس كذلك؟
00:04:04لكن ما الجيد فيه؟
00:04:05حسنًا، إنه مفتوح المصدر، ويعمل بشكل رائع محليًا، خاصة على معالجات M، صح؟
00:04:10هناك نسخ معينة تتطلب إعداد سيرفر VPS.
00:04:13أنا لا أحتاج لذلك هنا.
00:04:14ملفات YAML تجعل كل شيء مرئيًا.
00:04:16فوز كبير لنا، وأشجار عمل Git تحل مشكلة حقيقية.
00:04:19لكن مجددًا، هذا يعني أيضًا بضعة أشياء.
00:04:21يجب عليك التفكير مسبقًا.
00:04:23تصميم سير العمل سيستغرق بعض الجهد وهو لا يزال قيد التطوير، صح؟
00:04:28الأشياء ستتغير.
00:04:29سوف تتطور، لكنها تنمو حاليًا.
00:04:31وإذا كنت تقوم فقط بأوامر سريعة، فربما لا تحتاج لهذا أبدًا.
00:04:34سيكون هذا بصراحة مجرد مضيعة للوقت.
00:04:36أيضًا، لا يزال النموذج المستخدم مهمًا.
00:04:38لذا فمن الواضح أن النموذج الأفضل سيعطينا نتائج أفضل.
00:04:42إذا مللت من إصلاح أخطاء الوكلاء، فهذا يستحق التجربة بالتأكيد.
00:04:46إذا أردت شيئًا يمكنك الاعتماد عليه فعليًا دون التشكيك في نفسك، فهذا يستحق العناء أيضًا.
00:04:50إنه يستحق العناء حقًا.
00:04:52إذا كنت مجرد مجرب، أقصد، نعم، كنت أجرب من أجل هذا.
00:04:55لقد أبقيت الأمر بسيطًا.
00:04:56إنه يعمل بشكل رائع.
00:04:57تمكنت من رؤية ما يدور حوله الأمر.
00:04:58لكن إذا كنت جادًا بشأن البناء باستخدام الوكلاء، فهذه واحدة من أقوى الأدوات التي
00:05:02صادفتها في الوقت الحالي.
00:05:04هذا ما يحول الوكلاء من مجرد عروض توضيحية إلى شيء يمكننا شحنه فعليًا
00:05:08بموثوقية أكبر، من خلال دمجه في سير عملنا.
00:05:13إنه أمر بسيط للغاية.
00:05:14بدلًا من مجرد الأمل في أن يفعل الوكيل الشيء الصحيح، صح؟
00:05:16إنه مجرد وكيل.
00:05:17الآن نحن نحدد كيفية عمله.
00:05:20هذا ما يدعونه أو هذا هو جوهر “هندسة التسخير”.
00:05:23إذا كنت تستمتع بأدوات البرمجة والنصائح مثل هذه، فتأكد من الاشتراك في قناة Better Stack.
00:05:27نراكم في فيديو آخر.

Key Takeaway

يحول Archon وكلاء الذكاء الاصطناعي من أدوات تجريبية عشوائية إلى أنظمة برمجية حتمية عبر استخدام هندسة التسخير والرسوم البيانية الموجهة غير الحلقية (DAGs) لضمان ثبات المخرجات.

Highlights

  • يعالج نظام Archon عشوائية وكلاء الذكاء الاصطناعي من خلال تحويل العمليات البرمجية إلى مهام محددة سلفًا في ملفات YAML.

  • تمنع تقنية عزل أشجار عمل Git تعارضات الدمج عند تشغيل وكلاء متعددين بالتوازي في نفس المستودع.

  • تسمح واجهة مستخدم archonserv بمراقبة سير العمل خطوة بخطوة وتحديد نقطة الفشل بدقة مقارنة بسجلات الدردشة التقليدية.

  • تعمل الأداة محليًا بالكامل على أجهزة مثل M4 Pro دون الحاجة إلى معالجة سحابية أو خوادم خارجية.

  • ينتج النظام طلبات سحب (PR) متسقة في الهيكل والنتيجة عند تكرار نفس الأوامر المدخلة.

Timeline

معضلة العشوائية في وكلاء البرمجة الحاليين

  • تنتج أدوات مثل Claude code وCursor نتائج متباينة لنفس المهمة عند تكرار الطلب.
  • يؤدي تشغيل وكلاء متعددين في آن واحد إلى فوضى في مستودعات الأكواد وتعارضات في البيانات.
  • تضيع إنتاجية المطور في إصلاح الأكواد المعطلة وإعادة تشغيل الأوامر بدلًا من بناء الميزات.

تتسم بيئة العمل الحالية مع الوكلاء بفقدان السياق وتغيير المسار المفاجئ في منتصف المهمة. يؤدي هذا الانحراف إلى تدمير سرعة التطوير، حيث يصبح الوكيل عبئًا يتطلب مراقبة مستمرة لتجنب تدمير هيكل المشروع. المشكلة تكمن في غياب النظام الذي يربط تصرفات الوكيل بمسار عمل ثابت.

هندسة التسخير ونظام Archon

  • تستبدل هندسة التسخير التوقعات العشوائية بعمليات محددة تشمل التخطيط والبرمجة والاختبار.
  • تعمل مهارات الوكيل كحزم تعليمات قابلة لإعادة الاستخدام يتم تحميلها تلقائيًا دون تدخل يدوي.
  • يضمن العمل على فروع Git منفصلة سلامة الفرع الرئيسي من التعديلات غير المختبرة.

يستخدم Archon ملفات YAML لتعريف كل خطوة في دورة حياة التطوير، مما يلغي التخمين لدى الوكيل. توفر واجهة التشغيل المحلية شفافية كاملة، حيث يمكن للمطور رؤية المخرجات والسجلات لكل خطوة. ينتهي سير العمل بإنتاج طلب سحب نظيف يتبع معايير محددة مسبقًا، مما يحقق مبدأ الاتساق البرمجي.

المكونات التقنية والمقارنة مع الأدوات الأخرى

  • تعتمد موثوقية Archon على دمج الرسوم البيانية الموجهة غير الحلقية (DAGs) مع خطوات الذكاء الاصطناعي.
  • يتفوق Archon على LangChain بتخصصه العميق في هندسة الكود بدلاً من المحادثات العامة.
  • يوفر النظام ميزة الإصدارات والقابلية للاكتشاف للمهام البرمجية المتكررة.

يعتمد التغيير الجذري هنا على ثلاثة ركائز: سير العمل المنظم، العزل التقني، والمهارات التلقائية. فبينما تكون السكربتات التقليدية جامدة، يوفر Archon مرونة الذكاء الاصطناعي مع انضباط الهيكل البرمجي. يمنع هذا التوجه فقدان المعرفة التقنية داخل سجلات الدردشة العابرة، ويحولها إلى أصول برمجية دائمة.

مزايا ومقايضات الاستخدام المتقدم

  • يتطلب النظام تخطيطًا مسبقًا وجهدًا في تصميم سير العمل قبل البدء في التنفيذ.
  • تظل جودة النتائج النهائية مرتبطة بقوة نموذج الذكاء الاصطناعي الأساسي المستخدم.
  • تعد الأداة غير ضرورية للمهام البسيطة أو الأوامر السريعة التي لا تتطلب تكرارًا.

يمتاز Archon بكونه مفتوح المصدر وفعالاً بشكل استثنائي على المعالجات المحلية، مما يلغي الحاجة لخوادم VPS في كثير من الحالات. رغم فاعليته، إلا أنه يتطلب عقلية هندسية لبناء مسارات YAML فعالة. يمثل هذا النظام الجسر الذي ينقل الذكاء الاصطناعي من مرحلة العروض التوضيحية المبهرة إلى مرحلة الشحن الفعلي للمنتجات بموثوقية عالية.

Community Posts

View all posts