هندسة الحلقات تضاعف كفاءة وكلاء Hermes بمقدار 10 أضعاف

AAI LABS
Computing/SoftwareInternet Technology

Transcript

00:00:00هناك مصطلح جديد ينتشر وربما سمعته بالفعل. إنه يسمى هندسة الحلقات
00:00:04ومثل كل مصطلح رائج آخر، يتحدث الجميع عنه وكأنه شيء جديد. إنه ليس كذلك
00:00:09ولكن عندما تدمجه مع وكيل يعمل باستمرار مثل Hermes، فإنه يتوقف عن كونه مجرد ضجيج. معظم الأشخاص
00:00:13الذين يحاولون إعداد هذه الحلقات يطبقونها بشكل صحيح لكنهم يفتقدون الشيء الذي
00:00:17يجعلها تعمل فعلياً، وإذا كنت تعلم بالفعل أن هناك نوعين من الحلقات، فهناك إعداد محدد داخل
00:00:22أحدهما لا يفعله أحد تقريباً. بمجرد رؤيته، ستتغير طريقتك في التفكير في البناء باستخدام الوكلاء
00:00:27بشكل كامل. بحلول نهاية هذا الفيديو، ستفهم بالضبط ماهيته وستكون قد
00:00:31شغلته على Hermes وحتى Claude Code دون الحاجة إلى التدخل على الإطلاق. مع هندسة الحلقات
00:00:36الفكرة الجوهرية بسيطة. تتوقف عن كونك الشخص الذي يكتب المطالبة التي توجه الوكيل
00:00:41وبدلاً من ذلك، تدع الوكيل يوجه نفسه، ولكن لرؤية سبب كونه تحولاً في المقام الأول، عليك
00:00:46مقارنته بما جاء قبله. المهارة التي كانت تهم سابقاً هي هندسة الأوامر حيث كان كل تركيزنا
00:00:51ينصب على كتابة سلسلة التعليمات الصحيحة لتوجيه وكيل البرمجة بشكل صحيح، لكن هندسة الحلقات
00:00:56تقلب ذلك رأساً على عقب. بدلاً من كتابة المطالبة بنفسك، أنت تصمم النظام الذي يقوم
00:01:01بهندسة الأوامر نيابةً عنك ويوجه الوكيل بمفرده، لذا ينتقل التركيز بعيداً عن صياغة
00:01:05التعليمات ونحو تصميم الأنظمة التي تشغل نفسها. بدأ كل هذا عندما قال منشئ
00:01:10OpenClaw أنه لا ينبغي عليك توجيه وكلائك البرمجيين بعد الآن، وأنه يجب عليك التركيز
00:01:15على تصميم حلقات توجه الوكيل نيابةً عنك، وهو ليس الوحيد. بوريس، وهو منشئ
00:01:20Claude Code، ادعى نفس الشيء في مؤتمر مطوري Anthropic السنوي حيث قال إنه
00:01:25لا يوجه Claude بعد الآن. لديه حلقات تعمل وتوجه Claude، وهو يكتشف بنفسه
00:01:30ما يجب القيام به. لذا السؤال هو كيف تبدأ معها؟ كل شيء يعود إلى
00:01:34مدى قدرتك على إعداد الأنظمة التي لا تحتاج فيها للقلق بشأن توجيه الوكيل على الإطلاق.
00:01:39أنت تحدد ما تحتاجه والوكيل يقوم بالباقي. هذا بالضبط هو المسار الذي يتجه إليه التطوير المدعوم بالذكاء الاصطناعي.
00:01:45قبل أن ندخل في كيفية بنائها فعلياً، يجب أن تكون واضحاً بشأن ماهية الحلقة. الحلقة هي
00:01:50أساساً عملية تحدد فيها الهدف النهائي ويقوم الوكيل باكتشاف الخطوات للوصول إليه بمفرده.
00:01:56إنه يصحح نفسه على طول الطريق ويعمل حول المشكلات حتى يصل إلى الهدف الذي حددته.
00:02:01قبل بضعة أشهر، قبل أن تصبح النماذج قادرة بما يكفي لدعم المهام الطويلة، لم يكن هذا ممكناً. إذا
00:02:06كنت بحاجة لبناء تطبيق، كنت ستوجه الوكيل، وتراقب ما يفعله، وتتحقق من المخرجات بنفسك،
00:02:11وتكتشف المشكلات وتعيد التوجيه لإصلاحها. كنت أنت الحلقة. كنت أنت الجزء الذي يقوم بفحص
00:02:16الأخطاء وتصحيح المسار بين كل خطوة. هذا ما لا يزال يبدو عليه التطوير بالنسبة لمعظم
00:02:20الناس، وهذا بالضبط ما توشك هندسة الحلقات على رفعه عن كاهلك. الآن قد يبدو هذا
00:02:25مفهوماً جديداً تماماً، لكن الحلقات كانت موجودة منذ فترة. وظائف Cron هي
00:02:30مثال جيد على حلقة ربما رأيتها بالفعل. إنها مجرد مهام مجدولة لتعمل بشكل متكرر
00:02:35وتلقائي دون الحاجة إلى تشغيلها في كل مرة. الاختلاف الحقيقي الوحيد هو أن
00:02:39وظيفة cron تعمل في وقت محدد. لذا مع وجود الحلقات، يتوقف العمل عن كونه مجرد كتابة للمطالبة.
00:02:44يعتمد أداء وكيلك في مهمة ما على مدى جودة تحديدك للهدف النهائي. بالنسبة للبعض منكم،
00:02:49ستبدو هذه العملية مثل التعلم المعزز. إذا لم تكن قد صادفت ذلك، فإن التعلم المعزز
00:02:54هو أساساً طريقة لتدريب نموذج حيث لا تظهر له الإجابات الصحيحة. بدلاً من ذلك، تخبره فقط
00:02:59عندما قام بعمل جيد وعندما لم يفعل، ويكتشف تدريجياً كيف يتحسن بمفرده.
00:03:04يجد النموذج المسار الصحيح من خلال تجربة أشياء مختلفة. يحصل على إشارة إيجابية عندما يتحرك في
00:03:09الاتجاه الصحيح وإشارة سلبية عندما لا يفعل. تنطبق نفس الفكرة هنا باستثناء النموذج نفسه
00:03:14ليس هو ما يتم تدريبه. بدلاً من ذلك، يعمل الوكيل نحو إكمال المهمة التي تريد إنجازها،
00:03:19متكرراً عليها بنفس الطريقة التي يتحسن بها النموذج أثناء التدريب. إذا فشل، فإن الحلقة التي
00:03:23وضعتها على الوكيل لا تضع علامة على المهمة كمكتملة. يحاول مرة أخرى، ويستمر، ويصحح نفسه حتى
00:03:28يصل إلى الهدف الذي حددته. الآن بعد سماع كل هذا، قد تتساءل عما تبقى بالفعل لك
00:03:33لتفعله إذا كان كل شيء يصبح مستقلاً. لكن دورك لا يتقلص، بل يصبح أكثر أهمية.
00:03:38لأن معرفتك بالمجال وخبرتك هي التي تحدد الهدف النهائي في المقام الأول،
00:03:43وهذا ينتهي بالظهور في كل شيء تبنيه وتطلقه. لهذا السبب بالضبط الاندفاع نحو الحلقات المستقلة
00:03:48يتسارع فقط، ويظهر ذلك في كل ميزة جديدة تصدر الآن. Fable 5 هو
00:03:54أوضح مثال حتى الآن. أصدرته Anthropic على الرغم من أنها كانت تدعو إلى إبطاء في تطوير
00:03:59الذكاء الاصطناعي لأن النماذج تكتسب القدرة بوتيرة يصعب مواكبتها. وبعد
00:04:03إصداره لبعض الوقت، قاموا حتى بسحبه. لقد بنوه للمهام الطويلة والمعقدة، و
00:04:08أداؤه أفضل كلما زادت المهمة طولاً وتعقيداً، وهو عكس كيفية عمل النماذج
00:04:13سابقاً. بدأ هذا التحول حقاً مع Opus 4.5. بمجرد إصداره، أصبحت المهام طويلة الأمد
00:04:19أفضل بشكل كبير. ولم تعد بحاجة إلى إعداد الوكلاء باستخدام أحزمة توجيه دقيقة بعد الآن،
00:04:23وهي إعدادات منظمة توجه الوكيل خلال كل خطوة. انتقل التركيز بدلاً من ذلك نحو
00:04:28إعداد المشروع ليعمل على المدى الطويل لأن النماذج الآن قادرة بما يكفي للتعامل
00:04:33مع الأمور بمفردها دون الكثير من التعامل خطوة بخطوة. لكن الحلقة ليست الشيء الوحيد الذي
00:04:38يهم. تحتاج أيضاً إلى هيكلة مشروعك بطريقة تسمح للوكيل بالعمل بمفرده لفترة
00:04:43طويلة دون أن تضطر للتدخل. لذا قام الكثير من الناس ببناء ومصادر مفتوحة لأنظمة
00:04:48لهذا النوع من الإعداد. كانت حلقة RALF واحدة من أولى الحلقات. عملت من خلال تحديد الهدف النهائي
00:04:53والتأكد من أن الوكيل لا يمكنه الابتعاد عنه. فعلت ذلك من خلال الخطافات (hooks)، وهي أساساً
00:04:57سكربتات تعمل تلقائياً عندما يحدث شيء معين. لذا، يمنع هذا السكربت الوكيل بدقة من وضع علامة على
00:05:03مهمة كمكتملة ما لم تكن قد استوفت الشرط فعلياً. لكن الخطافات جامدة، لذا قدم Claude أمر الهدف الخاص به
00:05:09الخاص، والذي قام بنفس الشيء ولكن بمرونة أكبر. بدلاً من فحص مشفر، يسمح
00:05:14لنموذج آخر بتحديد ما إذا كانت المهمة قد اكتملت بالفعل. غطينا Goal Buddy 2، الذي بنى على
00:05:19ذلك بجعل الوكيل يتتبع تقدمه في ملفات محلية وتحديد ماهية الاكتمال بالضبط
00:05:24قبل أن يبدأ حتى، ليعرف دائماً ما يعمل من أجله. تم بناء كل من وكيل Hermes و OpenClaw
00:05:29على نفس الفلسفة. إنهم يخرجونك من الصورة تماماً ويتركون الوكيل يتعامل مع كل شيء
00:05:35بمفرده. الآن، إذا كنت ترغب في بناء هذه الحلقات، فلدينا نظام من خمس خطوات لك وبما أن
00:05:40هناك نوعين من الحلقات، بعض تلك الخطوات تعمل بشكل مختلف قليلاً لكننا سنتناول كلا النوعين
00:05:45لاحقاً. في الوقت الحالي، سنبدأ في Claude code ولاحقاً في الفيديو، سننظر في كيفية القيام بنفس
00:05:49الشيء في وكيل Hermes. الخطوة الأولى هي التحقق من حالة المشروع. من ذلك، يقرر النموذج
00:05:54ما يجب أن يكون الإجراء التالي. ثم يعمل بناءً على ذلك القرار وهنا يحدث العمل
00:05:59الفعلي. يستدعي الوكيل الأدوات، ويكتب في الملفات، ويشغل الأوامر لإنجاز المهمة. بمجرد اكتمال ذلك،
00:06:04يجمع الملاحظات ليرى ما حدث فعلياً وبناءً على ذلك، يقرر ما إذا كانت
00:06:09المهمة مكتملة أم لا. هذا أيضاً حيث يصبح الفرق بين هندسة الأوامر وهندسة الحلقات
00:06:14واضحاً. مع هندسة الأوامر، أنت تتحكم فقط في خطوة القرار بينما هندسة الحلقات
00:06:19تتعامل مع الخطوات الخمس معاً. بناء حلقة تعمل بشكل جيد يعني الحصول على حفنة من الأشياء بشكل صحيح و
00:06:24كل واحدة منها موجودة بسبب مشكلة محددة تحلها. الأولى هي إدارة السياق. أنت تدفع
00:06:29الانتباه إلى ما يدخل في السياق في كل منعطف لأن هذا هو ما يحدد ما يعرفه الوكيل
00:06:34فعلياً في أي نقطة. لا يمكنك الاعتماد على سياق الدردشة وحده، حتى مع نوافذ سياق
00:06:39كبيرة مثل مليون رمز (token)، أي أساساً كم يمكن للوكيل أن يحتفظ به في الذاكرة في وقت واحد، لأنه مع نمو
00:06:44المحادثة، تُدفن مطالبة النظام والتعليمات الخاصة بك تحت مخرجات الأداة الأخيرة. إن انتباه الوكيل
00:06:50ينجذب بشكل طبيعي نحو ما هو أحدث، لذا تضيع الأشياء المهمة. لهذا السبب
00:06:55تعتبر إدارة السياق مهمة جداً. الشيء التالي الذي يجب الحصول عليه بشكل صحيح هو جودة الملاحظات. الملاحظات هي ما يخبر
00:07:00الوكيل كيف قام بعمل، وهي واحدة من أهم الإشارات في النظام بأكمله. يمكن أن تتخذ الكثير
00:07:05من الأشكال مثل مخرجات تشغيل اختبار أو لقطة شاشة لواجهة المستخدم التي بناها للتو، ومهما كان الشكل الذي تتخذه،
00:07:11هذا ما يقرؤه الوكيل لتحديد خطوته التالية. بوابات التحقق هي ما تحول هذه الملاحظات
00:07:16إلى حكم واضح. إنها نقاط التفتيش التي تخبر الوكيل ما إذا كانت المهمة قد اكتملت بالفعل أم
00:07:21لا. تحتاج أيضاً إلى شرط إنهاء، أساساً قاعدة تخبر الحلقة متى تتوقف، ويجب تعيين هذا الشرط
00:07:26بوضوح، وإلا فإن الوكيل إما يستقيل مبكراً جداً أو يستمر دون إحراز تقدم حقيقي.
00:07:31الشيء الذي يغفل عنه الناس غالباً هو التعامل مع الأخطاء. يجب عليك توضيح ما يجب على النموذج فعله
00:07:36عندما تفشل استدعاء أداة، حتى يتعامل النظام معها بشكل نظيف بدلاً من ترك الأمور في
00:07:41حالة مكسورة تخلق فقط المزيد من المشكلات. وأخيراً، تحتاج إلى إدارة الحالة عبر المنعطفات،
00:07:46أساساً تتبع مكان المهمة مع نمو المحادثة. لا يمكن لنافذة السياق الاحتفاظ
00:07:51بكل شيء إلى الأبد، لذا تعتمد على ملفات خارجية تتتبع المعلومات للوكيل وتسمح له بالاستمرار
00:07:57في العمل دون فقدان الخيط. شيء واحد يجب وضعه في الاعتبار مع ذلك، نظراً لأنك تسلم مهمة
00:08:01اكتشاف المسار إلى النموذج بدلاً من القيام بذلك بنفسك، تصبح الحلقات مكلفة في الرموز،
00:08:06لذا يجب أن تكون متعمداً بشأن متى تستخدمها فعلياً. كلما زاد عدد الرموز التي يمكن للحلقة
00:08:11العمل بها، كان تعاملها مع المهمة أفضل. ولكن قبل أن نمضي قدماً، لنأخذ كلمة من
00:08:15راعينا، Scrimba. معظم دورات بايثون هي مجرد شخص يتحدث فوق شرائح. Scrimba مختلفة،
00:08:21مشغل الفيديو الخاص بهم هو محرر الأكواد، لذا يمكنك التوقف في أي وقت، وتعديل كود المدرب مباشرة،
00:08:26ورؤية ما يحدث. لا تبديل بين علامات التبويب، لا نسخ ولصق، مجرد برمجة عملية من البداية.
00:08:31دورة تعلم بايثون الجديدة الخاصة بهم لفتت انتباهي لأنه بدلاً من التمارين العشوائية، أنت تبني فعلياً
00:08:37شيئاً حقيقياً. من اليوم الأول، أنت تبني PayUp، وهو تطبيق كامل الوظائف لتقسيم النفقات،
00:08:42ويتم تطبيق كل مفهوم فوراً. تبدأ من الصفر المطلق، لا حاجة لمعرفة سابقة ببايثون،
00:08:47وتعمل من خلال المتغيرات، السلاسل النصية، التقاط إدخال المستخدم، عوامل الحساب، تحويل النوع،
00:08:53تنظيف البيانات، وتنسيق الأرقام، كل ذلك من خلال بناء ميزات للتطبيق. بحلول النهاية،
00:08:57تكون قد بنيت مشروعاً فعالاً من الصفر يثبت أنك تعرف بايثون فعلياً. هذا مجرد جزء
00:09:02واحد من عدة أجزاء ستصبح متاحة خلال الأسابيع القادمة، وحالياً، الوصول إليها مجاني تماماً.
00:09:07ابدأ اليوم بدوراتهم المجانية، وسيحصل مستخدمونا على خصم إضافي بنسبة 20% على خططهم الاحترافية.
00:09:12لذا انقر على الرابط في التعليق المثبت، أو امسح رمز الاستجابة السريعة، وابدأ في البناء اليوم.
00:09:18كما ذكرنا، هناك نوعان من الحلقات. الأول يسمى الحلقة الحتمية. تستخدمها
00:09:23للمهام التي لديها تعريف واضح لماهية الاكتمال، يمكن أن يكون ذلك اختبارات ناجحة،
00:09:28تجميع الكود بنجاح، أو أي شيء من هذا القبيل. هذه الحلقات مباشرة إلى حد ما للعمل
00:09:33نحوها، لأن الهدف النهائي واضح، لذا يعرف النموذج بالضبط ما يحتاج إلى القيام به قبل أن يتمكن من استدعاء
00:09:38المهمة مكتملة. بما أن Hermes يعمل دائماً، فهو وكيل جيد جداً لتنفيذ هذه الحلقة عليه. لقد
00:09:43أنشأنا سير عمل متعددة عليه من قبل، وأظهرنا في فيديو سابق كيف يتعامل مع الكثير من عملنا
00:09:49بمفرده. جوهر الحلقة الحتمية هو التعريف الواضح للهدف النهائي، وبالنسبة للتطبيقات
00:09:54التي تستضيفها، فإن هذا التعريف هو اختباراتك. لذا يمكنك توجيه وكيل Hermes إلى أي تطبيق قمت
00:09:59بنشر اختبارات له وجعله يراقبه نيابةً عنك. الآن إذا انتهى تغيير أو التزام بكسر
00:10:04الإنتاج (production)، يمكنك إعداد أتمتة على Hermes لاكتشاف ذلك. السبب في عمله بشكل أفضل هنا هو أنه
00:10:09يأتي مع ميزة المهارات ذاتية التطور، لذا فإنه ينشئ ويطور مهارات تلقائياً بناءً على
00:10:14سير العمل الذي يحافظ على صحة التطبيق تحت السيطرة. بمجرد إعداد أتمتة المراقبة تلك، يمكنك
00:10:18أن تطلب منه تشغيل clawed code في وضع غير تفاعلي، أي تشغيله بمفرده دون أن تضطر
00:10:23لتوجيهه، وجعله يصلح المشكلات في حلقة حتى تنجح جميع حالات الاختبار. ما يفعله من
00:10:28هناك هو إعداد سير عمل الأتمتة وتحميل مهارات مثل مهارة التطوير المدفوع بالوكيل الفرعي
00:10:34ومهارة سير عمل GitHub PR التي تخبره بكيفية إدارة التطبيق على GitHub. هو أولاً يحدد
00:10:39المشكلات التي كانت تكسر الإنتاج ثم يطلق clawed code في وضع غير تفاعلي الذي يأخذ
00:10:44الاختبارات ويلتزم بالتغييرات بمجرد نجاحها جميعاً. بعد أن قام بتشغيل كل اختبار وأصلح أي شيء
00:10:50كان يتسبب في فشل الإنتاج، فإنه يستخدم GitHub CLI لالتزام التغييرات. ينتهي الأمر بالتطبيق يعمل
00:10:55دون أي إخفاقات لأنه تأكد من أن جميع الشيكات لنشر ناجح في مكانها.
00:11:00إذا كنت تحب هذه التفاصيل، اشترك في القناة، وانقر على جرس التنبيه واضغط على زر الضجيج
00:11:05أيضاً. على القناة، ننشر محتوى يساعدك على تعلم طرق جديدة لتحسين عمليات مختلفة
00:11:10في شركات مختلفة باستخدام الذكاء الاصطناعي. دعمك، سواء كان الاشتراك، جرس التنبيه
00:11:15أو زر الضجيج، يساعدنا على إنشاء المزيد من المحتوى مثل هذا والوصول إلى المزيد من الناس. يعني الكثير لنا.
00:11:21الآن النوع الثاني هو الحلقة غير الحتمية وهذه مهام لا يمكنك فيها فقط وضع قاعدة واضحة
00:11:26للتحقق مما إذا كانت المهمة قد أنجزت بالطريقة التي يمكنك بها مع الحلقات الحتمية. بسبب ذلك،
00:11:31لا توجد طريقة نظيفة للتحقق من النتيجة. هذه هي أنواع الأشياء التي يمكننا كبشر النظر
00:11:36إليها والحكم عليها بأنفسنا مثل بناء واجهة مستخدم أو تنفيذ ميزة تحتاج إلى قرار.
00:11:41لذا عندما تعمل مع حلقة غير حتمية، يكون سير العمل مختلفاً. إذا كنت تطبق
00:11:46الذكاء الاصطناعي على واجهة المستخدم، فأنت تعلم بالفعل أنه يميل إلى التراجع إلى نفس الأنماط طوال الوقت. لهذا السبب
00:11:51أنشأنا مهارة تسمى AI Slop Detector والتي تحتوي على جميع التعليمات حول كيفية تجنب AI slop وتدرج
00:11:57الأنماط التي تكشفها فعلياً. والسبب في استخدامنا لـ Hermes مرة أخرى هو المهارات
00:12:02ذاتية التطور. إذا استمررنا في العثور على AI slop في واجهة المستخدم بعد تشغيل المهارة، يمكن للمهارة تحديث نفسها لـ
00:12:07دمج تلك الملاحظات مباشرة وهذا بالضبط سبب إعدادنا لسير العمل هذا على Hermes. لذا طلبنا من
00:12:13Hermes استخدام المهارة والتحقق مما إذا كانت واجهة المستخدم تحتوي على أي من تلك الأنماط. إذا كانت تحتوي، فإنه يصلحها
00:12:18ويطلق Claude Code في وضع غير تفاعلي لتشغيل المهارة والاستمرار في إصلاح ما يجده حتى
00:12:23لا يتبقى شيء لإصلاحه. فائدة أخرى نحصل عليها من Hermes هي أن النموذج الذي يراجع العمل
00:12:28يختلف عن النموذج الذي يبنيه. كنا نستخدم نماذج GPT المعروفة بأنها من بين الأفضل لـ
00:12:33مراجعة الكود، لذا تصبح نماذج Claude هي الباني والوكيل الآخر يصبح المدقق. هذا ما
00:12:38يكمل الحلقة العدائية حيث يتحقق الاثنان من عمل بعضهما البعض. بمجرد تشغيل تلك الحلقة، ولدت
00:12:43واجهة مستخدم أفضل بكثير من المخرجات العامة التي تقدمها نماذج Opus هذه الأيام. وإذا كنت لا تزال تلاحظ أي علامة على AI
00:12:49slop في واجهة المستخدم بعد انتهاء حلقة الوكيل، يمكنك فقط ذكر ذلك وسيقوم بتحديث المهارة لـ
00:12:54أجلك، مما يعزز المدقق الذي لديك بالفعل. لقد قمنا بتحسين هذه المهارة لتطابق أنماط AI slop متعددة
00:12:59التي حددناها نحن وHermes بشكل جماعي. إذا كنت ترغب في استخدام هذه المهارة، يمكنك الحصول عليها من
00:13:04مجتمعنا AI Labs Pro. الرابط سيكون في الوصف. هذا يقودنا إلى نهاية هذا الفيديو.
00:13:09إذا كنت ترغب في دعم القناة ومساعدتنا على الاستمرار في صنع فيديوهات مثل هذه، يمكنك القيام بذلك باستخدام
00:13:14زر الشكر الفائق في الأسفل. كالعادة، شكراً للمشاهدة وأراك في الفيديو القادم.

Key Takeaway

تضاعف هندسة الحلقات كفاءة وكلاء الذكاء الاصطناعي من خلال استبدال الأوامر اليدوية بأنظمة مستقلة تدير عملية التطوير بالكامل عبر حلقات التغذية الراجعة والتصحيح الذاتي.

Highlights

  • تعتمد هندسة الحلقات على تصميم أنظمة مستقلة توجه وكلاء الذكاء الاصطناعي بدلاً من كتابة المطالبة اليدوية التقليدية.

  • تسمح هندسة الحلقات للوكلاء بالعمل لفترات طويلة وتصحيح الأخطاء ذاتياً حتى الوصول إلى الهدف النهائي المحدد.

  • تتكون حلقة العمل الناجحة من 5 خطوات: التحقق من حالة المشروع، اتخاذ قرار بشأن الإجراء التالي، استدعاء الأدوات، جمع الملاحظات، وتقييم الاكتمال.

  • تزيد هندسة الحلقات من كفاءة الوكلاء مثل Hermes بمقدار 10 أضعاف عبر أتمتة مهام المراقبة والتصحيح دون تدخل بشري.

  • تتطلب الحلقات الحتمية تعريفاً واضحاً للاكتمال مثل نجاح الاختبارات البرمجية، بينما تتعامل الحلقات غير الحتمية مع مهام تقديرية مثل تصميم واجهات المستخدم.

Timeline

مفهوم هندسة الحلقات

  • تنتقل هندسة الحلقات بالتركيز من صياغة التعليمات إلى تصميم الأنظمة التي توجه الوكيل ذاتياً.
  • تمثل الحلقة عملية محددة الهدف يقوم فيها الوكيل بتصحيح مساره ذاتياً لتجاوز العقبات.

تتطلب هندسة الحلقات التخلي عن كتابة المطالبة التقليدية والتركيز على تصميم هيكل النظام. كانت هذه العملية سابقاً تتطلب تدخلاً بشرياً مستمراً كحلقة وصل بين الخطوات، ولكن النماذج الحديثة قادرة الآن على إدارة المهام الطويلة والمعقدة بشكل مستقل.

مكونات وأسس بناء الحلقات

  • تتضمن حلقة العمل الناجحة إدارة السياق، جودة الملاحظات، بوابات التحقق، شروط الإنهاء، وإدارة الحالة.
  • تعتمد فعالية النظام على قدرة الوكيل على الوصول إلى المعلومات الضرورية دون أن تُفقد في نافذة السياق.

يعتمد النظام على خمس خطوات أساسية تبدأ بفحص حالة المشروع وتنتهي بتقييم اكتمال المهمة. يجب إدارة السياق بدقة لمنع فقدان التعليمات المهمة عند تراكم مخرجات الأدوات، كما تعد بوابات التحقق ضرورية للحكم على نجاح أو فشل المهام.

تطبيق الحلقات الحتمية وغير الحتمية

  • تستخدم الحلقات الحتمية اختبارات برمجية واضحة كمعيار نهائي للاكتمال وتعمل بشكل ممتاز مع وكيل Hermes.
  • تستخدم الحلقات غير الحتمية للمهام التقديرية وتعتمد على حلقة عدائية بين نماذج مختلفة للمراجعة والتدقيق.

في الحلقات الحتمية، يستخدم الوكيل مهارات ذاتية التطور لإصلاح أخطاء الإنتاج حتى تنجح جميع الاختبارات. أما في الحلقات غير الحتمية مثل تصميم واجهات المستخدم، يتم استخدام نموذج للإنشاء وآخر للتدقيق لضمان جودة المخرجات وتجنب الأنماط المتكررة للذكاء الاصطناعي.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video