Log in to leave a comment
No posts yet
في عام 2026 الحالي، تجاوزت نقطة الصراع في تكنولوجيا الذكاء الاصطناعي نطاق بارامترات النماذج. نحن الآن في عصر بنية التحكم، أو ما يسمى Harness، لتحويل محركات الاستدلال القوية المعروفة بنماذج اللغة الكبيرة (LLM) إلى قيمة تجارية حقيقية. إذا كانت هندسة المطالبات (Prompt Engineering) في الماضي عبارة عن مستوى لاختبار إمكانيات استجابة النموذج، فإن هندسة الـ Harness هي تخصص تصميمي رفيع المستوى لإدارة مخرجات النماذج غير الحتمية بشكل يمكن التنبؤ به داخل أنظمة البرمجيات الحتمية.
في الواقع، في النصف الثاني من عام 2025، أثبت فريق Codex في OpenAI قوة بنية الـ Harness من خلال بناء أكثر من مليون سطر من الأكواد باستخدام أنظمة الوكيل (Agent Systems) فقط دون تدخل بشري مباشر. بعيداً عن مجرد الإرشادات البسيطة، يتناول هذا المقال بعمق استراتيجيات الاستمرارية والأمن وتحسين التكلفة التي يجب على كبار المهندسين المعماريين (Senior Architects) بناؤها عند إدخال الوكلاء المستقلين في الخدمات التجارية.
بينما اقترحت الأدلة المبكرة إدارة الحالة بناءً على الملفات مع التركيز على قابلية القراءة، فإن البيئات الموزعة واسعة النطاق تصطدم بحواجز مثل التحكم في التزامن وغياب معاملات ACID. يجب أن تستخدم بنية الـ Harness الحديثة نظام الملفات كواجهة، ولكن مع وضع تقنيات قواعد بيانات قوية في البنية التحتية الأساسية.
يعمل نموذج الذاكرة الهرمية المقترح في مجموعة تطوير الوكيل (ADK) من Google على تعظيم الكفاءة من خلال تقسيم المعلومات وإدارتها في أربع طبقات:
الاتجاه السائد في عام 2026 هو توسيع PostgreSQL مثل Tiger Data لدمج البيانات المتجهة وال관계ية والسلاسل الزمنية في محرك واحد. توفر هذه البنية المؤشرات التالية:
منح الوكيل حق الوصول الكامل إلى الكمبيوتر يعد أمراً ثورياً، ولكن إذا تعرض لهجمات حقن المطالبات غير المباشرة (Indirect Prompt Injection)، فقد يؤدي ذلك إلى تدمير النظام. تتطلب معايير الأمن في عام 2026 عزلاً على مستوى الأجهزة يتجاوز حاويات Docker العادية.
أكثر تقنيتين موثوقتين في الصناعة حالياً هما Firecracker و gVisor. تخصص Firecracker MicroVMs نواة Linux مخصصة لكل وكيل، وتدعم بيئة عالية الكثافة مع سرعة تمهيد تبلغ 125 مللي ثانية وعبء ذاكرة يقل عن 5 ميجابايت.
بقدر أهمية العزل المادي، يأتي العزل المنطقي من خلال وكيل السياسة المفتوحة (OPA). استخدم لغة Rego لفرض سياسات مثل:
إذا وقع الوكيل في حلقة لانهائية بسبب تعليمات غامضة، فقد يتسبب ذلك في تكاليف واجهة برمجة تطبيقات (API) تصل إلى آلاف الدولارات في دقائق معدودة. يجب تضمين منطق تحكم حتمي في الـ Harness لمنع ذلك.
تماماً كما تتوقف AWS Lambda تلقائياً عند استدعائها 16 مرة متتالية، يحتاج نظام الوكيل إلى استراتيجية كشف دقيقة. عندما لا يكون التغيير في المخرجات بين الخطوة السابقة والحالية ذا قيمة، يجب اعتباره حلقة وإيقاف التنفيذ فوراً. كما يجب فرض قيود صارمة ليس فقط على الميزانية الإجمالية، ولكن أيضاً على الحد الأقصى لعدد التوكينات لكل إجراء وعدد محاولات إعادة التشغيل.
اعتباراً من منتصف عام 2025، تجاوز استخدام التوكينات عالمياً 100 تريليون توكين. يمكن للـ Harness تقليل عدد استدعاءات API بنسبة تصل إلى 69% من خلال التخزين المؤقت الدلالي (Semantic Caching) لإعادة استخدام النتائج الحالية للأسئلة المتشابهة دلالياً. بالإضافة إلى ذلك، استفد من التخزين المؤقت للبادئة (Prefix Caching) في ADK من Google لتحسين التحميل المتكرر للسياق.
للتخلص من فخ الاستقلالية الكاملة، من الضروري دمج سير عمل الموافقة غير المتزامنة الذي يتطلب موافقة بشرية للعمليات عالية المخاطر مثل معالجة المدفوعات أو نشر العمليات.
لمنع حوادث التنفيذ المتكرر، يجب منح مفتاح العودية (Idempotency Key) لكل استدعاء للأدوات. إن ضمان إنشاء سجل واحد فقط في قاعدة البيانات حتى لو أصدر الوكيل أمر إنشاء الحساب عدة مرات هو جوهر موثوقية النظام.
قدمت دراسة مشهد الأفكار (Landscape of Thoughts - LoT) المنشورة في ICML 2025 أدوات لتصور مسار استدلال الوكيل لالتقاط ظاهرة الانجراف الدلالي. قم ببناء حزمة تتبع التكلفة لكل نتيجة ناجحة من خلال ربط منصات مثل LangSmith أو Langfuse مع معايير OpenTelemetry.
القيمة الحقيقية للذكاء الاصطناعي المستقل لا تأتي من الإجابات البراقة للنموذج، بل من متانة بنية الـ Harness التي تدعمه. كمهندس معماري خبير، تأكد من فحص النقاط التالية عند بناء النظام:
حذرت مؤسسة Gartner من أن 40% من مشاريع الوكلاء ستتوقف بحلول عام 2027 بسبب غياب العائد على الاستثمار (ROI). بدلاً من بناء نظام على رمال المطالبات المتحركة، ضع وكلاءك فوق Harness مثبت الأمان والكفاءة للهروب من جحيم التجارب الأولية (Pilot Hell).