أخيراً، حلّت Anthropic مشكلة نافذة السياق بحجم 1 مليون توكن

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00تبدو نافذة السياق بحجم مليون رمز كترقية ضخمة، لكنها في الواقع أسوأ بكثير مما يدركه معظم الناس.
00:00:05وهذا هو بالضبط السبب الذي دفع طارق، المهندس الذي يعمل على Claude Code، لكتابة المقالة.
00:00:09إذا كنت تعتقد أن أداء Claude Code يبدأ في التدهور فقط عند مليون رمز، أو أن المليون مساحة كبيرة لدرجة أنك لا داعي للقلق بشأنها، فأنت مخطئ في ذلك.
00:00:17يبدأ التدهور في الواقع قبل وقت طويل من منتصف النافذة.
00:00:21والحل الذي يلجأ إليه معظم الناس، وهو الضغط، عادةً ما يجعل الأمور أسوأ.
00:00:24بحلول نهاية هذا الفيديو، ستعرف بالضبط كيف تمنع Claude Code من أن يصبح أغبى، بنفس الطريقة التي يتبعها الفريق في Anthropic.
00:00:31يشعر المستخدمون بتدهور أداء Claude على الرغم من أن النماذج نفسها قوية في الواقع.
00:00:35قد تلاحظ أنه يهلوس أكثر، ويحتاج إلى تذكيره مرارًا وتكرارًا بالتعليمات التي قدمتها سابقًا، وينسى تلك التعليمات على المدى الطويل.
00:00:44لاحظنا هذا أيضًا عندما كنا ننفذ مهامًا أطول، وشعرنا بتراجع أداء Claude.
00:00:48لكن هناك سبب كامل وراء ذلك.
00:00:50الآن، جميع النماذج بعد Opus 4.5 تأتي مع نافذة سياق بحجم مليون رمز بدلاً من الـ 200 ألف السابقة.
00:00:56على الرغم من أن هذه الترقية توحي بأن معظم المشكلات التي اعتدنا عليها ستختفي مع نافذة سياق بحجم مليون رمز، إلا أنها تبدو جيدة فقط من الناحية النظرية.
00:01:03لأنه يمكنك الآن احتواء المزيد في نافذة السياق في وقت واحد، وتثبيت النموذج بمزيد من المستندات والمعلومات حتى لا ينحرف Claude عن المهمة التي يحتاج إلى القيام بها.
00:01:12تفتح نافذة السياق بحجم مليون رمز الباب أمام المهام الطويلة دون القلق كثيرًا بشأن مشكلات السياق التي اعتدنا مواجهتها.
00:01:19لكن الحقيقة هي أن كل هذا لم يُحل بالكامل.
00:01:22نافذة السياق بحجم مليون رمز هي في الواقع سلاح ذو حدين.
00:01:26بينما تسمح لـ Claude بالعمل لفترة أطول واحتواء المزيد من المعلومات في وقت واحد، فإن كل ذلك يأتي بتكلفة.
00:01:30إنها تفتح الباب أمام "تعفن السياق".
00:01:32يعني تعفن السياق أن أداء النموذج يتدهور مع وجود المزيد من المعلومات في نافذة السياق الخاصة به، لأنه مع نافذة سياق متضخمة، يكون لديه المزيد من الأشياء التي يجب الانتباه إليها ولا يمكنه البقاء مركزًا.
00:01:42ومع نافذة سياق بحجم مليون رمز، يصبح سياقك أكثر ازدحامًا، مما يعني وجود المزيد من المعلومات التي تتداخل مع تفكير Claude مقارنة بما كان عليه الحال مع نافذة الـ 200 ألف رمز.
00:01:53تعفن السياق ليس شيئًا يحدث فقط عند سياق متضخم للغاية.
00:01:57وفقًا لمبتكر Claude Code، يبدأ تعفن السياق في الحدوث فعليًا عند حوالي 300 إلى 400 ألف رمز، وهو أقل بكثير من المليون، أي عند حوالي 40% فقط من الاستخدام.
00:02:07لذا بغض النظر عن حجم نافذة السياق، نحتاج إلى القيام بأشياء لمنع تعفن السياق.
00:02:11ومعرفة هذا ستغير في الواقع كيفية عملك مع نافذة السياق بحجم مليون رمز.
00:02:15الآن، ملخص سريع.
00:02:16نافذة السياق هي كل ما يراه النموذج في وقت واحد، والذي يتضمن المحادثة حتى الآن، وملف Claude.md، وموجه النظام، والملفات التي تمت قراءتها في الجلسة، وكل مخرجات استدعاء الأدوات.
00:02:26يضيف كل موجه المزيد، وبمجرد أن تمتلئ النافذة، تقوم بالتلخيص للمتابعة بنافذة أكثر حداثة، وهو ما يسمى بالضغط.
00:02:32إذا لم تقم بإدارة السياق بشكل صحيح، فهناك أربع طرق يمكن أن يفشل بها وكيلك.
00:02:37يصبح هذا أكثر وضوحًا وإشكالية في الوكلاء الذين يعملون لفترات طويلة.
00:02:40تلوث السياق هو الأول، والذي ناقشناه بالفعل وهو سبب حدوثه.
00:02:45انجراف الهدف هو الثاني.
00:02:46يحدث هذا عندما ينحرف وكيلك عن ما يحتاج إلى القيام به لأن لديه الكثير من الأشياء للتركيز عليها في الوقت الحالي، أو بعبارات أبسط، لقد نسي الأهداف التي كان من المفترض أن يعمل لتحقيقها.
00:02:55قد يكون هذا قد حدث كثيرًا إذا كنت تعمل مع Claude Code، حيث تريد أن تبدو واجهة المستخدم الخاصة بك بطريقة معينة وقد حددتها بالفعل، لكنه لا يتبع ذلك وتضطر إلى تذكيره بالهدف الفعلي.
00:03:05فساد الذاكرة هو الثالث، ويحدث عندما تصبح الحالة الداخلية للوكيل أو الحقائق المخزنة غير صحيحة أثناء التنفيذ، ويستمر في التصرف بناءً على تلك الحالة الخاطئة.
00:03:14غالبًا ما يكون من الصعب تحديد السبب الدقيق عندما تعمل الوكلاء لفترات طويلة، ويصبح من غير الواضح من أين نشأ الخطأ.
00:03:21على سبيل المثال، يمكن أن يظهر فساد الذاكرة كملف تمت كتابته بطريقة معينة من قبل الوكيل نفسه ثم تعديله بواسطة وكيل فرعي ليس في السياق الحالي.
00:03:29يشير الوكيل مرة أخرى إلى ذاكرته القديمة ويستمر في العمل كما لو أن الملف لا يزال موجودًا بالشكل الذي أنشأه به في الأصل.
00:03:37عدم دقة القرار هو الأخير.
00:03:39يحدث هذا عندما يتخذ الوكيل خيارات متناقضة في مواقف متطابقة تقريبًا، مثل استخدام نمط معالجة أخطاء واحد في مكان ونمط مختلف في مكان آخر.
00:03:48تحدث كل هذه المشكلات عندما لا يتم إدارة السياق بشكل صحيح وهي تؤثر على الأداء طويل المدى للوكلاء.
00:03:53هذه هي بالضبط العوامل التي تحاول معظم أدوات الوكلاء تحسينها.
00:03:57لذا بمجرد أن تطلب من Claude القيام بشيء ما وينتهي، هناك في الواقع خمسة خيارات محتملة لما يحدث بعد ذلك فيما يتعلق بتعليماتك التالية.
00:04:06يعتمد كل منها على ما هو موجهك التالي.
00:04:08إذا استخدمت كل منها بشكل صحيح، فإن الطريقة التي تعمل بها مع Claude يمكن أن تتحسن كثيرًا.
00:04:12على الرغم من أن الخيار الأكثر طبيعية هو مجرد الاستمرار، إلا أن الخيارات الأخرى تساعدك بالفعل على إدارة سياقك بشكل أكثر فعالية.
00:04:18لذا تحتاج إلى أن تقرر بعناية ما إذا كنت تريد حقًا الاستمرار في نفس التدفق أو بدء جلسة جديدة.
00:04:24بمجرد أن يصبح السياق متضخمًا، لديك طريقتان للتخلص من السياق والخيار الأول هو الضغط، والذي شرحناه بالفعل كتلكيم للمحتوى الحالي.
00:04:32لكن عليك أن تكون واضحًا بشأن متى تريد حقًا التلخيص لأن الملخص يفقد الكثير من التفاصيل التي قد تبدو مهمة لك ولكن ليست مهمة لـ Claude ويمكن إسقاطها.
00:04:41ونتيجة لذلك، قد لا يعود السياق المهم موجودًا في نافذة السياق.
00:04:44من الأفضل التحكم في الضغط بنفسك بدلاً من السماح لـ Claude بالقيام بالضغط التلقائي لأنه عندما يتم تشغيله في منتصف المهمة، يصبح الضغط أكثر فوضوية.
00:04:52إنه يميل إلى الاحتفاظ بما يعتقد أنه مهم ويزيل كل ما لا يعتقد أنه سيكون ضروريًا، لذا فإن Claude هو الأقل موثوقية أثناء الضغط.
00:05:00في تلك المرحلة، ينصب تركيز Claude بالكامل على التلخيص ويتم تجريده من السياق الداعم مثل موجه النظام والعناصر الأخرى التي تجعله أكثر قدرة بشكل طبيعي.
00:05:08ثم يعتمد بشكل كبير على افتراضاته الخاصة حول ما هو مهم، وهو ما يمكن أن يؤدي غالبًا إلى قرارات ضغط سيئة.
00:05:14يحدث الضغط السيئ عادةً عندما لا يتمكن النموذج من تحديد اتجاه عملك بوضوح.
00:05:19على سبيل المثال، إذا كنت في جلسة تصحيح أخطاء طويلة وكان هناك تحذير تمت مواجهته سابقًا بعد الضغط التلقائي، إذا طلبت منه إصلاح ذلك التحذير المحدد، فلن يعرف ما هو التحذير الذي تتحدث عنه.
00:05:29يحدث هذا لأن الجلسة كانت تركز على تصحيح الأخطاء ككل، لذا تم الاحتفاظ بملخص عام لنشاط تصحيح الأخطاء فقط وتم التعامل مع التحذير المحدد كضوضاء وإسقاطه.
00:05:39تحيز الحداثة يجعل الأمور أسوأ.
00:05:41عندما يتم تشغيل الضغط، يعطي الموجه الأولوية للحفاظ على التفاصيل الأخيرة لما كان يتم العمل عليه.
00:05:46لذا قد يتم تجاهل المعلومات القديمة ولكن المهمة أو تركها خارجًا.
00:05:50إذا تم القيام بشيء ما بشكل غير صحيح في وقت سابق، فقد لا يعود النموذج على دراية به بعد الضغط.
00:05:54إنه يمتلك فقط إمكانية الوصول إلى ملخص مستوى النص، وليس الحالة الكاملة للمشروع، لأن سجل استدعاء الأدوات لا يتم حفظه بالكامل أثناء الضغط.
00:06:01يمكنك تعيين علامات للتحكم في وقت حدوث الضغط التلقائي، ولكن هذا شيء يجب عليك إدارته بنشاط في كثير من الأحيان.
00:06:07قم بتشغيل الضغط حول نطاق 300,000 إلى 400,000 الذي ذكره المبتكر، لأن هذا هو عادةً حيث يبدأ تعفن السياق في الظهور، وقم دائمًا بتوفير تعليمات ضغط بنفسك، لأن Claude يستجيب بحذر أكبر عند تضمين تعليمات صريحة.
00:06:22أخبره بالقرارات والقيود والمشكلات المكتشفة التي يجب نقلها حتى يعرف ما يجب إعطاؤه الأولوية.
00:06:27لذا يجب أن تضغط عندما تريد حقًا أن ينتقل السياق من تدفق المهمة السابقة إلى النافذة الجديدة، وليس عندما تريد بداية جديدة.
00:06:34ولكن قبل أن نمضي قدمًا، دعونا نستمع إلى كلمة من الراعي.
00:06:37Verdant، منصة مدعومة بالذكاء الاصطناعي تساعد البناة على تحويل الأفكار إلى منتجات قابلة للشحن.
00:06:41أنت في منتصف البناء، أخيرًا في المنطقة، وتنفد أرصدتك.
00:06:45يتوقف ذكاؤك الاصطناعي تمامًا، ويفقد الزخم.
00:06:47كل أداة برمجة ذكاء اصطناعي تفعل هذا بك، لكن Verdant لا تفعل.
00:06:50عندما تصل أرصدتك إلى الصفر، فقط قم بالتبديل إلى الوضع الاقتصادي، وهو وضع بدون تكلفة يحافظ على عمل ذكائك الاصطناعي دون إنفاق دولار آخر.
00:06:56لا انقطاع، لا تعبئة، لا فقدان للزخم.
00:06:59أنت فقط تستمر في البناء.
00:07:00وعندما يكون لديك أرصدة، فأنت لست عالقًا في الاختيار بين Claude أو GPT أو Gemini.
00:07:04يعمل وضع الخطط المتعددة في Verdant على تشغيل الثلاثة معًا كلجنة اتخاذ قرار، مما يمنحك خططًا أفضل دون قلق بشأن النموذج.
00:07:10هل تريد المزيد من المرونة؟
00:07:11يتيح لك BYOK توصيل مفتاح API الخاص بك مباشرة بـ Verdant.
00:07:15استخدم أرصدة Claude أو GPT الخاصة بشركتك، بدون رسوم منصة.
00:07:18أنت فقط تدفع مقابل ما تستخدمه بالفعل.
00:07:20تحصل على 100 رصيد و 7 أيام لاختباره.
00:07:23انقر فوق الرابط في التعليق المثبت وجرب Verdant مجانًا.
00:07:26الخيار الثاني هو استخدام أمر المسح، والذي يزيل كل السياق ويبدأ جلسة جديدة بسياق فارغ.
00:07:32على عكس الضغط، لا يتم نقل أي شيء، ويبقى فقط ما تقدمه، مرة أخرى، في نافذة السياق.
00:07:37تمامًا مثل الضغط، لا يجب عليك استخدام المسح فقط عندما ينفد منك السياق.
00:07:41إذا كنت تنتقل إلى مهمة غير ذات صلة، فمن السهل مسح الجلسة والبدء من جديد، بحيث لا تتداخل المهمة السابقة مع المهمة الجديدة.
00:07:49على سبيل المثال، إذا طلبت من الوكيل كتابة حالات اختبار لتطبيق تعمل عليه، فقد لا تريده أن يحتفظ بتفاصيل حول كيفية إنشاء حالات الاختبار هذه.
00:07:57بدلاً من الاستمرار في تصحيح الأخطاء ضمن نفس السياق، يمكنك بدء جلسة جديدة.
00:08:01بهذه الطريقة يمكن لـ Claude العمل على تصحيح أخطاء تطبيقك بشكل أكثر فعالية دون أن يتأثر بكيفية إنشائه لحالات الاختبار مسبقًا.
00:08:08الآن هناك نهج آخر يمكنك استخدامه وهو الجمع بين المسح والضغط.
00:08:12يسمح لك هذا بالاحتفاظ فقط بما تريده والتخلص من كل شيء آخر.
00:08:16الفكرة هي استخدام تنسيق JSON منظم يلتقط المعلومات التي تريد الاحتفاظ بها.
00:08:21يمكنك إنشاء أمر مخصص حتى تتمكن من إعادة استخدامه بشكل متكرر.
00:08:24في هذا الأمر، يمكنك تضمين هيكل JSON يحتوي على المهمة الكاملة، والحالة الحالية، والقيود، والمشكلات المكتشفة، وأي تفاصيل أخرى ذات صلة تريد أن يحتفظ بها Claude، ثم أمره بحفظ هذا في ملف.
00:08:35يسمح لك هذا النهج بالحصول على أفضل ما في كلتا الطريقتين.
00:08:38بمجرد تشغيل الأمر، سيقوم بتحليل المحادثة بأكملها والحالة الحالية للتطبيق، وهو أمر لا يحفظه الضغط العادي بشكل موثوق، وحفظ كل شيء في الملف كما هو محدد.
00:08:48المخطط أكثر صرامة من النثر، لذا عندما يتبع Claude بنية محددة، يمكنه تمثيل ما هو مهم بشكل أكثر اتساقًا ودقة.
00:08:56بعد حفظ المعلومات في الملف، يمكنك استخدام أمر المسح بأمان لإزالة كل شيء من نافذة السياق.
00:09:02ثم يمكنك بدء جلسة جديدة وتوجيه Claude للرجوع إلى ذلك المستند لجمع السياق وتنفيذ المهمة التالية من هناك.
00:09:14كما ذُكر سابقًا، مع نمو السياق، يمكن أن ينحرف تركيز الوكيل لأن هناك ببساطة المزيد من المعلومات التي تتنافس على الانتباه وهذا أكثر وضوحًا مع نافذة السياق بحجم مليون رمز.
00:09:23تساعد هذه الممارسة في معالجة كل من مشكلة انجراف الهدف ومشكلات عدم اتساق القرار التي ناقشناها سابقًا.
00:09:29بدلاً من الدفع باستمرار للأمام في مهمة طويلة الأمد، من المفيد التوقف مؤقتًا بشكل دوري وطلب من الوكيل تلخيص ما فعله حتى الآن، جنبًا إلى جنب مع القيود والعوامل المهمة الأخرى.
00:09:39عندما تقوم بذلك، فإنه يعزز الأهداف الأصلية ويعيد التفاصيل الرئيسية إلى الجزء الأحدث من نافذة السياق، بدلاً من تركها مدفونة في أقسام أقدم.
00:09:48يساعد هذا في ضمان بقاء المعلومات المهمة جديدة في السياق العملي للوكيل ومن غير المرجح أن تضيع أثناء الضغط أو تتخفف بمرور الوقت،
00:09:56لذا يظل الوكيل أكثر توافقًا مع المهمة التي من المفترض أن يؤديها ويحافظ على اتساق أفضل في قراراته.
00:10:02أيضًا، إذا كنت تستمتع بمحتوانا، فكر في الضغط على زر الإعجاب، لأنه يساعدنا على إنشاء المزيد من المحتوى مثل هذا والوصول إلى المزيد من الأشخاص.
00:10:09قد لا تبدو الوكلاء الفرعيون كثيرًا، لكنهم في الواقع طريقة مهمة جدًا لإدارة السياق.
00:10:14كل وكيل فرعي هو مثيله المستقل، مع نافذة سياق مخصصة، ووصول كامل للأدوات، والأذونات التي يحتاجها لإكمال مهمته.
00:10:22ينفذون العمل المعين في ذلك السياق المنفصل الذي يوفره الوكيل الرئيسي ثم يعيدون فقط المخرجات النهائية إلى السياق الرئيسي.
00:10:30لذا فإن جميع استدعاءات الأدوات التي أجراها، والملفات التي قرأها، وعمليات البحث على الويب التي نفذها، والمنطق الوسيط تبقى داخل سياق الوكيل الفرعي الخاص ولا تلوث نافذة سياق الوكيل الرئيسي.
00:10:40هذه طريقة فعالة لتقليل تعفن السياق. مهام البحث هي أوضح مثال.
00:10:45يمر الوكيل عبر مواقع ويب وصفحات ومصادر متعددة، ولا تريد إضافة كل تلك المعلومات الخام باستمرار إلى نافذة السياق الرئيسية.
00:10:53في مثل هذه الحالات، يمكن للوكيل الفرعي التعامل مع العمل بشكل مستقل وإعادة التوليف النهائي فقط.
00:10:58السؤال الرئيسي الذي يجب أن تطرحه على نفسك قبل استخدام وكيل فرعي هو ما إذا كنت ستحتاج إلى الوصول إلى الخطوات الوسيطة مرة أخرى، أو ما إذا كنت تهتم فقط بالمخرجات النهائية.
00:11:07يدير ClodCode أيضًا تنظيم الوكلاء الفرعيين بمفرده ويمكنه إنشاء وكلاء للتعامل مع المهام تلقائيًا.
00:11:13لكن في بعض الأحيان تحتاج إلى تحديد صريح في موجهك أنك تريد تفويض العمل إلى وكيل فرعي حتى يتم التعامل معه في عزلة.
00:11:20لذا إذا كنت تعمل على مهام بحث، أو مهام إعادة هيكلة، أو تلخيص، أو إنشاء مستندات، فيجب أن تفكر في فصلها باستخدام وكلاء فرعيين بدلاً من وكيلك الرئيسي.
00:11:30أخيرًا وليس آخرًا، الترجيع مهم حقًا مقارنة بالتصحيح ببساطة لأنه يزيل الأجزاء غير ذات الصلة أو غير الصحيحة من نافذة السياق مع الاحتفاظ فقط بالحالة الصحيحة.
00:11:40كلما واجه Clod خطأً، يحاول الناس غالبًا إعادة توجيهه لاتخاذ نهج آخر.
00:11:44لكن الخيار الأفضل هو الترجيع بدلاً من ذلك ثم تقديم التوجيه الصحيح في الموجه الجديد.
00:11:49يمكنك استخدام أمر الترجيع أو الضغط على مفتاح الهروب مرتين للقيام بذلك.
00:11:53بعد الترجيع، يمكنك أيضًا التلخيص من تلك النقطة بحيث يتم الحفاظ على المحادثة حتى تلك المرحلة كسياق مفيد مع إزالة الأجزاء التي أدت إلى المشكلة.
00:12:01للترجيع فوائد متعددة.
00:12:03أولاً، ينظف نافذة السياق عن طريق إزالة الجزء الذي سارت فيه الأمور بشكل خاطئ، مما يؤدي إلى ملخص ضغط أنظف يحافظ فقط على التنفيذات الصحيحة.
00:12:12حتى إذا قمت بتثبيت معلومات مهمة، فإنك تتجنب نقل الأقسام التي انحرف فيها الوكيل عن الهدف، مما يساعد في تقليل كل من عدم اتساق القرار وانجراف الهدف.
00:12:21إذا كنت تستخدم وكلاء فرعيين، فإن الترجيع يضمن حصولهم على سياق أنظف وأكثر دقة عند تسليم المهام، بحيث لا يتم تضمين الأساليب غير الصحيحة في حالتهم العملية.
00:12:30وبالمثل، إذا استخدمت أمر التسليم، فإنه يلتقط الحالة الصحيحة للتطبيق بدلاً من حالة تالفة أو قديمة.
00:12:37لذا ابدأ عادة الترجيع بدلاً من التصحيح المتكرر للأمام حتى يعمل الوكيل باستمرار من حالة نظيفة ودقيقة طوال الجلسة.
00:12:45هذا يوصلنا إلى نهاية هذا الفيديو.
00:12:47إذا كنت ترغب في دعم القناة ومساعدتنا في الاستمرار في صنع مقاطع فيديو كهذه، يمكنك القيام بذلك باستخدام زر الشكر الفائق أدناه.
00:12:54كما هو الحال دائمًا، شكرًا لك على المشاهدة وأراك في الفيديو القادم.

Key Takeaway

تتطلب إدارة نافذة السياق بحجم مليون رمز تدخلاً نشطاً باستخدام الترجيع، والوكلاء الفرعيين، والضغط الموجه يدويًا لمنع تدهور الأداء الناتج عن تعفن السياق.

Highlights

يبدأ تدهور أداء النماذج، المعروف بتعفن السياق، عند وصول النافذة إلى 300 ألف إلى 400 ألف رمز، وهو ما يعادل 40% من السعة الكلية البالغة مليون رمز.

تؤدي عمليات الضغط التلقائي التي تقوم بها النماذج إلى فقدان تفاصيل حيوية، حيث تعتمد على افتراضات النموذج الخاصة بدلاً من توجيهات المستخدم المحددة.

يؤدي استخدام الوكلاء الفرعيين إلى عزل مهام مثل البحث على الويب عن السياق الرئيسي، مما يقلل من تلوث نافذة السياق بالمعلومات الخام.

يضمن استخدام تنسيق JSON منظم لالتقاط الحالة الراهنة للتطبيق دقة أعلى عند نقل السياق بين الجلسات مقارنة بالتلخيص النصي التقليدي.

استبدال محاولات التصحيح المتكررة بعملية الترجيع يزيل المسارات غير الصحيحة ويحافظ على نظافة الحالة العملية للنموذج.

Timeline

ظاهرة تعفن السياق وأسباب فشل الوكلاء

  • يحدث تعفن السياق عندما تزدحم نافذة السياق بمعلومات متداخلة تشتت تركيز النموذج.
  • يبدأ الأداء في التراجع الفعلي عند استهلاك 40% فقط من نافذة المليون رمز.

تُوهم نافذة السياق الكبيرة المستخدمين بالقدرة على إدخال كميات هائلة من البيانات، لكنها تفتح الباب لمشكلات مثل انجراف الهدف، فساد الذاكرة، وعدم دقة القرار. يظهر هذا التدهور كفقدان للتعليمات السابقة أو هلاوس معرفية نتيجة زيادة الحمل الإدراكي للنموذج.

إدارة السياق: الضغط والمسح

  • الضغط التلقائي غير موثوق لأنه يميل إلى حذف معلومات يراها النموذج ثانوية وهي ضرورية للمهمة.
  • يؤدي أمر المسح إلى البدء بجلسة فارغة، وهو الحل الأمثل عند الانتقال بين مهام غير مرتبطة.

يفضل التحكم في عملية الضغط يدويًا عند الوصول إلى نطاق 300-400 ألف رمز بدلاً من تركه للنموذج. يجب على المستخدم تزويد النموذج بتعليمات صريحة حول ما يجب الاحتفاظ به من قيود وقرارات، لأن الضغط التلقائي يعاني من تحيز الحداثة الذي يضحي بالمعلومات القديمة.

استراتيجيات الحفاظ على دقة الأداء

  • استخدام هيكل JSON منظم لالتقاط حالة المهمة يضمن ثبات السياق عند الانتقال بين الجلسات.
  • يفصل الوكلاء الفرعيون المهام المستقلة عن السياق الرئيسي لتقليل التشويش.
  • يعتبر الترجيع ممارسة أساسية لإزالة الأجزاء التي أدت إلى خطأ بدلاً من الاستمرار في التصحيح للأمام.

تعمل المنهجيات الهيكلية مثل JSON على جعل السياق المنقول أكثر صرامة وأقل عرضة للفقدان. كما أن الاعتماد على الترجيع عوضاً عن محاولات التصحيح المتكررة يضمن عمل الوكيل دائماً انطلاقاً من حالة نظيفة وصحيحة، مما يرفع من جودة القرارات النهائية.

Community Posts

View all posts