Log in to leave a comment
No posts yet
تعد ملفات ماركداون التي يتم جلبها من الويب كتلة من الضجيج مثل الإعلانات وأشرطة القوائم. وجود هذه النصوص المختلطة يقلل بشكل ملحوظ من أداء RAG (توليد الاسترجاع المعزز). في الواقع، البيانات غير المنقحة تشتت انتباه النموذج، بينما تعمل ملفات ماركداون المنظمة بدقة على تحسين دقة البحث. من خلال التخلص من النصوص غير الضرورية، يمكنك تقليل عدد التوكنز (Tokens) التي يستهلكها نموذج LLM المحلي بنسبة تزيد عن 30%، مما يوفر عليك التكاليف.
يجب عليك استخدام مكتبة BeautifulSoup في بايثون لإزالة هذا الضجيج.
pip install beautifulsoup4 lxml في التيرمينال.decompose() لحذف فئات CSS غير الضرورية مثل .ad-container أو .nav-menu بالكامل.lxml لاستخراج نص الموضوع فقط وحفظه بتنسيق ماركداون ووضعه في مستودع أوبسيديان (Obsidian Vault).عندما يتضخم عدد الملفات إلى المئات، يفقد حتى أذكى النماذج سياق الموضوع. لا تكتفِ بتكديس الملفات، بل قم بتقسيم المناطق بناءً على حالة المعلومات. أنا أستخدم هيكلًا مكونًا من 3 مراحل (01_Raw_Inbox، 02_Processed_Wiki، 03_Project_Action) كتعديل لإطار عمل PARA. هذا يوفر لـ Claude Code إرشادات مادية حول المعلومات التي يجب الوثوق بها والرجوع إليها.
استخدم أسماء الملفات وخيارات التيرمينال لضمان عدم تيه العميل البرمجي (Agent).
YYYY-MM-DD قبل جميع أسماء الملفات لتعريف النموذج بمدى حداثة المعلومة.--newer-than لجعله يقرأ فقط الملفات التي تغيرت خلال آخر 24 ساعة.03_Project_Action ابقِ فقط الملفات التي تحتوي على حالة العمل.البحث النصي البسيط لا يمكنه التمييز بين ما إذا كان هذا المستند "مهمًا" أو "عملاً منتهيًا". لذلك، يجب وضع YAML Frontmatter في الجزء العلوي من المستند. بوجود البيانات الوصفية، يمكنك إعطاء أوامر أكثر دقة لـ Claude Code.
ثلاثة حقول كافية لمحرك عمل رواد الأعمال المعرفيين:
topic لتقسيم المواضيع، و source_importance لتحديد الأهمية، و status لحالة العمل في الجزء العلوي من الملاحظة.تظهر القوة الحقيقية لـ Claude Code القائم على التيرمينال عندما يلتقي مع سكريبتات الشيل (Shell Scripts). بمجرد إدخال أمر واحد عند وصولك للعمل، يكتمل المحرك الذي يحلل ما درسته بالأمس ويستخرج حتى مسودة البريد الإلكتروني الذي سترسله اليوم. لا داعي لهدر الطاقة في التفكير فيما يجب فعله أولاً كل صباح.
يتم إعداد روتين الأتمتة كما يلي:
.sh أو .bat) يحتوي على أمر claude --bare لزيادة سرعة التشغيل الأولية.find -mtime -1 في السكريبت لتمرير الملاحظات التي تم إنشاؤها خلال اليوم الأخير فقط إلى Claude.عندما يتجاوز عدد الملفات الألف، ستمتلئ نافذة السياق التي تبلغ 200 ألف توكن بسرعة. من هذه النقطة، يجب استخدام أسلوب ذو مرحلتين بجعل النموذج يطلع أولاً على master_index.md الذي يعمل كخريطة شاملة، بدلاً من جعله يقرأ كل الملفات. هذا الأسلوب يقلل عدد استدعاءات واجهة برمجة التطبيقات (API) بنسبة تقارب 60%.
للحفاظ على الأداء، يجب إدارة السياق بذكاء:
/compact لتلخيص السجل.