Claude Code + LightRAG = قوة لا تُقهر

CChase AI
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00لقد قيل الكثير عن نهاية تقنية RAG، ولكن كان ذلك مبالغاً فيه بشكل كبير.
00:00:03نعم، أعلم أن النماذج اللغوية الكبيرة مثل Opus 4.6
00:00:05قد أصبحت أفضل بكثير مؤخراً في التعامل مع السياقات الضخمة.
00:00:09ولكن إذا كنت تعتقد أن هذا يعني أنك لن تحتاج أبداً إلى RAG،
00:00:12فإنك ستصطدم بجدار
00:00:14لا يمكنك تجاوزه بمجرد كتابة الأوامر.
00:00:16لذا سأشرح لكم اليوم متى تحتاجون لتقنية RAG،
00:00:19وما هو نوع RAG الذي يعمل حقاً في عام 2026
00:00:22لأن المشهد قد تغير تماماً خلال العام الماضي،
00:00:25وسأريكم كيفية ربط Cloud Code
00:00:28بنظام RAG الخاص بكم،
00:00:30بالإضافة إلى تزويدكم ببعض المهارات التي ستفيدكم.
00:00:32هدفنا اليوم هو بناء هذا،
00:00:35نظام Graph RAG مبني على أساس Light RAG
00:00:38الذي يمكننا استخدامه مع Cloud Code.
00:00:40والأهم من ذلك، سيوفر لنا هذا نظاماً
00:00:43يمكننا استخدامه عندما نحتاج لتوظيف الذكاء الاصطناعي
00:00:45مع مجموعات ضخمة جداً من المستندات، أليس كذلك؟
00:00:49ليس مجرد خمسة أو عشرة مستندات
00:00:51كما سترون في العرض التوضيحي،
00:00:52بل 500 أو 1,000 مستند،
00:00:55لأنه لا يكفي مجرد الاعتماد
00:00:57على نافذة السياق التي يأتي بها Cloud Code،
00:00:59أو أي نموذج لغوي آخر.
00:01:01لأنه عندما تبدأ في التعامل مع أحجام هائلة،
00:01:03وهو ما نراه في الكثير من الشركات الكبرى
00:01:05أو حتى الشركات الأصغر،
00:01:06فإن امتلاك نظام RAG كهذا هو في الواقع أرخص وأسرع
00:01:10من عمليات البحث الوكيلية التقليدية.
00:01:12مع وضع ذلك في الاعتبار،
00:01:13فإن امتلاك مهارة إنشاء
00:01:14هذه الأنواع من أنظمة RAG أمر مهم للغاية،
00:01:16ولكن لحسن الحظ، الأمر بسيط للغاية.
00:01:18وكما أشرت للتو،
00:01:19سنستخدم Light RAG اليوم.
00:01:21هذا مستودع مفتوح المصدر أحبه تماماً.
00:01:25لقد ظهر منذ فترة،
00:01:26وهو شيء تم تحديثه مراراً وتكراراً.
00:01:28إنه قادر على منافسة أنظمة
00:01:30Graph RAG الأكثر تعقيداً مثل الخاصة بمايكروسوفت
00:01:32بنسبة ضئيلة جداً من التكلفة.
00:01:35لذا فهو المكان المثالي لاختبار
00:01:37مفاهيم Graph RAG إذا لم تستخدمها من قبل.
00:01:40ولكن لكي نحقق أقصى استفادة من Light RAG،
00:01:43علينا فهم كيفية عمل RAG في مستواه الأساسي،
00:01:46لأن مشهد RAG قد تغير.
00:01:48ما كنا نفعله في نهاية 2024 وبداية 2025
00:01:51كان يسمى RAG البسيط (Naive RAG)، وهو المستوى الأساسي.
00:01:54هل تتذكرون كل تلك الأتمتة التي كانت تقول،
00:01:56هيا لنذهب إلى Pinecone وSuperbase.
00:01:58كان ذلك هو RAG البسيط.
00:02:00هذا لم يعد يعمل الآن.
00:02:02هذا لم يعد كافياً.
00:02:03علينا استخدام نسخ أكثر تطوراً من RAG،
00:02:06ولكننا بحاجة لفهم الأساسيات أولاً.
00:02:08لذا دعونا نقوم بمراجعة سريعة لما هو RAG
00:02:12وكيف يعمل قبل أن نتعمق في إعداد Light RAG.
00:02:14إذاً RAG، هو التوليد المعزز بالاسترجاع.
00:02:18طريقة عمله تبدأ أولاً
00:02:20بنوع من المستندات، حسناً؟
00:02:22وسيكون لديك الآلاف منها
00:02:25في نظام RAG قوي جداً.
00:02:27ولكن ما يحدث هو أن لدي هذا المستند
00:02:29الذي أريد إدخاله في نظام RAG الخاص بي،
00:02:31داخل قاعدة بيانات متجهة (Vector Database).
00:02:34حسناً، ما يحدث ليس أن المستند
00:02:38يتم إلقاؤه ببساطة في هذه القاعدة،
00:02:40وكأنه مجرد نظام Google Drive.
00:02:41بل يمر المستند عبر نموذج تضمين (Embedding Model)
00:02:44ثم يتم تحويله إلى متجه (Vector).
00:02:46ولكن أكثر من ذلك،
00:02:47المستند لا يدخل كقطعة واحدة ضخمة.
00:02:50بل يتم تقسيمه إلى أجزاء (Chunks).
00:02:51تخيل أن لدينا هذا المستند المكون من صفحة واحدة
00:02:54ويتم تقسيمه إلى الجزء الأول، والثاني، والثالث.
00:02:59كل جزء من هذه الأجزاء يصبح متجهاً،
00:03:03وهو مجرد نقطة على رسم بياني،
00:03:05نقطة في قاعدة بيانات متجهة.
00:03:06نموذج التضمين هو المسؤول عن هذا التقسيم.
00:03:09هو المسؤول عن أخذ هذا المستند،
00:03:11وفهم محتواه،
00:03:13ثم تحويله إلى نقطة على هذا الرسم البياني.
00:03:16إذاً يتم تقسيم المستند،
00:03:18ويمر عبر نموذج التضمين،
00:03:20ثم يصبح مستندنا متجهاً على هذا الرسم.
00:03:24هذا رسم بياني ثلاثي الأبعاد.
00:03:27في الواقع، هو يتكون من آلاف الأبعاد،
00:03:30لكن اعتبره ثلاثي الأبعاد فقط للتبسيط الآن.
00:03:33الآن، تخيل أن هذا المستند كان عن السفن الحربية.
00:03:36حسناً، وكل متجه تحول إلى نوع من الأجزاء
00:03:39عن السفن الحربية.
00:03:40حسناً، أين سيذهب؟
00:03:41سيوضع هنا بجانب القوارب والسفن،
00:03:43بالتأكيد، وسيصبح متجهاً خاصاً به.
00:03:45وبكلمة متجه، أعني،
00:03:46أنه يُعطى سلسلة من الأرقام التي تمثله.
00:03:50يمكنكم رؤية ذلك هنا مع الموز.
00:03:53فالموز هو 0.52، 5.12، 9.31، وهكذا.
00:03:57يستمر هذا لآلاف الأرقام.
00:04:00لذا قاربنا الصغير هنا سيكون مثل واحد، اثنان، ثلاثة،
00:04:05إلى ما لا نهاية.
00:04:07الأمر بسيط.
00:04:08بالطبع لن يكون بجانب الموز والتفاح،
00:04:10ولكن هذه هي عملية تحويل المستند إلى تضمين،
00:04:14وكذلك عملية التقسيم.
00:04:15الآن، لنفترض أنك هنا، حسناً؟
00:04:18أنت هذا الشخص السعيد هنا،
00:04:20وسألت النموذج اللغوي الكبير
00:04:21سؤالاً عن السفن الحربية.
00:04:24حسناً، هذا السؤال في نظام RAG هذا
00:04:27سيتم تحويله أيضاً إلى متجه.
00:04:30لذا سؤالك، كما تعلم، ينظر إليه النموذج،
00:04:34ويخصص له سلسلة من الأرقام
00:04:35التي تتوافق أيضاً مع نوع من المتجهات
00:04:38في هذه القاعدة، حسناً؟
00:04:41وما سيفعله هو مقارنة
00:04:43متجه سؤالك
00:04:45بالمتجهات الأخرى في الرسم البياني.
00:04:49إنه يبحث عما يسمى بـ "تشابه جيب التمام" (Cosine Similarity)،
00:04:51ولكن كل ما يفعله حقاً هو القول،
00:04:53مرحباً، السؤال كان عن هذا.
00:04:55نحن نخصص هذه الأرقام.
00:04:56ما هي المتجهات الأقرب إليها؟
00:04:58ما هي الأرقام الأقرب لذلك السؤال؟
00:05:00حسناً، ستكون هذه المتعلقة بالسفن الحربية
00:05:02وربما القوارب والسفن.
00:05:04لذا سيقوم الآن باسترجاع كل تلك المتجهات
00:05:08بكل معلوماتها،
00:05:10وسيقوم بتعزيز الإجابة التي يولدها لك،
00:05:13ومن هنا جاءت تسمية "التوليد المعزز بالاسترجاع".
00:05:16بدلاً من أن يعتمد النموذج اللغوي
00:05:17بشكل كامل على بيانات تدريبه،
00:05:19فإنه قادر على الدخول إلى قاعدة البيانات المتجهة،
00:05:22وجلب المتجهات ذات الصلة،
00:05:24وإحضارها لإعطائك إجابتك حول السفن الحربية.
00:05:27هكذا يعمل RAG، أليس كذلك؟
00:05:29إدخال المستند، تحويل الأجزاء إلى متجه.
00:05:32تتم مقارنة المتجه بالسؤال المطروح،
00:05:35جلب الأقرب منها، وفجأة، ها هو RAG.
00:05:39وهذا هو الـ RAG البسيط،
00:05:40وهو في الحقيقة لا يعمل بشكل جيد على الإطلاق.
00:05:44لذا فإن أشخاصاً أذكى مني ومنكم
00:05:46قد توصلوا إلى طرق أفضل للقيام بذلك،
00:05:49تحديداً البحث الهجين، و Graph RAG، و Agentic RAG.
00:05:53ما سنركز عليه اليوم هو Graph RAG.
00:05:55الآن Graph RAG يمر بنفس العملية.
00:05:57سيظل لديك ذلك المستند.
00:05:58وسيتم تقسيمه أيضاً.
00:05:59وسيتم وضعه في قاعدة البيانات المتجهة المسطحة هذه،
00:06:03ولكنه سيفعل شيئاً إضافياً واحداً.
00:06:05سيقوم بإنشاء "رسم بياني للمعرفة" (Knowledge Graph) أيضاً.
00:06:07سيقوم بإنشاء هذا الشيء المذهل.
00:06:08إذاً ما هو كل هذا؟
00:06:09ما هي كل هذه المتجهات والخطوط؟
00:06:11ماذا يعني هذا في الواقع؟
00:06:12حسناً، كل هذه المتجهات، هذه الدوائر الصغيرة،
00:06:14هي ما يعرف بـ "الكيانات" (Entities).
00:06:17والخطوط التي تربط بين كيانين
00:06:21هي "حافة" (Edge) أو "علاقة".
00:06:23بالعودة إلى مثال المستند،
00:06:25تخيل أن هذا المستند هو عن Anthropic و Claude Code.
00:06:28والجزء الذي تم استخراجه يقول،
00:06:31"أنشأت Anthropic برنامج Claude Code".
00:06:35سيأخذ ذلك ويحلله
00:06:36إلى كيانات وعلاقات.
00:06:38ما هما الكيانان؟
00:06:39الكيانان سيكونان
00:06:41Anthropic و Claude Code.
00:06:44والعلاقة هي أن Anthropic أنشأت Claude Code.
00:06:48إذاً لديك Anthropic هنا
00:06:51ولديك Claude Code هناك.
00:06:54ويمكنكم رؤية أن هذا كيان، وهذا كيان،
00:06:58وبينهما علاقة.
00:06:59على الرسم البياني المرئي، هو مجرد خط،
00:07:03ولكن برمجياً،
00:07:05هذا الخط بين هذين الكيانين
00:07:08يرتبط به الكثير من النصوص
00:07:10التي توضح طبيعة العلاقة بينهما.
00:07:11وفي نظام Graph RAG،
00:07:13يتم فعل ذلك لكل مستند تضيفه إليه.
00:07:16تخيل تكرار هذا في آلاف المستندات.
00:07:19هذا هو الوضع مع 10 مستندات فقط،
00:07:21كل هذه العلاقات والكيانات.
00:07:24ويمكنكم تخيل مدى تطور ذلك
00:07:26مقارنة بمجموعة من المتجهات العشوائية
00:07:28المعزولة في قاعدة بيانات متجهة.
00:07:30ومع نظام مثل Light RAG،
00:07:33نحصل على إنشاء رسم بياني للمعرفة
00:07:35بالإضافة إلى قاعدة البيانات المتجهة التقليدية.
00:07:38إنه يقوم بهذين الأمرين بالتوازي.
00:07:40وبالتالي، عندما تطرح الآن سؤالاً
00:07:43عن أي موضوع كان على النموذج اللغوي،
00:07:45فإنه لا يسحب فقط ذلك المتجه المحدد
00:07:47الذي يجده الأقرب،
00:07:49بل سيذهب أيضاً هنا وينظر إلى الكيان.
00:07:54لنفترض أنك سألت عن Anthropic.
00:07:56حسناً، سيقوم الآن بتتبع العلاقات،
00:07:59والحواف، ويجد كل ما يعتقد أنه ذو صلة.
00:08:03ماذا يعني هذا بالنسبة لك كمستخدم،
00:08:06مع نظام Graph RAG؟
00:08:08أصبح بإمكاني الآن طرح أسئلة أعمق بكثير،
00:08:11ليس فقط حول مستند ما
00:08:13وكأنني أقوم بعملية بحث بسيطة (Control F)
00:08:15لكل الأغراض العملية.
00:08:17يمكنني الآن أن أسأل كيف ترتبط المستندات المختلفة والنظريات المختلفة
00:08:19والأفكار المختلفة ببعضها البعض
00:08:21لأن تلك العلاقات قد تم رسمها، أليس كذلك؟
00:08:24هذا هو جوهر الأمر برمته.
00:08:25يتعلق الأمر بأخذ معلومات متباعدة وربطها ببعضها.
00:08:30هذه هي قوة نظام Graph RAG.
00:08:32هذه هي قوة نظام LightRAG.
00:08:33وهذا ما سنتعلمه اليوم.
00:08:35لذا، فإن تثبيت واستخدام LightRAG
00:08:37هو أمر في غاية السهولة.
00:08:40سأريكم أسهل طريقة
00:08:42حيث سنستخدم فقط Cloud Code.
00:08:44سنعطيه رابط مستودع LightRAG،
00:08:48ونقول له: "مهلاً، قم بإعداد هذا لنا".
00:08:50وسيقوم هو بكل شيء تقريباً.
00:08:52في هذا السيناريو، سنحتاج فقط لبعض الأشياء.
00:08:55كما رأيتم في شرح كيفية عمل الـ RAG،
00:08:58نحن بحاجة إلى نموذج تضمين (Embedding Model).
00:08:59وهذا سيتطلب واجهة برمجة تطبيقات (API).
00:09:02أقترح استخدام OpenAI.
00:09:04لديهم نموذج تضمين فعال للغاية.
00:09:07لذا، ستحتاج إلى مفتاح OpenAI.
00:09:09لديك القدرة مع LightRAG
00:09:11على جعل هذا الأمر محلياً بالكامل.
00:09:14فيمكنك الحصول على نموذج محلي عبر Ollama
00:09:17يقوم بكل عمليات التضمين،
00:09:20وكذلك مهام الأسئلة والأجوبة.
00:09:21لذا افهم أن هذا خيار متاح أيضاً، وهو العمل محلياً بالكامل.
00:09:24نحن سنقوم بنظام هجين (نصف ونصف).
00:09:25لذا سنقوم بإعداد نموذج تضمين من OpenAI
00:09:28بالإضافة إلى النموذج الذي سيقوم بكل العمل الفعلي.
00:09:31ونحتاج أيضاً إلى Docker.
00:09:34فإذا لم تكن قد استخدمت Docker من قبل،
00:09:35فمن السهل جداً إعداده.
00:09:36ستحتاج فقط إلى Docker Desktop،
00:09:39فقط قم بتنزيله وتثبيته واتركه قيد التشغيل
00:09:41عند تشغيل LightRAG،
00:09:42لأنه سيحتاج إلى حاوية (Container).
00:09:45ما ستفعله الآن
00:09:46هو فتح Cloud Code
00:09:47وتقول له: انسخ مستودع LightRAG،
00:09:50واكتب ملف الـ .env المهيأ لـ OpenAI
00:09:53مع GPT-5 mini ونموذج text-embedding-3-large،
00:09:56استخدم التخزين المحلي الافتراضي
00:09:58وابدأ التشغيل باستخدام Docker Compose،
00:10:00ثم أعطه رابط LightRAG.
00:10:02إذا فعلت ذلك، فسيقوم بكل شيء نيابة عنك.
00:10:06سأضع هذا الأمر (Prompt) داخل مجتمع المدرسة المجاني،
00:10:10الرابط موجود في الوصف.
00:10:12أيضاً، ما سيوجد هناك
00:10:13هو ما سأريكم إياه بعد قليل،
00:10:15بعض المهارات المتعلقة بـ Cloud Code و LightRAG
00:10:17لتسهيل التحكم فيه من داخل Cloud Code.
00:10:19لذا ستتمكنون من العثور على ذلك هناك أيضاً.
00:10:22وكنتم تعلمون أن هذا قادم.
00:10:22وبالحديث عن مدرستي،
00:10:24ترويج سريع للدورة المتقدمة في Cloud Code،
00:10:25وهي الطريقة الأولى للانتقال من الصفر إلى مطور ذكاء اصطناعي،
00:10:28خاصة إذا لم تكن قادماً من خلفية تقنية،
00:10:31الرابط موجود في التعليق المثبت.
00:10:33أقوم بتحديثها حرفياً كل أسبوع
00:10:35في الأسبوعين الماضيين،
00:10:36أضفت بالفعل حوالي ساعة ونصف
00:10:38من المحتوى الإضافي.
00:10:39لذا تأكد من الاطلاع عليها
00:10:40إذا كنت جاداً بشأن إتقان Cloud Code
00:10:42والذكاء الاصطناعي بشكل عام.
00:10:44ولكن مرة أخرى، إذا كنت مبتدئاً وهذا يبدو كثيراً عليك،
00:10:46فتأكد من مراجعة المدرسة المجانية
00:10:47التي تضم الكثير من الموارد الرائعة لك
00:10:49إذا كنت في بداية طريقك.
00:10:50وقبل تشغيل هذا،
00:10:51فقط تأكد من أن Docker Desktop قيد التشغيل
00:10:53وأن مفتاح OpenAI جاهز لديك
00:10:55ودع Cloud Code يبدأ العمل.
00:10:56الآن بمجرد أن ينتهي Cloud Code من التثبيت
00:10:58وتضيف مفتاح OpenAI الخاص بك إلى ملف الـ env،
00:11:01يجب أن ترى شيئاً كهذا.
00:11:02أولاً، في Docker Desktop الخاص بك،
00:11:04يجب أن ترى حاوية تسمى LightRag تعمل.
00:11:07ويجب أن يعطيك Cloud Code أيضاً رابطاً
00:11:11للمضيف المحلي (localhost)، وغالباً ما سيكون 9621.
00:11:13وسيأخذك إلى صفحة تبدو بهذا الشكل.
00:11:15هذه هي واجهة المستخدم الرسومية لـ LightRag.
00:11:18وهنا يمكننا رفع المستندات،
00:11:21ويمكننا رؤية مخطط المعرفة (Knowledge Graph)، واسترجاع الأشياء،
00:11:24ويمكننا أيضاً إلقاء نظرة
00:11:25على جميع نقاط نهاية واجهة البرمجة (API Endpoints) المختلفة،
00:11:28والتي ستكون مفيدة لاحقاً.
00:11:30وما تراه هنا هي المستندات
00:11:31التي قمت برفعها لهذا الفيديو.
00:11:33رفع المستندات أمر بسيط للغاية.
00:11:35سنأتي هنا إلى اليمين
00:11:36حيث نجد "Upload"، ثم نقوم بسحبها وإسقاطها.
00:11:39الآن افهم أن هناك أنواعاً معينة فقط من المستندات
00:11:42التي يمكننا وضعها هنا، صحيح؟
00:11:43المستندات النصية، ملفات الـ PDF، وبشكل أساسي،
00:11:46أنت مقيد بالمستندات النصية.
00:11:49هناك طريقة للالتفاف على هذا،
00:11:51خاصة مع أشياء مثل الصور والرسوم البيانية والجداول
00:11:56وما إلى ذلك.
00:11:57وسنتحدث عن ذلك في النهاية
00:11:59لأنه خارج نطاقنا قليلاً الآن،
00:12:00لكننا سنتعلم عنه.
00:12:02لذا، قم بإسقاط أي مستندات تريدها هنا،
00:12:04وبعد ذلك ستتمكن من رؤية حالتها
00:12:07بينما يتم رفعها.
00:12:08سيستغرق الأمر بعض الوقت لأنه، مرة أخرى،
00:12:10يقوم ببناء مخطط المعرفة أثناء قيامه بذلك.
00:12:12لذا قد يستغرق هذا وقتاً طويلاً.
00:12:14وإذا كنت في صفحة مخطط المعرفة لسبب ما
00:12:16لأن هذا قد يحدث أحياناً، وظهرت رسالة مثل،
00:12:18"مهلاً، لم يتم التحميل"، أو ما شابه،
00:12:19يمكنك ببساطة إعادة تعيينه بالضغط على هذا الزر
00:12:21الموجود هنا في الزاوية العلوية اليسرى.
00:12:23إذا انتقلت إلى علامة تبويب الاسترجاع (Retrieval)،
00:12:25فهناك يمكنك طرح الأسئلة
00:12:27حول مخطط المعرفة الخاص بك لنموذج اللغة الكبير،
00:12:30والذي في هذه الحالة سيكون على الأرجح OpenAI
00:12:31إذا استخدمت نفس المفتاح للتضمين.
00:12:33وهنا على اليمين، لدينا بعض المعايير (Parameters).
00:12:36بصراحة، في البداية، ليس هناك الكثير مما تحتاج لتغييره.
00:12:39وبعد ثانية، سأريكم كيف يمكن لـ Claude Code القيام بذلك.
00:12:42ولكن بينما تطرح أسئلتك، كما في هذا المثال،
00:12:44كان لدي مجموعة من مستندات الذكاء الاصطناعي والـ RAG هناك.
00:12:47قلت: "مهلاً، ما هي التكلفة الإجمالية التقريبية
00:12:48لتشغيل نظام RAG في عام 2026؟"
00:12:50ويعطيني إجابة متطورة للغاية.
00:12:53وعلاوة على ذلك، فإنه يعطيك أيضاً المراجع
00:12:56لكل ما يقوم به، صحيح؟
00:12:57انظر، 4، 3 هنا، 2،
00:13:00لأنه في أسفل الصفحة،
00:13:01سيعطيك بالفعل المراجع
00:13:03للمستندات التي استخلص منها المعلومات.
00:13:05ومن الواضح داخل مخطط المعرفة الخاص بنا،
00:13:07أننا نوضح الكيانات (Entities) والعلاقات.
00:13:09إذا نقرت على أحد هذه الكيانات مثل OpenAI مثلاً،
00:13:12يمكنني رؤية بعض الخصائص.
00:13:14لذا فهو يفعل أكثر من مجرد سحب العلاقات والكيانات
00:13:17في عملية التضمين مع LightRag.
00:13:19إنه في الواقع يذهب إلى عمق أكبر، وكأنه يحدد،
00:13:20"حسناً، ما هو نوع هذا الكيان؟
00:13:22هل هي منظمة أم شخص؟"
00:13:25لديه الملفات المحددة التي جلبها
00:13:27بالإضافة إلى معرفات تقسيم البيانات (Chunking IDs).
00:13:29وبعد ذلك يمكنك رؤية العلاقات الفعلية
00:13:31في الركن السفلي الأيمن.
00:13:32سأحرك هذا للحظة.
00:13:33لذا هنا في الأسفل على اليمين،
00:13:35إذا لم تتمكن من رؤيته بصرياً،
00:13:36لأنه يمكن أن يتراكم بشكل معقد على المخطط،
00:13:40يمكنك فقط النقر هنا
00:13:41وسيأخذك إليها أيضاً.
00:13:43لذا فإن واجهة برمجة تطبيقات الخادم هذه هي ما سنستخدمه
00:13:46لربط هذا الشيء بـ Claude Code.
00:13:48لأنه على الرغم من روعة هذا،
00:13:50فأنا لن أجلس هنا فعلياً
00:13:51في كل مرة أريد فيها طرح سؤال
00:13:53حول مخطط المعرفة الخاص بي عبر علامة تبويب الاسترجاع.
00:13:56سيكون ذلك أمراً مرهقاً ومزعجاً للغاية.
00:13:57لذلك بدلاً من ذلك، سنستخدم فقط هذه الـ APIs.
00:14:00الآن، كل واحد من هذه الـ APIs،
00:14:03له وصف، ويمكنك رؤية المعايير والأشياء الخاصة به،
00:14:05وكل واحد من هذه الـ APIs يمكن تحويله إلى مهارة (Skill)، صحيح؟
00:14:08وهذا ما سأفعله وأريكم إياه هنا اليوم.
00:14:11بهذه الطريقة، عندما تريد من Claude Code استخدام LightRag،
00:14:15حسناً، نذهب ببساطة داخل Claude Code، أينما كنا،
00:14:17ونقول: "مهلاً، أريد استخدام مهارة استعلام LightRag
00:14:19وطرح سؤال، كذا وكذا..."
00:14:22إنه نفس الشيء كما لو كنت هنا
00:14:23في علامة تبويب الاسترجاع وطرحت سؤالك.
00:14:26والأفضل من ذلك، سيقوم Claude Code بأخذ الإجابة
00:14:28التي يعطيها لك وسيقوم بتلخيصها
00:14:30لأن هذه الردود قد تكون مفصلة للغاية
00:14:32بشكل افتراضي عندما يتعلق الأمر بـ LightRag.
00:14:34ولكن إذا كنت تريد الإجابة الخام فقط،
00:14:36يمكنك إعداد ذلك أيضاً.
00:14:37النقطة هي، على الرغم من أن لهذا واجهة ويب،
00:14:40إلا أنك لست مضطراً حقاً للتفاعل معها
00:14:41إذا لم تكن ترغب في ذلك.
00:14:42ومن السهل جداً جلبها
00:14:44إلى نظام Cloud Code الخاص بنا.
00:14:46المهارات الأربع الكبرى التي أعتقد أنكم ستستخدمونها أكثر من غيرها
00:14:48هي: الاستعلام، الرفع، الاستكشاف، والحالة.
00:14:51كل هذه الأربع ستكون داخل المدرسة المجانية أيضاً.
00:14:55ولكن ماذا ستفعل غالباً؟
00:14:56ستقوم بإضافة مستندات جديدة
00:14:58وستطرح أسئلة حول تلك المستندات.
00:15:01وربما سترغب في معرفة،
00:15:02"مهلاً، ما الذي وضعته هناك بالفعل؟"
00:15:04لأنه بعد أن يصبح لديك كم هائل من المستندات،
00:15:05ستحتاج لتجنب وضع نفس المستندات
00:15:07مراراً وتكراراً.
00:15:08وهكذا، إذا طرحت نفس السؤال داخل Claude Code،
00:15:12فقد قمت للتو باستدعاء مهارة استعلام LightRag،
00:15:14التي ترسل هذا الطلب إلى LightRag،
00:15:18وهي مستضافة مرة أخرى على أجهزة الكمبيوتر الخاصة بنا،
00:15:21وتعمل داخل حاوية Docker تلك،
00:15:22وسوف تعيد الاستجابة.
00:15:24الآن أنت لست مقيداً بهذا النظام شبه المحلي.
00:15:28إذا كنت شخصاً يتوسع بشكل كبير جداً
00:15:30مع Light RAG، يمكنك استضافة هذا
00:15:33على خادم Postgres قياسي.
00:15:36لديك الكثير من الخيارات، يمكنك استخدام شيء مثل Neon.
00:15:38لذا فإن الأمر يشمل النطاق الكامل.
00:15:40يمكنك الاعتماد كلياً على الجهاز المحلي أو نقل كل هذا
00:15:43إلى السحابة إذا كنت ترغب في ذلك أيضاً.
00:15:44نظام Light RAG قابل للتخصيص للغاية.
00:15:46وهنا الاستجابة التي عاد بها كود Clod،
00:15:48والتي هي مجدداً ملخص للاستجابة الخام
00:15:52التي قدمها لنا Light RAG، كما يذكر مصادره أيضاً.
00:15:55لقد طلبت منه أيضاً الاستجابة الخام
00:15:57لأنه يمكنك الحصول عليها أيضاً،
00:15:58لأنها تعود ببساطة إلى كود Clod
00:16:00في استجابة بتنسيق JSON.
00:16:02هذا كل ما في الأمر.
00:16:04ومرة أخرى، يحتوي أيضاً على المراجع إذا كنت تريدها.
00:16:07فكما رأيتم للتو، من السهل جداً تثبيت Light RAG
00:16:10ومن البسيط جداً دمجه في سير عمل كود Clod الخاص بك.
00:16:14الآن يطرح السؤال نفسه، "حسناً يا تشيس، يبدو هذا رائعاً."
00:16:18أفهم نظرياً أنه إذا كان لدي الكثير من المستندات،
00:16:20فربما ينبغي علي استخدام هذا.
00:16:22حسناً، أين هو الخط الفاصل؟
00:16:23متى يجب أن أبدأ في دمج Light RAG؟
00:16:26حسناً، لا يوجد رقم محدد لهذا.
00:16:28المنطقة الرمادية هي، كما أقول، ما بين حوالي 500
00:16:33و 2000 صفحة من المستندات.
00:16:36لا أريد أن أقول فقط مستندات
00:16:37لأن من يدري كم سيكون حجمها،
00:16:39ولكن حوالي 500 إلى 2000 صفحة نصية.
00:16:42عند تلك النقطة، عند 2000 صفحة، ستبدأ في الدخول
00:16:44إلى حوالي مليون رمز (token).
00:16:47أبعد من ذلك، فمن المنطقي بالتأكيد
00:16:50البدء في دمج Light RAG،
00:16:52لأن الطريقة التي تم بها إعداد RAG،
00:16:54ستكون أرخص وأسرع للقيام بذلك
00:16:57من مجرد الاعتماد على البحث القياسي (grep) من كود Clod.
00:17:00طريقة البحث التي يستخدمها كود Clod للملفات
00:17:03رائعة بالفعل.
00:17:04هناك سبب وراء اختيار كود Clod للقيام بذلك.
00:17:07ومع ذلك، لم يكن ذلك تحت افتراض أن لديك 2000 صفحة
00:17:12من المستندات أو 4000 أو 5000، أليس كذلك؟
00:17:14هناك حد أقصى.
00:17:16الشيء الجيد هو أنه ليس عليك بالضرورة اتخاذ
00:17:19هذا القرار بشكل نهائي، كما رأيت،
00:17:22من السهل جداً تنفيذ ذلك.
00:17:24لذا فقط جرب.
00:17:26إذا كنت تشعر أن لديك الكثير من المستندات وتقول،
00:17:28"مهلاً، هل يجب أن نستخدم RAG عند هذه النقطة؟"
00:17:30حسناً، لا أدري، جرب الأمر.
00:17:32لن يستغرق الأمر طويلاً للقيام به.
00:17:34الجزء الأكثر إيلاماً هو عملية التضمين (embedding).
00:17:36يمكن أن يستغرق ذلك دقيقة بالتأكيد، لكنه ليس عائقاً.
00:17:40والتكلفة ليست جنونية، خاصة مع Light RAG.
00:17:43إذا قارنت هذا مرة أخرى بأنظمة Graph RAG الأخرى
00:17:45مثل Graph RAG من Microsoft، فهذا يمثل نسبة
00:17:48صغيرة جداً من التكلفة.
00:17:49وعند أحجام المستندات الكبيرة جداً،
00:17:52التكلفة مع RAG مقابل التكلفة مع شيء مثل grep
00:17:56تصل إلى ألف مرة أرخص.
00:17:58كانت هناك دراسة أُجريت في الصيف الماضي
00:18:04أظهرت أنها كانت أرخص بـ 1250 مرة استخدام RAG
00:18:07في تلك الأنواع من المواقف.
00:18:08يمكنك رؤية ذلك هنا مع RAG النصي
00:18:10مقابل LLM النصي، بالإضافة إلى وقت الاستجابة الفعلي.
00:18:14الآن، للإفصاح الكامل، كان هذا من يوليو من العام الماضي.
00:18:19لذا فقد تغيرت النماذج.
00:18:20أشك بشدة في أن الفرق لا يزال بهذا الجنون
00:18:23عندما نقارن RAG بالمواقف التقنية القياسية.
00:18:26وكان هذا أيضاً على Gemini 2.0.
00:18:28لم نكن نتحدث عن Harness.
00:18:29لذا فقد تغيرت الكثير من الأشياء،
00:18:31ولكن هل تغيرت لدرجة إغلاق الفجوة البالغة 1250 ضعفاً؟
00:18:36ربما، وربما لا.
00:18:39لا أعتقد ذلك.
00:18:40في كلتا الحالتين، فقط جرب الأمر.
00:18:42لا أعتقد أن هناك الكثير لتخسره.
00:18:44الشيء الآخر مع Light RAG هو فكرة أنه،
00:18:46مهلاً، إذا كنت أرغب في تحميل المستندات،
00:18:48لقد تحدثنا عن هذا قليلاً في وقت سابق.
00:18:49ماذا نفعل إذا كان لدينا مجدداً جداول ورسوم بيانية،
00:18:53وأشياء ليست نصية؟
00:18:54هل يمكن لـ Light RAG التعامل مع هذا؟
00:18:57ليس بالضبط، ولكن يمكننا إصلاح ذلك.
00:18:59والإجابة هي "RAG Anything"
00:19:02من نفس صانعي Light RAG بالضبط.
00:19:04وهذا شيء يمكن أن يكون أساساً متعدد الوسائط (multimodal).
00:19:07وهو شيء يمكننا تقريباً دمجه
00:19:09مباشرة فوق Light RAG.
00:19:10الآن، لا أريد أن أحبطكم،
00:19:13ولكن سيكون ذلك خارج نطاق اليوم،
00:19:15نطاق فيديو اليوم.
00:19:17ومع ذلك، في فيديو الغد،
00:19:18ماذا تعتقدون أننا سنفعل؟
00:19:19غداً، سنشرح بالتفصيل RAG Anything
00:19:22وسنوضح أساساً كيف يمكنك دمجها
00:19:25في ما بنيناه باستخدام Light RAG.
00:19:27لذا سيكون نوعاً من الثنائي القوي.
00:19:28لذا إذا كان هذا شيئاً يهمك،
00:19:31فقم بالإعجاب والاشتراك،
00:19:32لأننا سنقوم بمراجعة ذلك غداً.
00:19:34وعلى هذا النحو،
00:19:35هذا هو المكان الذي سننتهي فيه تقريباً.
00:19:39أتمنى أن تكونوا قد استمتعتم به.
00:19:41هذا هو أول فيديو لي أيضاً بهذا الإعداد الجديد للكاميرا.
00:19:43الإضاءة، أستطيع أن ألاحظ بالفعل أنها ليست،
00:19:46ليست تماماً في المكان الذي أردتها أن تكون فيه.
00:19:48لذا أعتذر عن كل ذلك.
00:19:49لا زلت أعمل على حل المشكلات،
00:19:50أنا سعيد فقط لأنها كانت تعمل على الإطلاق
00:19:52ولم ترتفع حرارة الكاميرا في منتصف هذا الأمر.
00:19:55ولكن نعم، جميع المهارات موجودة داخل المدرسة المجانية.
00:19:58أمور RAG مثيرة للاهتمام للغاية، خاصة Light RAG.
00:20:01لقد كان منتجاً رائعاً.
00:20:02لقد كنت أستخدمه لفترة طويلة.
00:20:03لذا تحقق من هذا الشيء بنسبة 100%، 100%.
00:20:06ومن السهل جداً دمجه
00:20:07داخل كود Clod كما رأيتم.
00:20:08لذا تحقق من المدرسة المجانية للمهارات،
00:20:12وكذلك الأوامر (prompts) إذا كنت بحاجة إليها.
00:20:14لنكن صادقين تماماً،
00:20:15إذا قمت فقط بتوجيه كود Clod إلى Light RAG،
00:20:16فسيقوم بإعداده بشكل جيد بمفرده.
00:20:19ولكن بخلاف ذلك،
00:20:20تأكد من مراجعة Chase AI Plus
00:20:21إذا كنت ترغب في الحصول على تلك الدورة التدريبية المتقدمة.
00:20:24وسأراكم لاحقاً.

Key Takeaway

يوفر دمج LightRAG مع Claude Code نظاماً هجيناً يربط آلاف المستندات عبر رسوم بيانية للمعرفة، مما يجعل استرجاع المعلومات المعقدة أرخص بـ 1250 مرة وأسرع من الاعتماد على نافذة السياق التقليدية للنماذج اللغوية.

Highlights

تتفوق تقنية LightRAG على أنظمة GraphRAG المعقدة من مايكروسوفت بتكلفة تشغيل أقل بكثير مع الحفاظ على كفاءة عالية.

يخفض استخدام نظام RAG التكاليف بمقدار 1250 مرة مقارنة بعمليات البحث التقليدية (grep) عند التعامل مع مجموعات بيانات ضخمة.

يصبح الانتقال إلى LightRAG ضرورياً من الناحية التقنية والاقتصادية عندما تتجاوز المستندات حاجز 500 إلى 2000 صفحة نصية.

يعتمد نظام GraphRAG على بناء 'رسم بياني للمعرفة' يربط الكيانات (Entities) عبر حواف (Edges) توضح طبيعة العلاقة البرمجية بين المعلومات.

يتيح دمج Claude Code مع LightRAG استدعاء مهارات الاستعلام والرفع والاستكشاف مباشرة من واجهة الأوامر دون الحاجة لواجهة المستخدم الرسومية.

Timeline

قصور نافذة السياق وضرورة RAG في 2026

  • تواجه النماذج اللغوية الكبيرة جداراً تقنياً عند التعامل مع مجموعات بيانات تتجاوز سعة نافذة السياق الخاصة بها.
  • يعتبر نظام RAG المتطور في عام 2026 وسيلة أسرع وأقل تكلفة للشركات لإدارة آلاف المستندات مقارنة بالبحث الوكيلي.
  • يقدم مستودع LightRAG مفتوح المصدر بديلاً اقتصادياً لمنافسة أنظمة GraphRAG المؤسسية الضخمة.

تتطور قدرات النماذج مثل Opus 4.6 في معالجة السياق، لكن الاعتماد الكلي عليها يظل محدوداً عند التعامل مع 500 أو 1000 مستند. يوفر LightRAG حلاً لهذه الفجوة من خلال تقليل التكلفة التشغيلية وتسريع وتيرة استخراج المعلومات. تعتمد الشركات الكبرى والصغيرة على هذه الأنظمة لضمان دقة الاستجابات في بيئات البيانات الضخمة.

آلية عمل RAG البسيط مقابل Graph RAG

  • تعتمد عملية RAG الأساسية على تقسيم المستندات إلى أجزاء (Chunks) وتحويلها إلى متجهات رقمية عبر نماذج التضمين.
  • يستخدم النظام 'تشابه جيب التمام' (Cosine Similarity) لمقارنة متجه سؤال المستخدم مع المتجهات المخزنة في قاعدة البيانات.
  • لم يعد نظام RAG البسيط (Naive RAG) كافياً في البيئات البرمجية الحديثة نظراً لمحدودية دقته في ربط المفاهيم.

تتحول النصوص إلى سلاسل من الأرقام تمثل آلاف الأبعاد في فضاء المتجهات، مثل تمثيل كلمة 'موز' بأرقام محددة. عند طرح سؤال، يبحث النظام عن أقرب النقاط الرقمية للسؤال لتعزيز الإجابة ببيانات خارجية بدلاً من الاعتماد على التدريب المسبق فقط. هذه الطريقة التقليدية تفتقر إلى فهم العلاقات العميقة بين المعلومات المتباعدة.

بنية Graph RAG وقوة العلاقات

  • ينشئ Graph RAG رسماً بيانياً للمعرفة يربط الكيانات ببعضها البعض عبر علاقات برمجية موثقة بنصوص توضيحية.
  • تتحول المعلومات المشتتة في آلاف المستندات إلى شبكة مترابطة تتيح طرح أسئلة تحليلية أعمق.
  • يعمل Light RAG على بناء قاعدة البيانات المتجهة والرسم البياني للمعرفة بالتوازي لضمان شمولية الاسترجاع.

يتم تحليل جملة مثل 'أنشأت Anthropic برنامج Claude Code' إلى كيانين وعلاقة تربط بينهما. تتيح هذه البنية للمستخدم تتبع الروابط بين النظريات والأفكار المختلفة عبر مستندات متعددة. تتفوق هذه الطريقة على البحث البسيط لأنها تفهم السياق الهيكلي للمعلومات وليس فقط التشابه اللفظي.

التنفيذ التقني ودمج Claude Code

  • يتطلب تشغيل Light RAG وجود Docker Desktop ومفتاح واجهة برمجة تطبيقات من OpenAI لنماذج التضمين.
  • يمكن تهيئة النظام للعمل محلياً بالكامل باستخدام Ollama لضمان خصوصية البيانات وتقليل التكاليف.
  • يتم الربط مع Claude Code عبر ملف .env ونموذج GPT-5 mini لتحقيق توازن بين الأداء والتكلفة.

تتم عملية التثبيت عبر نسخ مستودع Light RAG وتكوين حاوية Docker لتشغيل خادم محلي على منفذ 9621. تتيح واجهة المستخدم الرسومية رفع ملفات PDF والنصوص ومراقبة حالة بناء مخطط المعرفة. يمكن تخصيص النظام ليعمل بنمط هجين يجمع بين المعالجة المحلية واستخدام السحابة للتضمين المتطور.

إدارة المهارات ومعايير الكفاءة الاقتصادية

  • تعتبر مهارات الاستعلام (Query) والرفع (Upload) والحالة (Status) الركائز الأساسية للتحكم في النظام من داخل Claude Code.
  • يتفوق RAG اقتصادياً بمراحل عندما يصل حجم البيانات إلى مليون رمز (Token) أو ما يعادل 2000 صفحة.
  • يوفر نظام 'RAG Anything' قدرات متعددة الوسائط للتعامل مع الجداول والرسوم البيانية والصور التي تعجز عنها الأنظمة النصية.

يقوم Claude Code بتلخيص الاستجابات الخام القادمة من Light RAG بتنسيق JSON مع ذكر المراجع الدقيقة. أثبتت الدراسات أن استخدام RAG في حالات البيانات الضخمة أرخص بـ 1250 مرة من طرق البحث التقليدية. يظل النظام قابلاً للتوسع عبر استضافته على خوادم Postgres مثل Neon للتعامل مع أحجام بيانات مؤسسية ضخمة.

Community Posts

View all posts