هذه هي طبقة الذاكرة المفقودة لبرمجة الذكاء الاصطناعي (Graphify)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00قد تكون هذه واحدة من أكثر الطرق جنوناً لإحياء قاعدة الكود البرمجي الخاصة بك.
00:00:04إذا كنت تستخدم Claude Code أو Cursor في مشروع حقيقي، فقد تعتقد أن الجزء الصعب هو كتابة الكود.
00:00:09حسناً، الأمر ليس كذلك. الجزء الصعب هو ببساطة فهم المستودع الخاص بك.
00:00:13تطرح سؤالاً واحداً، ويقوم الذكاء الاصطناعي باستهلاك الـ tokens فقط لاكتشاف ما يحدث.
00:00:18إنه بطيء، ومكلف، وفي نصف الحالات لا يزال غير دقيق.
00:00:22ماذا لو قمت بإعطاء الذكاء الاصطناعي خريطة للمشروع بدلاً من إرساله بالكامل في كل مرة؟
00:00:27هذا بالضبط ما يفعله Grafi، ويمكنه تقليل استخدام الـ tokens بنسبة تزيد عن 70%.
00:00:32دعني أريك كيف يعمل كل هذا.
00:00:34في الوقت الحالي، يرى الذكاء الاصطناعي مشروعك بهذا الشكل. مجرد كومة من الملفات.
00:00:44لا توجد روابط حقيقية. لا يوجد هيكل. لا توجد ذاكرة.
00:00:48لذا في كل مرة تطرح فيها سؤالاً، يتعين عليه إعادة تعلم كل شيء من الصفر.
00:00:53هذا هو السبب في أن الإجابات تبدو قريبة، ولكنها ليست صحيحة تماماً.
00:00:56ونعم، هذا هو بالضبط ما أشار إليه كارباثي فيما يخص مشكلة "المجلد الخام".
00:01:01ظهر Grafi مباشرة بعد ذلك. إنه بمثابة طبقة ذاكرة.
00:01:06إذا كنت تستمتع بأدوات البرمجة والنصائح مثل هذه، فتأكد من الاشتراك.
00:01:09لدينا فيديوهات تصدر طوال الوقت.
00:01:11حسناً، دعني أريك الآن. لدي مستودع صغير هنا. رسم توضيحي لوثائق الكود.
00:01:16عادةً، سأضطر لشرح كل هذا للذكاء الاصطناعي في كل مرة.
00:01:20بدلاً من ذلك، أقوم بتشغيل أمر واحد، Grafi، هنا. انتظر لحظة. انظر إلى هذا.
00:01:27بعد أن ينفذ Claude أمر Grafi، لم تعد هذه مجرد ملفات. لقد أصبح رسماً بيانياً حقيقياً.
00:01:33كل شيء مرتبط ببعضه. يمكنني النقر وتحليل ما يحدث بالضبط
00:01:38وما هو مرتبط ببعضه البعض هنا داخل ملف HTML الذي تم إنشاؤه.
00:01:42بعد ذلك، بدلاً من مطالبة الذكاء الاصطناعي بقراءة كل شيء مرة أخرى، يمكنني سؤاله عما يتصل بطبقة API.
00:01:50والآن يجيب باستخدام العلاقات، مستخدماً ملف MD الذي تم إنشاؤه من خلال هذا الاستدعاء.
00:01:56ليست مجرد تخمينات، بل علاقات. وإليك الجزء الذي فاجأني.
00:02:00قبل هذا، كان الاستهلاك حوالي 14,000 token، حسناً، أياً كان العدد المستخدم.
00:02:04بعد ذلك، وبعد تنفيذه للمرة الأولى، انخفض ذلك إلى بضع مئات فقط.
00:02:09نفس السؤال، تكلفة مختلفة تماماً. كل ذلك بفضل هذه الخريطة التي تم إنشاؤها.
00:02:14ما الذي يفعله هذا فعلياً؟ Grafi يشبه أساساً خرائط جوجل لقاعدة الكود الخاصة بك.
00:02:20بدلاً من النص الخام، تحصل على عُقد ووصلات.
00:02:24تحت كل ذلك، يستخدم tree-sitters لفهم الهيكل، ثم نموذج لغوي كبير لاستخراج المعنى.
00:02:30بعد ذلك يمكنه تجميع كل شيء في مجموعات، والأمر لا يقتصر على الكود فقط.
00:02:35إنه يقرأ ملفات PDF، والرسوم التوضيحية، وحتى الصوت والفيديو. كل ذلك محلياً، لا شيء يغادر جهازك.
00:02:41ما تحصل عليه من هذا بسيط. نحصل على رسم بياني مرئي، وتقرير مكتوب،
00:02:46وقاعدة معرفية يمكننا استكشافها فعلياً.
00:02:49هذا الرسم البياني المرئي ضخم بالنسبة للكثيرين منا حيث يمكننا رؤية كيف ترتبط الأشياء.
00:02:54الآن إليك كيف يغير هذا طريقة عمل البرمجة بالذكاء الاصطناعي عادةً.
00:02:57تستخدم معظم الأدوات نظام RAG، وهو ما يعني أساساً العثور على قطع نصية متشابهة.
00:03:03حسناً، Grafi لا يفعل ذلك. إنه يبني علاقات حقيقية.
00:03:07هذه الدالة تستدعي تلك. وهذا النموذج يعتمد على ذاك.
00:03:11جاءت هذه الفكرة من هذه الوثيقة، بل ويخبرك بمدى ثقته في ذلك.
00:03:16لذا بدلاً من "هذا يبدو مرتبطاً"، نحصل على شيء مثل "هذا متصل فعلياً"
00:03:21في تمثيل مرئي حقيقي لما هو مرتبط ببعضه.
00:03:24والفرق الأكبر هنا هو أنه يتذكر أيضاً؛ بما أنه أنشأ لنا ملف MD هذا،
00:03:30فيمكنه الرجوع إليه. نحن لا نبدأ من الصفر في كل مرة.
00:03:33إنه يقوم بتحديث ما تغير فقط، لذا يصبح لدى الذكاء الاصطناعي أخيراً سياق ثابت.
00:03:38حسناً، لقد اعتقدت فعلاً أن كل هذا كان رائعاً جداً.
00:03:42ولكن ما هي الإيجابيات والسلبيات هنا والآن؟
00:03:44أولاً، الكفاءة تتضاعف بمرور الوقت.
00:03:47كل سؤال يصبح أرخص. وبما أنه يربط الكود،
00:03:51والوثائق، والرسوم التوضيحية، تبدأ في اكتشاف علاقات لم تكن تعلم بوجودها.
00:03:56هذا أمر ضخم لعملية التوجيه (onboarding) في المشاريع الفوضوية التي يتم تكليفنا بها.
00:04:00هذا رائع. الآن العيوب في كل هذا هي كالتالي.
00:04:03التشغيل الأول يمكن أن يكون بطيئاً ومكلفاً من حيث الـ tokens، خاصة مع وجود الكثير من الوثائق.
00:04:08بعد ذلك، يتم تخزينه مؤقتاً. ولكن نعم، ذلك العبء الأول حقيقي.
00:04:12كما أنه لا يزال في مراحله الأولى، لذا فإن الدعم طويل الأمد لا يزال أمراً محدوداً وغير مؤكد.
00:04:17عندما تقوم بتثبيت هذا، فإنه يُكتب Grafyy بحرفي Y وليس واحداً.
00:04:20لذا تأكد من الإملاء. العلاقات ليست دائماً مثالية،
00:04:23لكنه يصنفها بوضوح: مستخرجة، مستنتجة، أو غامضة،
00:04:28لكي تعرف ما يمكنك الوثوق به فعلياً. وإذا كان مستودعك صغيراً جداً،
00:04:32فسيكون هذا بمثابة مبالغة في الاستخدام. فهل يستحق الأمر ذلك؟
00:04:35أعني، نعم، إذا كنت تستخدم الذكاء الاصطناعي في أي مشروع حقيقي، فهذا رائع.
00:04:38لقد وجدت أنه يستحق العناء. لأن مشكلتك الأكبر ليست في تشغيل الكود،
00:04:42بل هي في الواقع فهمه عبر الملفات، وعبر الزمن، وعبر السياق.
00:04:46وهذا هو بالضبط ما يعالجه هذا البرنامج. توفير الـ tokens وحده يجعله جديراً بالتجربة،
00:04:51لكن الفوز الأكبر هو هذا: ذكاؤك الاصطناعي يتوقف عن التخمين ويبدأ في التفكير المنطقي.
00:04:56إذا كنت تعمل بمفردك، أو تقوم بأبحاث، أو تدير هذه الأنظمة الكبيرة، فهذا تحديث جدي.
00:05:01إذا كنت تعمل فقط على سكربتات أصغر، فمن المحتمل أن يكون هذا مجرد مبالغة،
00:05:04لذا لست بحاجة حقاً لتجربته. ولكن بالنسبة لمعظم المبرمجين الذين يجربون هذا،
00:05:07ستكون هذه أداة مذهلة. إذا كنت تستمتع بأدوات البرمجة والنصائح
00:05:10التي تسرع سير عملك، فتأكد من الاشتراك في قناة Better Stack.
00:05:14سنراكم في فيديو آخر.

Key Takeaway

يعالج Grafi مشكلة فهم مستودعات الكود الضخمة عبر بناء طبقة ذاكرة قائمة على الرسوم البيانية (Graph-based memory) تقلل استهلاك الـ tokens بنسبة 70% وتمنح الذكاء الاصطناعي سياقاً ثابتاً يعتمد على العلاقات الفعلية لا التخمين.

Highlights

  • يقلل Grafi استهلاك الرموز (tokens) بنسبة تتجاوز 70% عبر تحويل مستودع الكود إلى خريطة مرئية بدلاً من ملفات نصية خام.

  • تعتمد الأداة على تقنية tree-sitters لفهم هيكل الكود ونماذج لغوية كبيرة لاستخراج المعنى وبناء علاقات حقيقية بين الدوال والنماذج.

  • يعالج النظام ملفات PDF والرسوم التوضيحية وملفات الصوت والفيديو محلياً دون إرسال أي بيانات خارج الجهاز.

  • تنخفض تكلفة الاستعلام الواحد من 14,000 رمز إلى بضع مئات فقط بعد إنشاء الرسم البياني الأول للمشروع.

  • يوفر Grafi تصنيفاً لمستوى دقة العلاقات المستخرجة إلى ثلاث فئات: مستخرجة، أو مستنتجة، أو غامضة.

Timeline

تحديات فهم مستودعات الكود التقليدية

  • يواجه المبرمجون صعوبة في جعل الذكاء الاصطناعي يستوعب هيكل المشروع الكامل بدقة.
  • تؤدي إعادة تعلم المشروع من الصفر في كل سؤال إلى استنزاف مالي وزمني كبير.
  • تفتقر الأدوات الحالية مثل Claude Code وCursor إلى وجود روابط وهيكل ذاكرة دائم للملفات.

تظهر مشكلة "المجلد الخام" عندما يتعامل الذكاء الاصطناعي مع المشروع كمجموعة ملفات معزولة. هذا الوضع يتطلب إرسال كامل قاعدة الكود مع كل استفسار، مما يرفع التكاليف ويؤدي لنتائج غير دقيقة بسبب غياب السياق المرتبط. الحل يكمن في تزويد النموذج بخريطة مسبقة للمشروع.

آلية عمل Grafi وكفاءة استهلاك الموارد

  • يحول Grafi الملفات النصية إلى رسم بياني تفاعلي يوضح الروابط بين المكونات.
  • تنخفض تكلفة الـ tokens بشكل حاد بعد التشغيل الأول بفضل التخزين المؤقت للبيانات.
  • تعتمد الإجابات على علاقات حقيقية مستمدة من ملفات MD يتم إنشاؤها تلقائياً.

يعمل النظام كطبقة ذاكرة إضافية فوق قاعدة الكود. عند تنفيذ أمر واحد، يتم ربط ملفات HTML وAPI والوثائق ببعضها البعض، مما يتيح للنموذج الوصول للمعلومة المطلوبة مباشرة عبر المسارات المرتبطة. التحول من 14,000 رمز إلى بضع مئات يثبت فعالية هذه الخريطة في تقليل الضوضاء المعلوماتية.

التحليل العميق والفرق عن أنظمة RAG

  • يستخدم النظام tree-sitters لتحليل الهيكل البرمجي وفهم استدعاءات الدوال بدقة.
  • يتفوق Grafi على أنظمة RAG التقليدية التي تبحث عن التشابه النصي فقط.
  • يتم تحديث الأجزاء المتغيرة فقط في قاعدة الكود لضمان سياق مستقر ودائم.

بدلاً من مجرد العثور على قطع نصية متشابهة، يبني Grafi شبكة منطقية توضح أي دالة تستدعي الأخرى وأي نموذج يعتمد على وثيقة معينة. يمتد هذا التحليل ليشمل الوسائط المتعددة مثل الصور والفيديو، مع الحفاظ على خصوصية البيانات عبر المعالجة المحلية بالكامل. يتميز النظام بقدرته على إظهار مدى الثقة في كل علاقة مكتشفة.

التقييم العملي: الإيجابيات والقيود

  • تتضاعف كفاءة الأداة بمرور الوقت مع كل سؤال جديد يطرحه المبرمج.
  • يتطلب التشغيل الأول استهلاكاً عالياً للـ tokens وجهداً معالجاً ملحوظاً.
  • تعتبر الأداة مبالغة تقنية للمشاريع الصغيرة أو السكربتات البسيطة.

تظهر القيمة الحقيقية في المشاريع المعقدة وعمليات توجيه المبرمجين الجدد (onboarding)، حيث يتم اكتشاف علاقات خفية بين الكود والوثائق. رغم بطء التشغيل الأول، إلا أن التوفير اللاحق في التكاليف ودقة التفكير المنطقي للذكاء الاصطناعي تجعلها ضرورة للمشاريع الكبيرة. يجب الانتباه لإملاء الاسم الصحيح (Grafyy) عند التثبيت لضمان الوصول للنسخة المطلوبة.

Community Posts

View all posts