مهارة Claude هذه تقلل تكلفة الـ Tokens إلى النصف

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00إذا كنت تحب توفير المال أو كنت تكره فقط الطريقة التي تتحدث بها النماذج اللغوية الكبيرة، فقد يكون هذا الحل مناسبًا لك.
00:00:03إنها مهارة جديدة رائجة تسمى "Caveman" (رجل الكهف) وتعد بتقليل ما يصل إلى 75% من رموز المخرجات
00:00:07البرمجية مع الحفاظ على الدقة التقنية الكاملة.
00:00:10كل ذلك بفضل كلمات "كيفن" الحكيمة.
00:00:12لماذا تضيع الوقت؟
00:00:13قل كلمات كثيرة بينما كلمات قليلة تفي بالغرض.
00:00:16تعمل هذه المهارة على Claude وCodex وأي مكان آخر، وتتحول مخرجاتك من كلمات حشو وردود
00:00:20طويلة جدًا لا تُقرأ إلى ملخص رائع بنفس الدقة التقنية، بل إنها
00:00:24قابلة للتخصيص وتحتوي على إضافات مثل وضع "wenyan"، والالتزامات الموجزة، ومراجعات التعليمات البرمجية من سطر واحد و
00:00:29أداة لضغط المدخلات.
00:00:30قد يبدو الأمر جنونيًا بعض الشيء في البداية ولكن هناك بعض العلم وراء ذلك، فلنبدأ
00:00:34ونلقي نظرة.
00:00:40كنت أختبر هذا في Claude Code في وقت سابق مع تطبيق Next.js تجريبي لديّ والذي
00:00:44يحتوي فعليًا على نظام مصادقة وهمي، وكنت أسأل ببساطة: هل يمكنك شرح كيفية تنفيذ المصادقة
00:00:48في هذا التطبيق؟
00:00:49الآن هذا هو Claude Code العادي بدون تثبيت المهارة، ترى على الفور أنه يبدأ
00:00:53في استخدام كلمات الحشو قائلاً إن هذا نظام مصادقة محاكى.
00:00:56لدينا هذه الرموز التي تقول لا توجد خلفية برمجية، لا كلمات مرور، لا أمان حقيقي، موجودة فقط لإظهار
00:01:00تتبع المستخدم في Better Stack RUM.
00:01:03بعد ذلك يستمر في شرح الملفات الأساسية وكيفية عملها وكل شيء
00:01:06مكتوب بلغة إنجليزية مقروءة.
00:01:08إذا سألنا نفس السؤال ولكن هذه المرة باستخدام مهارة "caveman"، سترى أنها تصل
00:01:11إلى صلب الموضوع مباشرة وتكون أكثر إيجازًا بكثير.
00:01:13الجملة الأولى هي: للعرض فقط، مصادقة من جانب العميل، لا أمان حقيقي، مصمم من أجل
00:01:17عروض تتبع Better Stack RUM.
00:01:18لا تحتوي على أي من كلمات الحشو تلك، أو الرموز الطويلة أو أي شيء من هذا القبيل.
00:01:21ليست بحاجة لصياغة جملة صحيحة، يمكنها فقط إخبارك بالمعلومات التقنية
00:01:25على الفور.
00:01:26وينطبق الشيء نفسه على قسم "كيف يعمل"، والتدفق، ونقاط التكامل.
00:01:29يمكنك أن ترى هنا بدلاً من قول كيفية عمل هذا في جملة إنجليزية عادية،
00:01:33يقول فقط: تحميل التطبيق، ثم يضع سهمًا للتحقق من التخزين المحلي للمستخدم المحفوظ.
00:01:36لذا فهو أكثر إيجازًا بكثير وهذا ما يهمني بصراحة.
00:01:39لا يهمني حقًا أن يكون بلغة إنجليزية عادية، أردت فقط المعلومات التقنية
00:01:43منه.
00:01:44هذا الإيجاز هو في الواقع السبب الرئيسي لإعجابي بهذه المهارة ولكن ميزة البيع الأخرى
00:01:47هي أن هذا يعني تقليل رموز المخرجات وبالتالي نظريًا يمكنك
00:01:51الاستفادة بشكل أكبر من اشتراك Claude Code الخاص بك أو حتى توفير المال على رموز واجهة برمجة التطبيقات.
00:01:55لكنني أعتقد أن هناك عقبة صغيرة هنا.
00:01:57هذه نتيجة لاختبار مقارنة كنت أجريه سابقًا حيث كنت أقارن استجابة
00:02:00Claude Code الأساسية مقابل استجابة موجزة حيث أقول حرفيًا لـ Claude Code كن
00:02:04موجزًا مقابل استخدام مهارة "caveman" الخاصة بنا.
00:02:07كان هذا على 10 مطالبات وأمور بسيطة مثل: كيف يختلف git rebase عن git merge.
00:02:11الآن يمكنك رؤية النتائج إيجابية للغاية.
00:02:14عندما نستخدم مهارة "caveman" مقابل الأساس، نجد في الواقع انخفاضًا بنسبة 45% في رموز
00:02:18المخرجات و39% مقارنة بمجرد قول "كن موجزًا" لـ Claude Code.
00:02:22من الواضح أن هذا سيتعلق بالتكلفة أيضًا، سيكون هناك توفير بنسبة 45%
00:02:26في رموز المخرجات، فبينما يكلف الأساس حوالي 8 سنتات، تكلف مهارة "caveman" حوالي
00:02:314 سنتات.
00:02:32لذا يبدو كل شيء جيدًا في البداية.
00:02:34أين تبدأ الأمور في أن تصبح أكثر إثارة للاهتمام هي عندما نأخذ في الاعتبار تكلفة رموز
00:02:37المدخلات.
00:02:38من الواضح الآن أننا نستخدم مهارة "caveman" فنحن نقوم بتحميل ملف markdown والذي
00:02:41يحتوي على نص أكثر بكثير من مطالباتنا المكونة من جملة واحدة، فبالنسبة للأساس حيث
00:02:45نرسل تلك الجملة فقط، التكلفة هي أجزاء من السنت، ولكن عندما نستخدم مهارتنا يمكنك رؤية أنها
00:02:49تبلغ الآن حوالي 4 سنتات.
00:02:50إذا دمجنا تكاليف رموز المدخلات والمخرجات، يمكنك أن ترى أن "caveman" في المتوسط
00:02:54أكثر تكلفة بنسبة 10% من الأساس لأن المدخرات التي حققناها في رموز
00:02:58المخرجات ضاعت في رموز المدخلات الخاصة بنا.
00:03:01لكن هذا لا يعني أنها خسارة لمهارة "caveman" وذلك لأن هذا صحيح فقط في
00:03:04سيناريوهات محددة للغاية.
00:03:05يكون ذلك صحيحًا فقط إذا كنا نرسل مطالبة صغيرة واحدة ولا نطرح أي أسئلة متابعة.
00:03:10إذا بدأت في طرح أسئلة متابعة، يمكنك الاستفادة من تسعير تخزين المطالبات المؤقت، وعندما
00:03:14نفعل ذلك يمكنك رؤية الأشياء تميل مرة أخرى لصالح "caveman" ونحقق في الواقع توفيرًا
00:03:19بنسبة 39% في التكلفة.
00:03:20لقد تعمقنا قليلاً في التفاصيل هنا ولكن هذا يثبت أن هناك منطقًا لاستخدام
00:03:23مهارة "caveman" وهذا قبل أن نأخذ في الاعتبار ميزة محتملة أخرى وهي أن
00:03:27دراسة هذا العام أظهرت أن تقييد النماذج الكبيرة باستجابات موجزة حسن الدقة
00:03:31بنسبة 26% في معايير معينة.
00:03:34لذا ربما كان "كيفن" هو الذكي في النهاية وستكون ذكيًا إذا اشتركت.
00:03:38يمكنك تجربة هذه المهارة بنفسك باستخدام حزمة مهارات vacel وتشغيل
00:03:41أمر مثل هذا، وهنا يمكننا أيضًا رؤية ما تطلبه من الوكيل القيام به.
00:03:45لدينا بعض القواعد مثل حذف أدوات التعريف والتنكير، وحذف أي كلمات حشو، وحذف المجاملات،
00:03:49وحذف لغة التحوط.
00:03:50ثم لدينا أيضًا استخدام مرادفات قصيرة مثل "كبير" بدلاً من "واسع النطاق" و"إصلاح" بدلاً
00:03:54من "تنفيذ حل لـ"، ولدينا أيضًا ما نريد الاحتفاظ به وهو المصطلحات التقنية،
00:03:58وكتل التعليمات البرمجية والأخطاء.
00:04:00بعد ذلك لدينا نمط كيفية هيكلتها، فيجب أن يكون لدينا
00:04:03الشيء، الإجراء، السبب، ثم الخطوة التالية.
00:04:05جميل وموجز.
00:04:07هناك أيضًا أوضاع كثافة هنا لتغيير مدى قوة أسلوب "caveman".
00:04:10يمكنك أن ترى أنها تتراوح من "خفيف" إلى "فائق".
00:04:12كنت أستخدم "كامل" لأنه الافتراضي ولكن يمكنك أن ترى في "فائق" أنه يختصر كل شيء،
00:04:17ويجرد حروف العطف، ويستخدم السهام للسببية ويستخدم كلمة واحدة عندما تكون كلمة واحدة
00:04:21كافية.
00:04:22هناك أيضًا وضع "wenyan" الذي يستخدم الحروف الصينية الكلاسيكية لأنها في الواقع
00:04:26الأكثر كفاءة في الرموز.
00:04:27للأسف لا أستطيع قراءتها لذا فهي ليست ذات فائدة كبيرة بالنسبة لي.
00:04:30هذا ليس كل ما تقدمه مهارة "caveman" وهناك بالفعل بضع مهارات أخرى لـ
00:04:33سيناريوهات محددة.
00:04:34لدينا "caveman commit" لكتابة رسائل التزام موجزة ودقيقة بتنسيق الالتزامات التقليدية.
00:04:38ولدينا "caveman review" لكتابة تعليقات مراجعة الكود التي تكون سطرًا واحدًا موجزًا لكل نتيجة
00:04:42ولدينا أيضًا مهارة "compress" لتحويل ملفات لغتك الطبيعية إلى أسلوب "caveman"
00:04:46حتى تتمكن من إعادة استخدامها برموز مدخلات أقل قليلاً.
00:04:49أخبروني في التعليقات إذا أعجبكم أي من هذه الأشياء وأثناء وجودكم
00:04:52هناك، اشتركوا وكما هو الحال دائمًا نراكم في الفيديو القادم.

Key Takeaway

تحقق مهارة Caveman توفيراً في التكلفة بنسبة 39% وتحسيناً في الدقة بنسبة 26% من خلال تجريد لغة الحشو واستخدام هيكلية (الشيء، الإجراء، السبب) في مخرجات النماذج اللغوية.

Highlights

تقلل مهارة Caveman رموز المخرجات بنسبة تصل إلى 75% مع الحفاظ على الدقة التقنية الكاملة في نماذج Claude وCodex.

أظهرت مقارنة بين 10 مطالبات انخفاضاً بنسبة 45% في رموز المخرجات وتوفير 4 سنتات لكل استجابة مقارنة بالوضع الأساسي.

يؤدي استخدام مهارة Caveman مع تقنية تخزين المطالبات المؤقت (Prompt Caching) إلى تحقيق توفير إجمالي في التكلفة بنسبة 39%.

تتحسن دقة النماذج اللغوية الكبيرة بنسبة 26% في معايير محددة عند تقييدها باستجابات موجزة ومباشرة.

يتضمن وضع Caveman Ultra ميزات متقدمة مثل تجريد حروف العطف واستخدام الأسهم للسببية لتقليل استهلاك الرموز لأدنى حد.

يوفر وضع wenyan كفاءة قصوى في استهلاك الرموز عبر استخدام الحروف الصينية الكلاسيكية بدلاً من اللغات الطبيعية المطولة.

Timeline

مفهوم مهارة Caveman وآلية عملها

  • تعمل مهارة Caveman على تقليل رموز المخرجات بنسبة تصل إلى 75% عبر استبدال الجمل الطويلة بملخصات تقنية مركزة.
  • تعتمد المهارة على تقليل عدد الكلمات المستخدمة مع الحفاظ على جوهر المعلومات والبيانات التقنية.
  • تتوفر خيارات مخصصة مثل مراجعات الأكواد من سطر واحد وأدوات ضغط المدخلات لزيادة الكفاءة.

تستند الفكرة إلى مبدأ Kevin في استخدام كلمات قليلة لأداء غرض الكلمات الكثيرة. تتحول الردود من لغة إنجليزية مطولة وصعبة القراءة إلى نقاط مباشرة وموجزة. يدعم هذا النظام منصات متعددة مثل Claude وCodex مع توفير إضافات مخصصة لمهام برمجية محددة.

مقارنة الأداء بين الرد التقليدي ورد Caveman

  • يتجنب رد Caveman عبارات التمهيد والتحذيرات اللغوية الزائدة للوصول إلى الصلب التقني مباشرة.
  • تستبدل المهارة الجمل النثرية المعتادة برموز منطقية مثل الأسهم لوصف تدفق العمليات.
  • تركز المخرجات على المعلومات الفنية البحتة دون الاهتمام بقواعد اللغة الإنجليزية التقليدية أو صياغة الجمل.

عند اختبار شرح نظام مصادقة في تطبيق Next.js، قدم Claude التقليدي مقدمات حول طبيعة النظام الوهمي وتفاصيل أمنية غير ضرورية. في المقابل، قدمت مهارة Caveman وصفاً فورياً مثل "مصادقة جانب العميل، لا أمان حقيقي" واستخدمت الأسهم لتمثيل خطوات تحميل التطبيق والتحقق من التخزين المحلي.

تحليل التكلفة واستهلاك الرموز (Tokens)

  • تحقق مهارة Caveman انخفاضاً بنسبة 45% في رموز المخرجات مقارنة بالوضع الافتراضي و39% مقارنة بطلب الإيجاز التقليدي.
  • تستهلك المهارة رموز مدخلات أكثر في البداية بسبب تحميل ملف التعريف (Markdown) الخاص بها.
  • تتفوق المهارة اقتصادياً عند استخدام الأسئلة المتتابعة بفضل تقنية تخزين المطالبات المؤقت.

تظهر البيانات أن تكلفة مخرجات Caveman تبلغ حوالي 4 سنتات مقابل 8 سنتات للرد العادي. رغم أن المدخلات قد تكون أغلى بنسبة 10% في المطالبات الفردية البسيطة، إلا أن التوفير الحقيقي يظهر في المحادثات الطويلة. أثبتت الدراسات أيضاً أن هذا الأسلوب يرفع دقة الاستجابة بنسبة 26% نتيجة تقليل التشتت اللغوي.

قواعد التخصيص وأوضاع الكثافة المختلفة

  • تتضمن القواعد الأساسية حذف أدوات التعريف، والمجاملات، ولغة التحوط، واستخدام مرادفات قصيرة.
  • تتدرج مستويات الكثافة من الخفيف (Light) إلى الفائق (Ultra) الذي يجرد حتى حروف العطف.
  • توجد مهارات فرعية متخصصة مثل caveman commit للرسائل البرمجية وcaveman review لمراجعة الأكواد.

تفرض المهارة هيكلية محددة للمخرجات تعتمد على ترتيب: الشيء، ثم الإجراء، ثم السبب، ثم الخطوة التالية. تتيح حزمة مهارات Vercel تشغيل هذه الأوامر وتخصيصها لسيناريوهات مثل ضغط ملفات اللغة الطبيعية. يبرز وضع wenyan كخيار أقصى للكفاءة عبر استخدام الرموز الصينية الكلاسيكية لتمثيل المفاهيم بأقل عدد من الرموز.

Community Posts

View all posts