Log in to leave a comment
No posts yet
العادة في الطلب بتهذيب من الذكاء الاصطناعي تجعل محفظتك نحيفة. تعبيرات مثل "من فضلك" أو "أرجو القيام بـ" ليست سوى ضجيج لا معنى له بالنسبة للنموذج، وتتحول مباشرة إلى تكاليف حوسبة. وفقًا لأبحاث إطار عمل KERNEL، عندما تمت إزالة هذه المحسنات اللغوية واستخدام بنية أمرية حازمة، قفزت نسبة نجاح المحاولة الأولى من 72% إلى 94%. كما انخفضت توكنات الإدخال بنسبة تقارب 70%. لا حاجة لبناء تواصل عاطفي مع النموذج؛ فسطر واحد من التعليمات الواضحة يسرع الاستجابة بمقدار 3 مرات أكثر من شرح خلفية الموضوع في 500 حرف.
من خلال هذا التغيير، تنخفض التكلفة لكل 1000 استدعاء من 0.267 دولار إلى 0.081 دولار. لا يوجد سبب لعدم القيام بذلك، حيث ستوفر المال وتقلل من احتمالية هذيان النموذج.
لا تمنح النموذج حرية التصرف عند استخراج البيانات من النصوص غير المنظمة. ففي اللحظة التي يبدأ فيها النموذج بإضافة شروحات، ترتفع تكاليف توكنات المخرجات بشكل حاد. تذكر أن توكنات المخرجات أغلى بـ 5 مرات من توكنات الإدخال. قام مشروع ProjectDiscovery بتقليل حجم المخرجات بنسبة تزيد عن 80% من خلال تبسيط نظام التصنيف. لا داعي لسماع كلمة "إيجابي" كاملة، فحرف "P" واحد يكفي.
باستخدام هذه الطريقة، سيتم تثبيت توكنات المخرجات عند 1 إلى 2 لكل استدعاء. ستختفي أخطاء التحليل وتتقلص التكلفة بنسبة تزيد عن 40%.
يمكن لميزة التخزين المؤقت للأوامر (Prompt Caching) في واجهة برمجة تطبيقات Claude تقليل تكاليف الإدخال بنسبة تصل إلى 90% إذا استُخدمت بشكل صحيح. ومع ذلك، وبما أن التخزين المؤقت يعتمد على مطابقة البيانات من البداية، فإن تغيير بايت واحد في المقدمة سيؤدي إلى فشل التخزين المؤقت. هناك حالات ارتفع فيها معدل نجاح التخزين المؤقت من 7% إلى 84% فقط عن طريق نقل البيانات الديناميكية إلى نهاية الأمر. مجرد تغيير الموقع يغير الأرقام في فاتورتك.
cache_control: {"type": "ephemeral"} مباشرة بعد القسم الثابت للإعلان عن نقطة التخزين المؤقت.التكلفة التي كانت 0.06 دولار لـ 20 ألف توكن تصبح 0.006 دولار عند استخدام التخزين المؤقت، أي العشر. بالنسبة للخدمات التي تتعامل مع وثائق ضخمة، فهذه هي النقطة التي يتغير فيها هيكل الربحية بالكامل.
عند حل المسائل المعقدة، إذا أمرت النموذج بـ "التفكير خطوة بخطوة (CoT)"، فسيقوم بسرد عمليات طويلة تشبه المذكرات اليومية. كل ذلك يمثل تكلفة. البديل هو Chain of Draft (CoD). اطلب من النموذج تدوين النقاط الرئيسية فقط باختصار، في حدود 5 كلمات، كما لو كان يدون ملاحظات.
في اختبارات الاستنتاج الحسابي، عندما استخدمت CoT نحو 172.5 توكن، حققت CoD نفس الإجابة الصحيحة باستخدام 31.3 توكن فقط.
يمكنك الحفاظ على الدقة مع تقليل توكنات المخرجات بنسبة تصل إلى 92%. كما يقل زمن تأخير الاستجابة إلى أقل من النصف.
كل هذه التحسينات لا معنى لها ما لم تكن مرئية. خدمة متجر إلكتروني تستدعي الواجهة 300 ألف مرة شهريًا، إذا دمجت التخزين المؤقت مع CoD، تنخفض التكلفة من 4,500 دولار إلى 660 دولارًا. هذا يعني تحقيق ربح تشغيلي بنحو 5 ملايين وون شهريًا بمجرد تعديل بضعة أسطر في الأوامر البرمجية.
.claudeignore لمنع تضمين الملفات غير الضرورية في السياق.$Cost = N \times (T_{in} \times P_{in} + T_{out} \times P_{out}) في جدول بيانات وراجع الأداء أسبوعيًا.امسح كلمة "شكراً" من أمر النظام اليوم وغير ترتيب البيانات. هذا المجهود البسيط سيحول فواتيرك الشهرية إلى أرباح.