Log in to leave a comment
No posts yet
الذكاء الاصطناعي متسامح مع الكود الذي يكتبه بنفسه. بالنظر إلى بيانات SWE-bench (Verified) التي كشفت عنها شركة Anthropic، نجد أن معدل نجاح وكلاء البرمجة في التصحيح الفعلي يتجاوز 80%، لكنهم لا يزالون يفتقدون الحالات الحوافية (Edge Cases) الدقيقة التي تحدث في منطق الأعمال المعقد. حتى لو حكم النموذج على نفسه بالكمال، فغالبًا ما تظهر أخطاء عند التشغيل الفعلي. لكسر هذه النقطة العمياء الذكية، يجب استخدام Claude 3.7 Sonnet كمنفذ رئيسي، مع فصل OpenAI o1 أو Codex ليعملا كمراجعين خصوم (Adversarial Reviewers).
يرتفع معدل اكتشاف الأخطاء عندما يتغير منظور التحقق من "التأكيد" إلى "النفي". أنا أقوم بإنشاء ملف AGENTS.md في جذر المشروع لفرض الأدوار.
.claude-codex-config و AGENTS.md في جذر المشروع.AGENTS.md على أنها "مهندس أمن أقدم ناقد يحصل على مكافأة في كل مرة يجد فيها ثغرة منطقية". اطلب منه إلغاء المديح والتركيز فقط على نقاط الضعف.alias codex-audit='codex --full-auto --prompt "$(cat AGENTS.md)"'codex-audit فورًا لفرض المراجعة الخصمية.عند اعتماد هذا البروتوكول، ستتمكن من حل مشكلة "الموضوعية الذاتية" التي يسهل الوقوع فيها عند التطوير بمفردك من خلال النظام. ستختبر بالفعل تقليل الوقت المستغرق في تصحيح الأخطاء (Debugging) بمقدار 5 ساعات أو أكثر أسبوعيًا.
يتمتع Claude 3.7 بفهم عالٍ للبنية التحتية، لكن تكلفة الرموز (Tokens) باهظة. إن قيام المطور الفردي بإنفاق مبالغ كبيرة على النماذج عالية التكلفة لكل عمليات التحقق يعد مخاطرة تشغيلية. أنت بحاجة إلى هندسة اقتصادية تختار فقط التغييرات لمراجعتها. يتميز Codex بسرعة المعالجة وهو مثالي للتحقق من المنطق البسيط.
لا ترسل قاعدة الكود الكاملة، بل ركز المراجعة فقط على المناطق المعدلة. سيوفر لك هذا أكثر من 70% من استهلاك الرموز.
git add لوضع التعديلات في منطقة الانتظار (Staging).git diff --cached | codex-audit لإرسال قطع الكود (Chunks) المتغيرة فقط إلى Codex.هذه هي الطريقة لخفض الإنفاق الشهري على واجهة برمجة التطبيقات (API) إلى النصف مع الحفاظ على كثافة التحقق بمستوى مطور أقدم.
كسر منطق الدفع في SaaS يعني إعلان وفاة الخدمة. Claude قوي في التنفيذ، لكنه قد يغفل أحيانًا عن التحقق الصارم في بيئة التيرمينال الأصلية. يجب منع حالات السباق (Race Conditions) والثغرات الأمنية باستخدام شبكة أمان ثلاثية المراحل تجمع بين نقاط قوة النموذجين.
فيما يلي الإجراءات المتبعة للتعامل مع سير العمل الحساس أمنيًا:
يمسك هذا الروتين بأخطاء معالجة الدفع المكررة أو تجاوز الصلاحيات التي يرتكبها المطورون المبتدئون عادةً قبل النشر.
تنهال وكلاء الذكاء الاصطناعي أحيانًا بملاحظات تافهة حول أسلوب الكتابة (Nitpick)، مما يسبب تعبًا من التنبيهات وإرهاقًا للمطور. يمكنك زيادة الإنتاجية بنسبة 30% بمجرد التخلص من التذمر غير الضروري والتركيز على العيوب الجوهرية. تحتاج ملاحظات الذكاء الاصطناعي إلى تصنيف.
بهذه الأتمتة، كأنك تملك مراجع كود يعمل على مدار 24 ساعة. تختفي المخاطر المزمنة للمطور الفردي الذي يتخذ القرارات وحده ويشعر بالقلق وحده، وبالمقابل، يرتفع مستوى جودة الكود بشكل طبيعي.