Log in to leave a comment
No posts yet
Claude 3.5 Sonnet को बहुत ही विनम्रता के साथ प्रोग्राम किया गया है। यदि आप इसे बस "छोटा उत्तर दें" कहेंगे, तो भी यह शिष्टाचार निभाने के चक्कर में टोकन बर्बाद कर देता है। मॉडल अपने प्रॉम्प्ट के शुरुआती और अंतिम हिस्सों पर सबसे अधिक ध्यान केंद्रित करता है। इस विशेषता का उपयोग करें: सिस्टम संदेश के सबसे ऊपर उसे एक 'आदिमानव इंजीनियर' (Caveman Engineer) का व्यक्तित्व (Persona) दें, और सबसे नीचे यह स्पष्ट रूप से लिखें कि अभिवादन और सारांश देना वर्जित है। निर्देशों को अंत में एक बार फिर दोहराने मात्र से आप प्रति API कॉल पर टोकन लागत को तुरंत 30% तक बचा सकते हैं।
आउटपुट कम करने का मतलब यह नहीं है कि आपको मॉडल की बुद्धिमत्ता से समझौता करना होगा। जटिल लॉजिक वाले कोड लिखते समय <thinking> टैग का उपयोग करें। मॉडल को अपनी विचार प्रक्रिया इस आंतरिक टैग के भीतर विस्तार से चलाने दें, लेकिन अंतिम परिणाम देने वाले <answer> टैग में 'Caveman' शैली लागू करें। 2026 के आंकड़ों के अनुसार, Claude 4.6 Sonnet मॉडल Opus मॉडल की तुलना में केवल 30% लागत पर उच्च सफलता दर (Pass rate) प्रदान करता है। विचार प्रक्रिया को सस्ते 'कैशिंग टोकन' (Caching tokens) से संभालें और महंगे 'आउटपुट टोकन' को केवल मुख्य कोड पर केंद्रित करें। इससे सटीकता और किफ़ायत दोनों एक साथ हासिल होती हैं।
जब आप मॉडल को 'आदिमानव' की तरह बोलने के लिए कहते हैं, तो कभी-कभी यह JSON सिंटैक्स बिगाड़ देता है या ज़रूरी इंपोर्ट (Import) स्टेटमेंट छोड़ देता है। एक स्वतंत्र डेवलपर के लिए ऐसी पार्सिंग त्रुटियां मैनुअल सुधार की लागत बढ़ाती हैं। सिस्टम प्रॉम्प्ट में ---BEGIN JSON--- जैसे विभाजकों (Delimiters) के उपयोग को अनिवार्य करें, और पायथन के re मॉड्यूल का उपयोग करके मार्कडाउन कोड फेंस को हटाने वाला एक पोस्ट-प्रोसेसिंग स्क्रिप्ट पाइपलाइन में जोड़ें। यह एक सुरक्षा उपाय ऑटोमेशन प्रक्रिया में मानवीय हस्तक्षेप को 90% से अधिक कम कर देता है।
2026 तक, Claude 3.5 Sonnet के आउटपुट टोकन की कीमत 15.00 डॉलर प्रति 1 मिलियन टोकन है। यह इनपुट की तुलना में 5 गुना महंगा है। एक डेवलपर जो रोज़ाना 100 कोडिंग अनुरोध करता है, यदि वह 'Caveman' मोड लागू करता है, तो वह अपने मासिक खर्च को 54 डॉलर से घटाकर लगभग 31 डॉलर तक ला सकता है। कार्य की प्रकृति के अनुसार इसकी तीव्रता को समायोजित करें। साधारण सुधारों के लिए 'Lite' और बड़े डेटा रूपांतरण के लिए 'Ultra' मोड में टेम्प्लेट विभाजित करें। प्रॉम्प्ट को ठीक करने में मात्र 15 मिनट का निवेश आपको सालाना 276 डॉलर बचा सकता है। एक कुशल इंजीनियर AI के साथ लंबी बातचीत नहीं करता; वे केवल आवश्यक जानकारी की सटीकता निकालते हैं।