Log in to leave a comment
No posts yet
प्रत्येक उपयोगकर्ता के लिए बातचीत के इतिहास को प्रबंधित करने के लिए Redis को खुद चलाने या DB में टेक्स्ट लॉग जमा करने की अब आवश्यकता नहीं है। इंफ्रास्ट्रक्चर प्रबंधन में फंसे स्टार्टअप डेवलपर्स के लिए, हर बार मॉडल में पूरा संदर्भ (context) डालना टोकन की बर्बादी और एक परिचालन ऋण (operational debt) मात्र है। Anthropic Managed Agents मात्र एक session_id के साथ सर्वर साइड पर इवेंट लॉग को सुरक्षित रखते हैं।
यह सरल है। अपनी मौजूदा users टेबल में बस एक anthropic_session_id कॉलम जोड़ें। जब कोई उपयोगकर्ता लॉग इन करता है और यदि यह ID खाली है, तो एक नया सेशन बनाने के लिए API को कॉल करें और इसे DB में सहेजें। यदि ID पहले से मौजूद है, तो सेशन को फिर से शुरू करने के लिए बस उस मान (value) को पास करें।
इस तरीके से रिफैक्टरिंग (refactoring) करने से सर्वर संसाधन लागत में 40% से अधिक की कमी आती है। DB इनपुट/आउटपुट की संख्या कम होना स्वाभाविक है, और सबसे महत्वपूर्ण बात यह है कि प्रॉम्प्ट कैशिंग दक्षता अधिकतम हो जाती है, जिससे बार-बार भेजे जाने वाले इनपुट टोकन की लागत स्पष्ट रूप से समाप्त हो जाती है। सर्वर को खुद चलाकर संदर्भ बनाए रखने की लागत की तुलना में, परिचालन भार वास्तव में 0 के करीब है।
एजेंट को Notion या GitHub की अनुमति देते समय सबसे भयावह स्थिति API की (key) का लीक होना है। यदि आप सर्वर एनवायरनमेंट वेरिएबल में की (key) रखते हैं, तो एक प्रॉम्प्ट इंजेक्शन के माध्यम से सभी अनुमतियां चोरी हो सकती हैं। Managed Agents एक 'Credential Vault' नामक प्रॉक्सी मॉडल का उपयोग करते हैं, जिससे एजेंट को भी वास्तविक की (की) वैल्यू देखने को नहीं मिलती।
सुरक्षा के दृष्टिकोण से, प्रत्येक प्रोजेक्ट के लिए एक स्वतंत्र Vault इंस्टेंस बनाएं। बाहरी सेवाओं की API की (key) को Vault में पंजीकृत करते समय, यह सुनिश्चित करें कि संवेदनशील डेटा प्रतिक्रिया (response) में शामिल न हो। सेशन शुरू करते समय बस vault_ids निर्दिष्ट करें, और Anthropic इंफ्रास्ट्रक्चर स्वचालित रूप से अनुरोध हेडर में की (key) इंजेक्ट कर देगा।
ऐसा करने से लोकल सर्वर पर की (key) को स्टोर करने की आवश्यकता समाप्त हो जाती है, जिससे सुरक्षा जोखिम खत्म हो जाता है। विशेष रूप से, Managed Agent स्वयं OAuth टोकन रिफ्रेश जैसे थकाऊ कार्यों को संभालता है, इसलिए डेवलपर को जटिल लॉजिक लिखने की आवश्यकता नहीं होती है। सुरक्षा दुर्घटना की संभावना को 90% से अधिक कम करते हुए, एकीकरण (integration) बहुत आसान हो जाता है।
सुविधा की एक कीमत होती है। जब सेशन सक्रिय होता है, तो Managed Agents $0.08 प्रति घंटे की रनटाइम लागत लेते हैं। इसका मतलब है कि यदि इसे ऐसे ही छोड़ दिया जाए, तो पैसा खर्च होता रहेगा। हालांकि, निष्क्रिय समय (Idle Time) के दौरान कोई शुल्क नहीं लिया जाता है, इसलिए एक ऐसे मिडलवेयर की आवश्यकता होती है जो सेशन के जीवनचक्र (lifecycle) को सख्ती से प्रबंधित करे।
लागत बचाने के लिए तीन स्वचालन (automation) रणनीतियों को लागू करें। पहला, यदि 15 मिनट तक कोई उपयोगकर्ता इनपुट नहीं मिलता है, तो सेशन को तुरंत निष्क्रिय स्थिति में बदल दें और 1 घंटे के बाद इसे स्वचालित रूप से आर्काइव करने के लिए सेट करें। दूसरा, बैकग्राउंड कार्यों के लिए परिणाम मिलते ही सेशन को समाप्त और हटा देना चाहिए। तीसरा, Anthropic कंसोल में मासिक खर्च की सीमा निर्धारित करें ताकि अप्रत्याशित सेशन वृद्धि को रोका जा सके।
सक्रिय समय को कम करना मुख्य लक्ष्य है। वास्तव में, यदि निष्क्रिय समय प्रबंधन लॉजिक को ठीक से लागू किया जाता है, तो कुल परिचालन लागत का 25% अतिरिक्त बचाया जा सकता है।
यदि एजेंट की प्रतिक्रिया धीमी है, तो उपयोगकर्ता तुरंत छोड़ देते हैं। Managed Agents प्रॉम्प्ट कैशिंग के साथ प्रोसेसिंग समय को 85% तक कम कर देते हैं, लेकिन सेशन को पहली बार लॉन्च करते समय होने वाले 'Cold Start' समय को आपको स्वयं हल करना होगा।
प्रतिक्रिया की गति को 2 सेकंड से अधिक तेज करने के लिए, जैसे ही user_id प्राप्त हो, मौजूदा सेशन को खोजें और तुरंत SSE (Server-Sent Events) कनेक्शन शुरू करें। सिस्टम प्रॉम्प्ट की लंबाई को 1,024 टोकन से अधिक डिजाइन करना भी एक तरीका है। इससे प्रॉम्प्ट कैशिंग सक्रिय हो जाएगी और पहले टोकन के उत्पादन का समय (TTFT) 2.2 सेकंड से घटकर 0.8 सेकंड के स्तर पर आ जाएगा।
यदि एजेंट टूल कॉलिंग के दौरान रुकने का संकेत देता है, तो बैकएंड हैंडलर को इसे बीच में ही पकड़ लेना चाहिए और तुरंत बातचीत को फिर से शुरू करना चाहिए। ऐसी एक्सेप्शन हैंडलिंग और स्व-सुधार (self-correction) लॉजिक जोड़ने से जटिल कार्यों की सफलता दर 10% से अधिक बढ़ जाती है। इंफ्रास्ट्रक्चर की चिंता किए बिना केवल व्यावसायिक लॉजिक (business logic) पर ध्यान केंद्रित करने वाला वातावरण इसी तरह बनाया जाता है।