ऑटोनॉमस कोडिंग एजेंटों द्वारा बजट खत्म करने से पहले इंस्टॉल किए जाने वाले सुरक्षा उपाय
2026년 5월 14일
0
Computing/SoftwareComments (0)
Log in to leave a comment
No posts yet
Log in to leave a comment
No posts yet
यदि आपने कभी स्थानीय वातावरण (local environment) में Codex जैसे ऑटोनॉमस एजेंट को चलाया है, तो आपने उस डर का अनुभव किया होगा जिससे हर कोई गुजरता है। यह वह स्थिति है जब आप सोकर उठते हैं और पाते हैं कि एजेंट एक अनंत लूप (infinite loop) में फंस गया है, जिससे API लागत में सैकड़ों डॉलर का नुकसान हुआ है, या उसने मौजूदा अच्छी तरह से काम कर रही कोड फाइलों को पूरी तरह से गड़बड़ कर दिया है। 2026 के एजेंटिक ऑर्केस्ट्रेशन अनुसंधान डेटा के अनुसार, स्पष्ट नियंत्रण तंत्र के बिना एजेंटों की सफलता दर जटिल समस्याओं को हल करते समय 48.8% से गिरकर सीधे 28% पर आ जाती है। समस्या केवल एक स्मार्ट मॉडल का उपयोग करने की नहीं है, बल्कि एक ऑपरेटिंग प्रोटोकॉल के माध्यम से सुरक्षा घेरा (guardrails) बनाने की है ताकि एजेंट अपनी मर्जी से अनियंत्रित न हो जाए।
जैसे-जैसे चरण जटिल होते जाते हैं, AI एजेंट भूलने लगते हैं कि उन्होंने पिछले चरण में क्या किया था। इसका कारण ट्रांसफॉर्मर मॉडल की कॉन्टेक्स्ट विंडो की सीमाएं हैं। इसे रोकने के लिए, एजेंट को हर लूप में प्रोजेक्ट रूट की recovery_log.md फ़ाइल में अपनी स्थिति को भौतिक रूप से लिखने के लिए मजबूर करें।
इस फ़ाइल में वर्तमान में संसाधित किए जा रहे सब-टास्क का नाम, हाल ही में संशोधित 10 फ़ाइल पाथ और अंतिम निष्पादन परीक्षण का त्रुटि संदेश (error message) अनिवार्य रूप से शामिल होना चाहिए। इस तरह का रिकॉर्ड रखने से, एजेंट के रुकने पर आपको शुरू से सब कुछ समझाने की आवश्यकता नहीं होती है। "लॉग पढ़ें और जहाँ रुके थे वहीं से फिर से शुरू करें" जैसा एक लाइन का कमांड वॉर्म स्टार्ट (warm start) को संभव बनाता है। वास्तविक उद्योग डेटा के अनुसार, यह विधि मैन्युअल हस्तक्षेप के समय को 30% से अधिक कम कर देती है।
OpenAI या Anthropic के डैशबोर्ड को अपडेट होने में 20 मिनट तक का समय लग सकता है। इसका मतलब है कि जब तक आपको पता चलेगा कि एजेंट पागल हो गया है और टोकन खर्च कर रहा है, तब तक बहुत देर हो चुकी होगी। आपको स्थानीय स्तर पर 10 मिनट के अंतराल पर संचयी लागत की जाँच करने वाली budget_monitor.sh स्क्रिप्ट खुद चलानी चाहिए।
GPT-5.5 श्रेणी के मॉडल की आउटपुट लागत प्रति 1M टोकन लगभग 75 डॉलर है। अपने वॉलेट की सुरक्षा के लिए, स्क्रिप्ट में निम्नलिखित लॉजिक डालें। API अनुरोधों के इनपुट/आउटपुट टोकन को इंटरसेप्ट करके उनका योग करें, और जैसे ही वे निर्धारित सीमा तक पहुँचें, एजेंट प्रोसेस को तुरंत SIGTERM सिग्नल भेजें। प्रोसेस समाप्त करने से पहले, यह सुनिश्चित करें कि वह कार्य सारांश रिपोर्ट (task summary report) तैयार करे। जब आपको यह विश्वास होगा कि आपके अनुपस्थित रहने पर भी एजेंट आपके द्वारा निर्धारित बजट के भीतर ही काम करेगा, तभी आप प्रोजेक्ट को जारी रख पाएंगे।
एजेंट द्वारा लिखा गया कोड पूरे सिस्टम को बर्बाद करने में केवल एक पल लेता है। इससे पहले कि एजेंट अगले चरण पर जाए, उसे स्वयं verify_goal.py चलाने और यूनिट टेस्ट पास करने के लिए कहें। 2026 के विकास आंकड़ों के अनुसार, जिन परियोजनाओं ने इस तरह के स्वचालित सत्यापन लूप को अपनाया, उनमें तैनाती (deployment) के बाद दोष दर में 7.2% की कमी आई।
इसके अलावा, AGENTS.md जैसी कॉन्फ़िगरेशन फ़ाइल बनाएं और उन डायरेक्टरी की सीमा को स्पष्ट रूप से सीमित करें जिन्हें एजेंट संशोधित कर सकता है। एजेंट को महत्वपूर्ण एनवायरनमेंट सेटिंग्स या DB स्कीमा फ़ाइलों को अपनी इच्छानुसार बदलने से रोककर ही आप डिबगिंग के आधे तनाव को दूर कर सकते हैं। एजेंट को एक सक्षम सहायक होना चाहिए, घर के मालिक की तरह व्यवहार नहीं करना चाहिए।
जब एजेंट काम पूरा कर लेता है या बजट की समस्याओं के कारण रुक जाता है, तो उसे बस बंद नहीं होने देना चाहिए। उसे handover_report.txt लिखने के लिए कहें। इसमें पूरे किए गए कार्य, अधूरे कार्य और अगले निष्पादन के समय दर्ज किए जाने वाले विशिष्ट पैरामीटर मान शामिल होने चाहिए।
यह मनुष्यों के बीच हैंडओवर की तरह ही है। "मैंने यहाँ तक काम किया है, और आगे आपको यह करना है" जैसा नोट रहने से अगले सत्र में दोहराव वाले काम से बचा जा सकता है और पैसा बचाया जा सकता है। एजेंट की स्वायत्तता (autonomy) भरोसे पर नहीं, बल्कि गहन रिकॉर्डिंग और निगरानी के आधार पर ही सुरक्षित रूप से काम करती है।