Log in to leave a comment
No posts yet
यह वह युग है जहाँ AI एजेंट कोड लिखते हैं और इंफ्रास्ट्रक्चर तैयार करते हैं। लेकिन क्षेत्र के डेवलपर्स अभी भी असुरक्षित महसूस करते हैं। ऐसा इसलिए है क्योंकि एक एजेंट जो अभी कुछ समय पहले तक परफेक्ट था, अचानक अजीब जवाब देने लगता है या स्पष्ट रूप से निर्देश दिए गए टूल्स को अनदेखा कर देता है।
Vercel AI SDK टीम के हालिया प्रयोगों के परिणाम चौंकाने वाले हैं। जब AI एजेंटों को टूल चुनने का अधिकार, यानी 'स्किल्स' (Skills) सौंपे गए, तो विफलता दर (Failure Rate) 56% तक पहुँच गई। यह मॉडल की बुद्धिमत्ता की समस्या नहीं है। यह इस बात का प्रमाण है कि जिस तरह से हम AI को जानकारी प्रदान कर रहे हैं, वह मौलिक रूप से गलत है। एजेंट की सफलता दर को 100% तक ले जाने का रहस्य अधिक टूल्स जोड़ना नहीं, बल्कि agents.md पर आधारित 'पर्सिस्टेंट कॉन्टेक्स्ट' (Persistence Context) रणनीति में है।
कई डेवलपर्स एजेंट को विभिन्न टूल कॉलिंग फ़ंक्शन देते हैं और उम्मीद करते हैं कि AI आवश्यकता पड़ने पर स्वयं उनका उपयोग करेगा। हालाँकि, इस पद्धति में 'निर्णय शोर' (Decision Noise) नामक एक घातक कमजोरी है।
AI मॉडल की कॉन्टेक्स्ट विंडो इंसान की शॉर्ट-टर्म मेमोरी की तरह होती है। यदि बातचीत 5 बार से अधिक होती है, तो शुरुआती सिस्टम प्रॉम्प्ट में लिखे निर्देश प्राथमिकता खो देते हैं। इसे 'कॉन्टेक्स्ट डिके' कहा जाता है। एजेंट हर पल इस दुविधा में रहता है कि क्या मुझे अभी टूल का उपयोग करना चाहिए या बस अपनी जानकारी के आधार पर उत्तर देना चाहिए। यह निर्णय बिंदु ही विफलता का कारण बनने वाला 'सिंगल पॉइंट ऑफ फेलियर' बन जाता है।
56% विफलता दर को 0% में बदलने का समाधान सरल है। एजेंट को विकल्प देने के बजाय, प्रोजेक्ट के मुख्य नियमों और जानकारी को सिस्टम प्रॉम्प्ट में स्थिर (Fix) कर दें। इसके केंद्र में agents.md फ़ाइल है।
Vercel के बेंचमार्क के अनुसार, जब वही जानकारी टूल के रूप में प्रदान की गई तो सफलता दर 79% थी, लेकिन जब इसे agents.md में इंडेक्स के रूप में सीधे शामिल किया गया, तो सफलता दर 100% रही।
| विश्लेषण संकेतक | टूल कॉलिंग पद्धति (Skills) | पर्सिस्टेंट कॉन्टेक्स्ट (agents.md) |
|---|---|---|
| निर्णय लेना | एजेंट हर बार लोड करने का निर्णय लेता है | जानकारी हमेशा सिस्टम में मौजूद रहती है |
| विश्वसनीयता | लगभग 53% ~ 79% (अस्थिर) | अधिकतम 100% प्राप्त करना संभव |
| रीजनिंग लोड | निर्णय शोर के कारण उच्च लोड | निर्णय प्रक्रिया छोड़ने के कारण कम लोड |
| विशेषता | ऑन-डिमांड पद्धति | पैसिव पद्धति |
प्रदर्शन को अधिकतम करने के लिए, agents.md को केवल एक टेक्स्ट फ़ाइल के रूप में नहीं, बल्कि मशीनों के लिए एक README के रूप में डिज़ाइन किया जाना चाहिए।
अमूर्त सिद्धांतों की तुलना में विशिष्ट निषेध (Prohibitions) एजेंट के आउटपुट की गुणवत्ता को तुरंत बढ़ाते हैं। उदाहरण के लिए, यह स्पष्ट निर्देश देना कि "MUI v3 का उपयोग करें और स्टेट मैनेजमेंट के लिए अनिवार्य रूप से Jotai का उपयोग करें" आवश्यक है। एजेंट को भटकने से रोकने के लिए निर्देश दें कि कभी भी alert() का उपयोग न करें और इसके बजाय विशिष्ट लाइब्रेरी के घटकों का उपयोग करें।
एजेंट को पूरी रिपॉजिटरी को स्कैन करके टोकन बर्बाद नहीं करने देना चाहिए। मुख्य फ़ाइल स्थानों को एक मिनी इंडेक्स के रूप में प्रदान किया जाना चाहिए। एक स्पष्ट मानचित्र तैयार किया जाना चाहिए कि बिल्ड के समय pnpm का उपयोग करना है या नहीं, और रूट फ़ाइलें और स्कीमा फ़ाइलें कहाँ स्थित हैं।
यदि फ़ाइल बहुत बड़ी हो जाती है, तो प्रदर्शन वास्तव में गिर जाता है। Vercel 40KB के दस्तावेज़ को 8KB तक संपीड़ित (Compress) करके इंडेक्स करने की सलाह देता है। मुख्य बात एजेंट को ज्ञान सीधे खिलाने के बजाय उस ज्ञान तक पहुँचने के पथ को अनुकूलित (Optimize) करके देना है।
जैसे कोड में तकनीकी ऋण जमा होता है, वैसे ही AI के उपयोग में 'प्रॉम्प्ट ऋण' जमा होता है। यदि टीम के प्रत्येक सदस्य द्वारा एजेंट को दिए गए निर्देश अलग-अलग हैं, तो आउटपुट की निरंतरता टूट जाएगी। agents.md को प्रोजेक्ट रूट में रखकर और Git के माध्यम से प्रबंधित करके, वर्ज़न कंट्रोल एकीकृत हो जाता है और टीम के मानक दिशानिर्देशों को समान रूप से लागू किया जा सकता है, चाहे किसी भी मॉडल का उपयोग किया जाए।
AI एजेंट के युग में, जीत-हार मॉडल की बुद्धिमत्ता के बजाय कॉन्टेक्स्ट इंजीनियरिंग से तय होती है। एजेंट के अधिक स्मार्ट होने का इंतज़ार करने के बजाय, ऐसा वातावरण बनाना उत्पादकता बढ़ाने का सबसे निश्चित तरीका है जहाँ एजेंट गलती न कर सके। अभी अपने प्रोजेक्ट रूट में agents.md बनाएँ और अपनी टीम के नियमों को संहिताबद्ध (Codify) करना शुरू करें।