Log in to leave a comment
No posts yet
सॉफ्टवेयर इंजीनियरिंग का प्रतिमान (paradigm) बदल रहा है। Anthropic के शोधकर्ता Nicholas Carlini द्वारा संचालित इस परियोजना ने केवल AI से कोडिंग नहीं करवाई है। 16 Claude Opus 4.6 इंस्टेंस का उपयोग करके, मानवीय हस्तक्षेप को न्यूनतम रखते हुए शून्य से Rust-आधारित C कंपाइलर का निर्माण किया गया है।
यह परिणाम 100,000 लाइनों के कोड से बना है, जिसने Linux 6.9 कर्नल को सफलतापूर्वक बिल्ड किया और क्लासिक गेम Doom को चलाया। लेकिन शानदार प्रदर्शन से कहीं अधिक महत्वपूर्ण 20,000 डॉलर (लगभग 17 लाख रुपये) की API लागत निवेश करके खोजी गई एजेंटिक वर्कफ़्लो की सीमाएँ और संभावनाएँ हैं। यह केवल प्रॉम्प्ट लिखने के स्तर से ऊपर उठकर, AI को सिस्टम के रूप में कैसे नियंत्रित और सहयोग कराया जाए, इसकी इंजीनियरिंग वास्तविकता की पड़ताल करता है।
जटिल सिस्टम प्रोग्रामिंग में, एक अकेला एजेंट जल्द ही कॉन्टेक्स्ट विंडो की सीमाओं से टकरा जाता है। ऐसा इसलिए है क्योंकि समय बीतने के साथ, पिछले संवाद रिकॉर्ड वर्तमान निर्णय को धुंधला कर देते हैं, जिससे मतिभ्रम (hallucination) की स्थिति पैदा होती है। Carlini ने इसे हल करने के लिए 16 स्वतंत्र Docker कंटेनरों के साथ RALF (Refresh, Act, Learn, Feedback) लूप पेश किया।
README.md में रिकॉर्ड किया जाता है और ज्ञान को सिंक्रनाइज़ करने के लिए Git पर पुश किया जाता है।जब 16 एजेंट एक साथ तैनात किए जाते हैं, तो सबसे बड़ा जोखिम संसाधनों की बर्बादी का होता है। यदि दो एजेंट एक ही बग को ठीक करने की कोशिश करते हैं, तो कोड टकराव के साथ-साथ API लागत भी दोगुनी हो जाएगी। Carlini ने किसी अलग जटिल डेटाबेस के बजाय Git रिपॉजिटरी के भीतर टेक्स्ट फ़्लैग का उपयोग करके एक हल्का लॉकिंग (Locking) मैकेनिज्म लागू किया।
एजेंट किसी विशिष्ट कार्य को शुरू करने से पहले current_tasks/ निर्देशिका में कार्य के नाम के समान एक फ़ाइल बनाते हैं। Git की परमाणु कमिट (atomic commit) प्रकृति के कारण, उसी फ़ाइल को बनाने का प्रयास करने वाले किसी अन्य एजेंट के पुश को अस्वीकार कर दिया जाता है। इस सरल प्रणाली ने एजेंटों के बीच रेस कंडीशन (Race Condition) को पूरी तरह से रोक दिया।
इस परियोजना का मुख्य आकर्षण मौजूदा टूल GCC को ओरेकल (Oracle) के रूप में उपयोग करना था। AI को सही उत्तर का अनुमान लगाने देने के बजाय, यह व्यवस्थित रूप से सही उत्तर को लागू करने की रणनीति है। विशाल Linux कर्नल बिल्ड में त्रुटि होने पर, Carlini ने बाइनरी सर्च (Binary Search) एल्गोरिदम को स्वचालित किया।
उपलब्धियां प्रभावशाली थीं, लेकिन निर्मित कंपाइलर का प्रदर्शन GCC के निम्नतम अनुकूलन स्तर (-O0) तक भी नहीं पहुँच सका। Claude एजेंट सेना ने निम्नलिखित उच्च-स्तरीय इंजीनियरिंग क्षेत्रों में सीमाएं दिखाईं:
एक इंजीनियरिंग मैनेजर के दृष्टिकोण से, 20,000 डॉलर बिल्कुल भी महंगा नहीं है। ऐसा इसलिए क्योंकि जिस कार्य को पूरा करने में 5 विशेषज्ञों की टीम को 3 महीने से अधिक समय लगता, उसे केवल 2 सप्ताह में पूरा कर लिया गया। यह पारंपरिक श्रम लागत की तुलना में 10 गुना अधिक लागत-प्रभावशीलता सिद्ध करता है। यदि कोई कंपनी इस मॉडल को अपनाना चाहती है, तो उसे इस निर्णय वृक्ष (decision tree) का पालन करना चाहिए।
| प्रश्न | हाँ | नहीं |
|---|---|---|
| क्या आउटपुट को परीक्षणों के माध्यम से निष्पक्ष रूप से सत्यापित किया जा सकता है? | अगले चरण पर जाएँ | अपनाने के लिए अनुपयुक्त (मतिभ्रम का जोखिम) |
| क्या कोई तुलनीय मौजूदा उपकरण (ओरेकल) उपलब्ध है? | ओरेकल रणनीति अपनाएं | निरंतर मानवीय निगरानी आवश्यक |
| क्या कार्य को 100 या अधिक इकाइयों में विभाजित किया जा सकता है? | समानांतर एजेंट संचालन | एकल एजेंट की सिफारिश |
progress.json आदि में प्रगति रिकॉर्ड करना अनिवार्य करें।Anthropic का यह प्रयोग दर्शाता है कि इंजीनियर की भूमिका कोड लेखक से सिस्टम डिज़ाइनर और ऑडिटर की ओर स्थानांतरित हो गई है। अब महत्वपूर्ण क्षमता स्वयं एल्गोरिदम लिखने की नहीं, बल्कि तार्किक बाधाओं और सत्यापन हार्नेस को डिज़ाइन करने की है ताकि AI एजेंटों की सेना पटरी से न उतरे।
20,000 डॉलर की लागत केवल एक खर्च नहीं है, बल्कि एक मील का पत्थर है जो दिखाता है कि परिष्कृत मानवीय डिज़ाइन द्वारा समर्थित होने पर AI स्वचालन की किस सीमा तक पहुँच सकता है। कंपनियों को अब केवल AI की स्वायत्तता में नहीं खोना चाहिए, बल्कि मानवीय रणनीतिक संचालन (steering) को व्यवस्थित करने पर ध्यान केंद्रित करना चाहिए।