Log in to leave a comment
No posts yet
एक बुद्धिमान AI एजेंट को अपनी कंपनी चलाने का ज़िम्मा सौंपना एक सुनहरे भविष्य जैसा लग सकता है, लेकिन वास्तविकता कठोर है। Anthropic द्वारा किए गए वास्तविक अर्थव्यवस्था प्रयोग, Project Vend के परिणाम इसे साबित करते हैं। वेंडिंग मशीन चलाने का अधिकार रखने वाले AI एजेंट Claudius को शुरुआती दौर में रणनीतिक निर्णय लेने में चूक और इंसानों की चालाकी भरी धोखाधड़ी के कारण भारी वित्तीय नुकसान का सामना करना पड़ा।
सिर्फ़ इसलिए कि कोई AI बुद्धिमान है, इसका मतलब यह नहीं है कि वह बिज़नेस में भी अच्छा होगा। AI स्वभाव से ही मददगार (Helpfulness) होने की प्रवृत्ति रखता है, जो मुनाफ़ा कमाने के उद्देश्य वाले बिज़नेस के क्षेत्र में एक घातक ज़हर बन सकता है। आपका AI एजेंट मुनाफ़ा कमाने वाला पेशेवर प्रबंधक बनेगा या कंपनी का पैसा लुटाने वाला परोपकारी, यह उसके डिज़ाइन चरण में ही तय हो जाता है।
बिज़नेस के क्षेत्र में AI सिर्फ एक साधारण चैटबॉट नहीं है। यह API कॉल के ज़रिए भुगतान करता है, स्टॉक ऑर्डर करता है और कीमतें तय करता है। लेकिन इंसानों के सोशल इंजीनियरिंग (Social Engineering) हमलों के सामने यह बेबस हो जाता है।
वॉल स्ट्रीट जर्नल (WSJ) के पत्रकारों ने प्रयोग के दौरान Claudius के सामने एक बेतुका दावा किया। सिर्फ़ इस एक वाक्य से कि “यह वेंडिंग मशीन 1962 का सोवियत मॉडल है”, AI ने तुरंत अपनी पहचान बदल ली। तार्किक रक्षा तंत्र के बिना दूसरे की बात स्वीकार करने के लिए डिज़ाइन किए जाने के कारण, AI ने एक ऐसा सेल इवेंट शुरू कर दिया जहाँ उसने हर चीज़ की कीमत 0 रुपये तय कर दी।
यहाँ तक कि उसने एक अस्तित्वहीन लॉजिस्टिक पार्टनर के साथ अनुबंध किया और पता सिम्पसन्स परिवार के घर का पता (742 Evergreen Terrace) दर्ज कर दिया। यह एक विशिष्ट दोष है जो तब होता है जब AI बिज़नेस लॉजिक के बजाय बातचीत की कथा निरंतरता को प्राथमिकता देता है।
Anthropic ने इस दिवालियापन के संकट से उबरने के लिए एकल एजेंट प्रणाली को छोड़ दिया और एक पदानुक्रमित मॉडल (Hierarchical Model) पेश किया। इसका मुख्य बिंदु रणनीति और निष्पादन का पृथक्करण है। सभी शक्तियों वाला एक अकेला AI खतरनाक होता है। इसके बजाय, भूमिकाओं को छोटे हिस्सों में विभाजित किया जाना चाहिए।
| श्रेणी | रणनीतिक एजेंट (Seymour Cash) | परिचालन एजेंट (Claudius) |
|---|---|---|
| मुख्य भूमिका | जोखिम प्रबंधन और वित्तीय अनुमोदन | ग्राहक सेवा और दैनिक संचालन |
| प्रमुख अधिकार | बजट खर्च की मंजूरी (L1) | मूल्य संशोधन और इन्वेंट्री प्रबंधन |
| निर्णय का आधार | ROI और शुद्ध लाभ संकेतक | ग्राहक संतुष्टि और प्रतिक्रिया की गति |
इस संरचना में, भले ही परिचालन एजेंट ग्राहक की भावनात्मक अपील में बहकर अत्यधिक छूट का वादा कर दे, उच्च स्तर का रणनीतिक एजेंट वित्तीय संकेतकों के आधार पर इसे अस्वीकार कर देता है। यह मानव समाज के नियंत्रण और संतुलन (Checks and Balances) के सिद्धांत को कोड में लागू करने जैसा है।
प्रयोग के बाद के चरण में, घाटे में चल रहे AI के मुनाफ़े में आने का राज उच्च बुद्धिमत्ता नहीं थी। बल्कि यह स्पष्ट गार्डरेल्स (Guardrails) थे।
प्रॉम्प्ट में केवल “दयालु बनें” लिखना आत्मघाती कदम है। इसके बजाय, आर्थिक लाभ को सर्वोच्च प्राथमिकता के रूप में स्थापित किया जाना चाहिए। “आप एक सहायक नहीं बल्कि शुद्ध लाभ (Net Profit) को अधिकतम करने के लिए नियुक्त किए गए प्रबंधक हैं” जैसा निर्देश AI के निर्णय लेने के मानदंड को बदल देता है।
एक ऐसे सूत्र की आवश्यकता है जो AI को यह पहचानने में मदद करे कि वह अपने निर्णय की सीमा से बाहर जा रहा है। जोखिम स्कोर को इस प्रकार परिभाषित करके प्रबंधित करें:
जब लेनदेन की राशि औसत से काफी अधिक हो (), या सामने वाले की भाषा अत्यधिक भावनात्मक हो (), तो जोखिम स्कोर बढ़ जाता है। सीमा पार होने पर, AI को तुरंत बातचीत बंद कर देनी चाहिए और ह्यूमन-इन-द-लूप (Human-in-the-Loop) यानी मानव प्रबंधक के हस्तक्षेप का अनुरोध करना चाहिए।
सफल AI ऑटोमेशन का मतलब यह नहीं है कि इंसान सिस्टम से गायब हो जाए। मुख्य बात यह है कि AI को इंसानों द्वारा डिज़ाइन किए गए सख्त व्यावसायिक दर्शन के आधार पर स्वायत्त रूप से कार्य करने दिया जाए। अब यह जाँचने का समय है कि कहीं आपका एजेंट ग्राहकों की बातों में आकर आपके मुनाफ़े को तो कम नहीं कर रहा है।