सिस्टम प्रॉम्प्ट के माध्यम से चैटजीपीटी द्वारा दोहराए जाने वाले विशिष्ट शब्दों को जबरन ब्लॉक करने की तकनीक
2026년 5월 1일
0
Computing/SoftwareComments (0)
Log in to leave a comment
No posts yet
Log in to leave a comment
No posts yet
जब आप कुछ लिखने के लिए चैटजीपीटी चालू करते हैं और "Delve" या "Tapestry" जैसे शब्द सामने आते हैं, तो उत्साह कम हो जाता है। पाठक भी अब इन शब्दों को देखते ही तुरंत समझ जाते हैं कि यह एआई द्वारा लिखा गया है। एक लेखक के लिए अपनी मेहनत से तैयार किए गए ड्राफ्ट का मशीनी गंध वाले टेक्स्ट से दूषित होना किसी आपदा से कम नहीं है। यह घटना इसलिए होती है क्योंकि चैटजीपीटी को सीखने की प्रक्रिया के दौरान विशिष्ट शब्दावली के लिए उच्च पुरस्कार (high rewards) प्राप्त करने के लिए सेट किया गया है, जो इसकी इंजीनियरिंग की एक सीमा है। मैंने एआई की जबरन दखल देने वाली भाषाई आदतों को तोड़ने और आपकी अपनी लेखन शैली को बनाए रखने के तीन स्पष्ट तरीके यहाँ संकलित किए हैं।
केवल विशिष्ट शब्दों का उपयोग न करने का अनुरोध करना पर्याप्त नहीं है। ऐसा इसलिए है क्योंकि एआई का ध्यान केंद्रित करने वाला तंत्र (attention mechanism) निषेधात्मक आदेशों की तुलना में प्रासंगिक संभावनाओं को प्राथमिकता देता है। आपको सिस्टम प्रॉम्प्ट के नीचे एक अलग "प्रतिबंधित सूची" अनुभाग बनाना चाहिए जिसमें तार्किक बाधाएं स्पष्ट रूप से बताई गई हों। स्टैनफोर्ड यूनिवर्सिटी के 2024 के भाषा मॉडल नियंत्रण अध्ययन के अनुसार, जब परिष्कृत बाधाएं लागू की जाती हैं, तो मानव पाठकों द्वारा एआई-जनित सामग्री को पहचानने की संभावना 43% कम हो जाती है।
[Prohibited Words] अनुभाग बनाएं। यहाँ Delve, Intricate, Embark, Tapestry, Hurdle जैसे अक्सर आने वाले 5 शब्द लिखें। फिर आदेश दें: "यदि प्रतिक्रिया प्रक्रिया के दौरान इनमें से कोई भी शब्द शामिल होता है, तो उस वाक्य को तुरंत हटा दें और उसे सामान्य हिंदी में फिर से लिखें।" आउटपुट से ठीक पहले शब्दों की स्वयं जांच करने का निर्देश देना ही मुख्य कुंजी है।एआई में विशाल डेटा के औसत स्तर पर वापस जाने की प्रवृत्ति होती है। रचनाकार की विशिष्टता को मिटाकर सामान्य वाक्यों की ओर लौटने की इस प्रवृत्ति को तोड़ने के लिए फ्यू-शॉट लर्निंग (Few-shot Learning) तकनीक की आवश्यकता होती है। कस्टम निर्देशों (Custom Instructions) में नमूने के रूप में अपने स्वयं के लिखे हुए वाक्य डालें। वास्तविक बेंचमार्क डेटा रिपोर्ट करता है कि नमूना इंजेक्शन पद्धति का उपयोग करते समय पहली कोशिश में संतोषजनक परिणाम मिलने की संभावना 23% से बढ़कर 94% हो जाती है।
एआई घिसे-पिटे शब्दों को इसलिए चुनता है क्योंकि वे शब्द किसी विशिष्ट संदर्भ में सांख्यिकीय रूप से सबसे सुरक्षित विकल्प होते हैं। इस संभावना वितरण (probability distribution) को जबरन समतल किया जाना चाहिए। तापमान (Temperature) पैरामीटर को समायोजित करके, जो प्रतिक्रिया की यादृच्छिकता (randomness) को निर्धारित करता है, एआई सांख्यिकीय सुरक्षित क्षेत्र के बाहर के ताज़ा शब्दों को चुनना शुरू कर देता है। OpenAI की तकनीकी रिपोर्ट बताती है कि पैरामीटर समायोजन एआई के अनुमानित वाक्य संयोजनों को तोड़ने का सबसे सीधा साधन है।
इन सेटिंग्स को एकीकृत करके, पांडुलिपि पर काम करने में लगने वाला समय, जो पहले दिन में 4 घंटे लगता था, घटकर लगभग 1 घंटा रह जाता है। एआई को नियंत्रण न लेने दें। तकनीकी उपकरणों का उपयोग करके एआई की भाषाई आदतों को नष्ट करना ही एकमात्र तरीका है जिससे एक स्वतंत्र रचनाकार अपने अद्वितीय मूल्य को साबित कर सकता है।