आप शायद एजेंट कौशल की वास्तविक क्षमता का लाभ नहीं उठा पा रहे हैं!

AAcademind
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00जब आप क्लाउड कोड, कोडेक्स या किसी अन्य एजेंटिक इंजीनियरिंग टूल के साथ काम करते हैं, तो एक बहुत ही महत्वपूर्ण
00:00:05अवधारणा जो इन सभी उपकरणों द्वारा समर्थित है और जिसे आपको समझना और उपयोग करना चाहिए, वह है
00:00:12एजेंट स्किल्स (agent skills) की अवधारणा। और इन्हें अनदेखा करना आसान है क्योंकि ये केवल कुछ मार्कडाउन फाइलें हैं या क्योंकि
00:00:18इन्हें सेट करना बोझिल हो सकता है, लेकिन मेरे अनुभव में यह इसके लायक है। और कुछ दिन पहले,
00:00:24क्लाउड कोड टीम के किसी व्यक्ति ने, यानी एंथ्रोपिक (Anthropic) के किसी व्यक्ति ने एक पोस्ट साझा की थी जहाँ उन्होंने
00:00:31उन विभिन्न प्रकार के कौशल (skills) को साझा किया जिनका वे आंतरिक रूप से उपयोग कर रहे हैं क्योंकि वास्तव में आप
00:00:37अलग-अलग प्रकार के कौशल के बीच अंतर कर सकते हैं जिन्हें आप बनाना चाहते हैं। हालाँकि अंत में वे सभी मार्कडाउन फाइलें ही हैं,
00:00:42आप इसमें थोड़ा और जोड़ सकते हैं, मैं उस पर वापस आऊंगा, लेकिन निश्चित रूप से उस मार्कडाउन फ़ाइल के अंदर क्या है,
00:00:49वह काफी अलग हो सकता है। अब यह छवि यहाँ और यह पूरी पोस्ट काफी डरावनी लग सकती है और इससे ऐसा हो सकता है
00:00:56कि आप कुछ भी न करें क्योंकि आपको लगता है कि ठीक है, अगर मुझे कौशल सेट करने में एक सप्ताह बिताना है तो मैं
00:01:02उनका उपयोग ही नहीं करूँगा, और इसीलिए मैं इस वीडियो में इसका एक विकल्प देना चाहता हूँ। मुझे लगता है कि
00:01:08आप केवल तीन मुख्य प्रकार के कौशल रख सकते हैं जिनकी आपको परवाह करनी चाहिए और जो बेहतर
00:01:15परिणाम देंगे। वैसे, जैसा कि मैंने उल्लेख किया है, ये सभी टूल स्किल्स का समर्थन करते हैं, मैं अपने संबंधित कोर्सेस में कवर करता हूँ कि
00:01:20उन्हें कैसे सेट किया जाए, उन्हें सक्रिय रूप से कैसे लागू किया जाए, क्लाउड कोड और कोडेक्स के लिए स्किल्स कैसे बनाई जाएं और यदि आप
00:01:26उन कोर्सेस को प्राप्त करना चाहते हैं या भविष्य के कोर्सेस सहित मेरे सभी कोर्सेस तक पहुँच प्राप्त करना चाहते हैं, तो अभी मैं
00:01:31एक प्रमोशन चला रहा हूँ जहाँ आप वार्षिक सदस्यता प्राप्त कर सकते हैं जो आपको मेरे सभी कोर्सेस तक पूर्ण पहुँच प्रदान करती है,
00:01:35जब तक आपके पास सदस्यता है, वह भी बहुत कम कीमत पर, लिंक नीचे है। लेकिन इन स्किल्स के संबंध में,
00:01:41वे केवल मार्कडाउन फाइलें हैं, मार्कडाउन फाइलें जो एक विशेष स्थान पर संग्रहीत होती हैं और
00:01:46सटीक स्थान आपके द्वारा उपयोग किए जा रहे टूल पर निर्भर करता है लेकिन अंत में वे प्रॉम्प्ट टेम्प्लेट या
00:01:52संदर्भ के अतिरिक्त टुकड़ों के लिए होते हैं जिन्हें आपके एजेंटिक इंजीनियरिंग सत्रों में शामिल किया जा सकता है। और
00:02:01पहले प्रकार का कौशल 'डॉक्यूमेंटेशन' या 'नॉलेज' (ज्ञान) कौशल है। अब मेरा इससे क्या मतलब है?
00:02:09यहाँ मैं अपने academy.com प्रोजेक्ट में हूँ, यानी मेरी वेबसाइट का प्रोजेक्ट, और वहाँ मेरे पास बहुत सारे एजेंट
00:02:15स्किल्स हैं जो वास्तव में केवल एक प्रकार के दस्तावेज़ या ज्ञान हैं जिन्हें मैं यहाँ एआई एजेंट को दिखाता हूँ। उदाहरण के लिए,
00:02:25कुछ टाइपस्क्रिप्ट ज्ञान, यहाँ अधिक उन्नत टाइपस्क्रिप्ट
00:02:33सुविधाओं के बारे में कुछ ज्ञान, शायद कुछ नई सुविधाएँ जैसे "satisfies" कीवर्ड जो पिछले 10 वर्षों से
00:02:40उपलब्ध नहीं था, कुछ ऐसी चीज़ें जिनके बारे में मैं चाहता हूँ कि एआई एजेंट अवगत रहे या उसे याद दिलाया जाए क्योंकि शायद
00:02:50यह पहली चीज़ नहीं होगी जिसे वह चुनेगा क्योंकि शायद उसने अपने प्रशिक्षण डेटा में इन चीज़ों को उतना नहीं देखा है।
00:02:58तो यह वास्तव में कुछ ऐसा है जिसे आप आधिकारिक टाइपस्क्रिप्ट दस्तावेज़ों में पा सकते हैं। बात बस
00:03:04इतनी है कि जब तक आप स्पष्ट रूप से एजेंट को ऐसा करने के लिए नहीं कहते, तब तक बहुत संभावना है कि वह उस आधिकारिक
00:03:11दस्तावेज़ पर नहीं जाएगा, वह टाइपस्क्रिप्ट दस्तावेज़ पर नहीं जाएगा, इसलिए मैं अपना खुद का कौशल रखना पसंद करता हूँ और
00:03:17इस कौशल में कुछ मेटाडेटा है। मेटाडेटा महत्वपूर्ण है क्योंकि कौशल के पीछे का विचार यह है कि
00:03:24हर बार सभी उपलब्ध कौशलों को संदर्भ विंडो (context window) में लोड नहीं किया जाता है, इसके बजाय केवल
00:03:30मेटाडेटा को संदर्भ विंडो में लोड किया जाता है और फिर एआई एजेंट यह तय कर सकता है कि वह किस कौशल के बारे में
00:03:37अधिक पढ़ना चाहता है, जो आपके प्रॉम्प्ट और आपके द्वारा दिए गए कार्यों पर निर्भर करता है। आप सक्रिय रूप से कौशल का उपयोग भी कर सकते हैं,
00:03:43जो आपके द्वारा उपयोग किए जा रहे टूल पर निर्भर करता है, लेकिन मुख्य विचार यह है कि एजेंट उस मेटाडेटा के आधार पर
00:03:47उन्हें अपने आप लोड करता है। तो यहाँ मेरे पास कुछ मेटाडेटा है जहाँ मैं एजेंट को यह बताने की कोशिश करता हूँ कि
00:03:55इस कौशल का उपयोग कब करना है और इसलिए वह एक प्रकार का कौशल है जहाँ आप अतिरिक्त दस्तावेज़
00:04:02या ज्ञान प्रदान करते हैं जो शायद एजेंट के पास न हो क्योंकि शायद आप किसी ऐसी लाइब्रेरी के साथ काम कर रहे हैं
00:04:08जो प्रशिक्षण डेटा में नहीं थी क्योंकि वह बिल्कुल नई है या जहाँ आप जानते हैं कि शायद उसने इसके बारे में बहुत अधिक
00:04:13नहीं देखा है और आप चाहते हैं कि वह इसके बारे में जागरूक हो, तो वह पहला प्रकार का कौशल है।
00:04:18दूसरे प्रकार का कौशल व्यवहार, सर्वोत्तम अभ्यास (best practices), दृष्टिकोण, उस तरह की चीज़ें हैं और यहाँ विचार
00:04:29वास्तव में यह है कि निश्चित रूप से जब आप किसी प्रोजेक्ट पर काम कर रहे होते हैं तो कोड शैली या
00:04:37कुछ चीज़ें कैसे की जानी चाहिए, इसके बारे में आपकी कुछ प्राथमिकताएं हो सकती हैं। उदाहरण के लिए, मेरे पास यह क्लीन मॉडर्न
00:04:45रिएक्ट (React) कोड स्किल है जो रिएक्ट फीचर्स के दस्तावेजीकरण के बारे में उतना नहीं है बल्कि
00:04:50कुछ नियम स्थापित करने के बारे में है जिनका एजेंट को रिएक्ट कोड लिखते समय पालन करना चाहिए ताकि यह सुनिश्चित हो सके कि कुछ
00:04:59एंटी-पैटर्न कम से कम आम हों, क्योंकि कम से कम मेरे लिए अभी एआई एजेंट ऐसा कोड उत्पन्न करते हैं
00:05:08जो हमेशा उच्चतम गुणवत्ता का नहीं होता है और आप बहस कर सकते हैं कि क्या आपको कोड की
00:05:13गुणवत्ता की परवाह है या नहीं। मैंने इसके बारे में दूसरे चैनल पर एक अलग वीडियो बनाया है। मैं कहूँगा कि यह
00:05:18महत्वपूर्ण है क्योंकि कोड की गुणवत्ता कोड की समीक्षा करने में सक्षम होने के लिए मायने रखती है। इसके प्रदर्शन पर
00:05:23प्रभाव पड़ सकता है, इसके इस बात पर प्रभाव पड़ सकते हैं कि कोड को बनाए रखना या विस्तार करना कितना आसान है, इसलिए मैं कहूँगा कि यह
00:05:29महत्वपूर्ण है और यदि आपके पास कुछ व्यवहार या पैटर्न हैं जिन्हें आप चाहते हैं कि एजेंट उपयोग करे, तो ऐसा
00:05:36व्यवहार कौशल (behavioral skill) जहाँ आप उसे बताते हैं कि अच्छा रिएक्ट कोड कैसे लिखना है और उसे "useEffect" के उपयोग से बचना चाहिए
00:05:43और वह इससे कैसे बच सकता है, उस तरह का कौशल दिलचस्प हो सकता है। तो यहाँ यह
00:05:50अतिरिक्त दस्तावेज़ या ज्ञान प्रदान करने के बारे में कम है, बल्कि व्यवहार को निर्देशित करने के बारे में अधिक है। अब,
00:05:55इस कौशल के बारे में दिलचस्प बात यह है कि यहाँ मेरे पास "useEffect" के बारे में अधिक विवरण वाली एक फ़ाइल के साथ कुछ
00:06:02संबंधित फाइलें हैं क्योंकि ये सभी कौशल फाइलें आलसी तरीके (lazily) से लोड की जाती हैं जैसा कि मैंने पहले ही कहा है और आप
00:06:09एक कौशल फ़ाइल में दूसरी फ़ाइल का संदर्भ दे सकते हैं जैसे यहाँ रेफ़रेंस फोल्डर में यह "useEffect.md" फ़ाइल,
00:06:15और फिर एआई केवल तभी उस फ़ाइल को लोड करने का निर्णय ले सकता है जब उसे पता हो कि वह "useEffect" के साथ काम कर रहा है,
00:06:21कि वह "useEffect" के साथ कुछ कर रहा है, ताकि यहाँ मेरे पास एंटी-पैटर्न के बारे में अधिक विवरण हों
00:06:27जिनके बारे में उसे पता होना चाहिए और इस प्रकार के कौशल को सेट करना बहुत सार्थक हो सकता है क्योंकि
00:06:33निश्चित रूप से मैं उसे किसी भी रिएक्ट प्रोजेक्ट में कॉपी कर सकता हूँ, मुझे इसे हर बार दोबारा लिखने की ज़रूरत नहीं है और यह
00:06:39वहाँ बेहतर कोड की ओर ले जा सकता है। तो यह दूसरे प्रकार का कौशल है जिसे मैं करने की सलाह दूँगा और आपको
00:06:45उन सभी अलग-अलग पैटर्न के बारे में सोचने की ज़रूरत नहीं है जिन्हें आप वर्णित करना चाहते हैं, इसके बजाय बस कदम दर कदम चलें,
00:06:52यदि आप देखते हैं कि आपके प्रोजेक्ट में एआई एजेंट लगातार कुछ ऐसा कर रहा है जो आप नहीं चाहते कि वह करे,
00:06:58तो एक कौशल जोड़ें जहाँ आप एक अच्छे विवरण के बारे में सोचते हैं जो सही समय पर कौशल के लोड होने की संभावना को बढ़ाता है
00:07:04और फिर उस कौशल में अपने निर्देश डालें, इसलिए चीजों को ठीक करने के लिए इसका उपयोग करें और समय के साथ
00:07:11आप अपने विशिष्ट सर्वोत्तम अभ्यासों और व्यवहारों के साथ एक कौशल पुस्तकालय बनाएंगे जिन्हें आप लागू करना चाहते हैं
00:07:17और फिर आप भविष्य के प्रोजेक्ट्स में उसका उपयोग कर सकते हैं, इसलिए इसे एक बड़े शुरुआती कार्य के रूप में न देखें जो
00:07:22बहुत डरावना है, बल्कि उस कौशल आधार को कदम दर कदम बनाएं। अब तीसरा प्रकार का कौशल और
00:07:29यह एक अलग प्रकार का कौशल है, वह है कार्यक्षमता संचालित (functionality driven) कौशल। अब तक हमने दस्तावेज़ीकरण
00:07:37और विशिष्ट व्यवहारों को लागू करने के बारे में बात की है। अब ये एजेंटिक इंजीनियरिंग टूल्स जैसे क्लाउड कोड, कोडेक्स,
00:07:43वे हर तरह की चीज़ें कर सकते हैं, वे ज़ाहिर तौर पर कोड लिख सकते हैं लेकिन आप प्रोजेक्ट्स में कोड लिखने तक
00:07:49सीमित नहीं हैं क्योंकि वे कोड लिख सकते हैं, वे आपके कंप्यूटर पर कुछ भी कर सकते हैं यदि आप चाहें, तो आप
00:07:55उनका उपयोग उदाहरण के लिए पीडीएफ दस्तावेज़ों का विश्लेषण करने के लिए कर सकते हैं या मेरे सिस्टम पर कुछ वैश्विक (global) स्किल्स हैं जो
00:08:03सिर्फ प्रोग्रामिंग के लिए विशिष्ट नहीं हैं, उनमें से कुछ हैं लेकिन सभी नहीं। आप एक ऐसा कौशल सेट कर सकते हैं जो एजेंट को बताता है
00:08:09कि एक छवि (image) कैसे उत्पन्न की जाए। अब मेरा इससे क्या मतलब है, ज़ाहिर है कि
00:08:16विभिन्न सेवाएँ या एपीआई हैं जिनका उपयोग आप एआई के साथ चित्र या वीडियो बनाने के लिए कर सकते हैं जैसे कि fell.ai, यह कोई
00:08:24प्रायोजित वीडियो नहीं है, वैसे रेप्लिकेट (replicate) भी है और विभिन्न सेवाएँ हैं। अब निश्चित रूप से
00:08:29यदि आप एक छवि बनाना चाहते हैं, मान लीजिए कि आपको अपनी वेबसाइट के लिए एक डमी इमेज की आवश्यकता है या
00:08:34किसी बिल्कुल अलग चीज़ के लिए, एक ऐसी छवि जिसे आप प्रिंट करके अपनी दीवार पर लगाना चाहते हैं, तो आप इन
00:08:41सेवाओं का उपयोग कर सकते हैं और आप कोडेक्स, क्लाउड कोड या पाई एजेंट (pi agent) का उपयोग कर सकते हैं जिसे मैं बहुत पसंद करता हूँ और उससे कह सकते हैं कि वह
00:08:49आपके लिए एक छवि बनाए। डिफ़ॉल्ट रूप से यह बहुत संभावना है कि वह विफल हो जाएगा क्योंकि इन एजेंटिक इंजीनियरिंग उपकरणों में
00:08:54छवि निर्माण क्षमताएं निर्मित नहीं होती हैं, लेकिन यदि आप उन्हें सही कौशल देते हैं जो अभी भी
00:09:00सिर्फ एक मार्कडाउन फ़ाइल है, तो उसमें आप निश्चित रूप से वर्णन कर सकते हैं कि एक छवि बनाने के लिए किसी थर्ड-पार्टी
00:09:06एपीआई के साथ कैसे इंटरैक्ट किया जाए। अब सिर्फ उस इंटरैक्शन का वर्णन करना एक तरीका हो सकता है लेकिन आप इसे
00:09:12एक कदम आगे ले जा सकते हैं, आपके कौशल स्क्रिप्ट के साथ भी आ सकते हैं। सभी को उनकी आवश्यकता नहीं है लेकिन यहाँ मेरा
00:09:18इमेज जेनरेशन कौशल ऐसा करता है। यह स्क्रिप्ट एक ऐसी स्क्रिप्ट है जो ईमानदारी से कहूँ तो एआई द्वारा लिखी गई थी, इसे "vibe code" किया गया था
00:09:26और यहाँ मेरे पास कुछ स्क्रिप्ट्स हैं जो fell एपीआई के साथ इंटरैक्ट करती हैं। तो उस इमेज जेनरेशन
00:09:34सर्विस का, मैंने अनिवार्य रूप से उनके दस्तावेज़ लिए, उन्हें एक प्रॉम्प्ट में डाला और एक एआई एजेंट को बताया कि वह मेरे लिए
00:09:40एक उपकरण लिखे जो fell द्वारा उस एपीआई का उपयोग कर सके या उससे बात कर सके ताकि छवियाँ उत्पन्न की जा सकें। तो यहाँ एक छोटा सीएलआई (CLI)
00:09:49टूल लिखा गया था, एक छोटी स्क्रिप्ट जो उस एपीआई से बात कर सकती है और विभिन्न मापदंडों (parameters) के साथ छवियाँ उत्पन्न कर सकती है।
00:09:56और फिर कौशल एमडी फ़ाइल, वह फ़ाइल बस बताती है कि उस स्क्रिप्ट का उपयोग कैसे करना है, यह
00:10:02उसकी ओर इशारा करती है और एजेंट को बताती है कि इसे कैसे निष्पादित करना है, कौन से पैरामीटर पास करने हैं और इसी तरह, और फिर
00:10:08मेरे पास यहाँ मेरी fell की (key) के साथ ".env" फ़ाइल है और जब उस स्क्रिप्ट को यहाँ "bun" के माध्यम से लागू किया जाता है जो
00:10:18मैं एआई को कौशल एमडी फ़ाइल में बता रहा हूँ, तो वह ".env" फ़ाइल स्वचालित रूप से लोड हो जाएगी इसलिए मुझे
00:10:23अपने एजेंट को उस की (key) तक पहुँच देने की आवश्यकता नहीं है। मुझे उसे यह बताने की ज़रूरत नहीं है कि कृपया एक छवि बनाएं और वैसे
00:10:29यहाँ की है, इसके बजाय मैं बस उसे एक छवि बनाने के लिए कह सकता हूँ, वह इस
00:10:34विवरण के कारण ज़रूरत पड़ने पर इस कौशल को लोड करेगा और फिर वहाँ वह सीखता है कि उसे बस
00:10:39एक स्क्रिप्ट चलाने की ज़रूरत है और उसे कार्यान्वयन विवरणों के बारे में चिंता करने की ज़रूरत नहीं है और यह एक और प्रकार का
00:10:45कौशल है जो मुझे लगता है कि दिलचस्प है, न केवल प्रोग्रामिंग से संबंधित, आपके पास निश्चित रूप से एक
00:10:52स्क्रिप्ट संचालित कौशल भी हो सकता है, कोई ऐसा कौशल जो कोड को फॉर्मेट करता है या मुझे नहीं पता लेकिन सामान्य रूप से,
00:10:57क्योंकि आप वास्तव में इन एजेंटों का उपयोग केवल कोड उत्पन्न करने से कहीं अधिक के लिए कर सकते हैं और इसलिए वह
00:11:02निश्चित रूप से जागरूक होने वाली एक अन्य कौशल श्रेणी है। लेकिन हाँ, कुल मिलाकर मैं कहूँगा कि इसे बहुत जटिल न करें
00:11:08लेकिन इसे छोड़ें भी नहीं, बल्कि कदम दर कदम अपना कौशल पुस्तकालय बनाएं। यह ध्यान देने योग्य है कि
00:11:14निश्चित रूप से skills.sh जैसी कौशल रजिस्ट्रियां हैं जहाँ आप अन्य लोगों द्वारा बनाए गए कौशल ब्राउज़ कर सकते हैं।
00:11:21बस दो महत्वपूर्ण बातें, यह बहुत उपयोगी हो सकता है लेकिन मैं जो नहीं करूँगा वह यह कहना है कि ठीक है मैं
00:11:29टेलविंड (tailwind) और बैटर ऑथ (better auth) के साथ एक रिएक्ट प्रोजेक्ट बना रहा हूँ और मुझे नहीं पता इसलिए मैं उन सभी कौशलों को खोजूँगा
00:11:35जो वहाँ संभावित रूप से दिलचस्प हो सकते हैं और मैं उन सभी को अपने प्रोजेक्ट में इंस्टॉल कर लूँगा। वह
00:11:40अनुत्पादक हो सकता है क्योंकि आप अपनी संदर्भ विंडो में अधिक से अधिक मेटाडेटा लोड कर रहे हैं और
00:11:47इनमें से कुछ कौशलों का कोई महत्व नहीं हो सकता है, इसलिए इसके बारे में जागरूक होने वाली यह एक बात है, मैं हमेशा उन सभी
00:11:53कौशलों को जोड़ने की कोशिश नहीं करूँगा जिन्हें आप सैद्धांतिक रूप से जोड़ सकते हैं, इसके बजाय आपको चयनात्मक होना चाहिए और उन
00:11:57चीजों पर ध्यान केंद्रित करना चाहिए जो एआई लगातार गलत करता है या जहाँ आप जानते हैं कि अतिरिक्त दस्तावेज़ीकरण
00:12:04की आवश्यकता होगी। वह एक बात है और इन रजिस्ट्रियों के बारे में दूसरी बात निश्चित रूप से यह है कि आप
00:12:09उन कौशलों को शामिल कर रहे हैं जो अन्य लोगों द्वारा लिखे गए थे। ये कौशल, जैसा कि हमने सीखा, केवल प्रॉम्प्ट हैं।
00:12:16यदि इनमें से किसी एक प्रॉम्प्ट में कुछ दुर्भावनापूर्ण है तो वह एक समस्या हो सकती है, जिससे प्रॉम्प्ट
00:12:22इंजेक्शन हमला (prompt injection attack) हो सकता है और आपको इसके बारे में जागरूक होना चाहिए। अब skills.sh जैसी कुछ रजिस्ट्रियाँ मेरी जानकारी के अनुसार
00:12:28प्रॉम्प्ट इंजेक्शन के खतरे को कम करने के लिए किसी प्रकार की स्कैनिंग करती हैं लेकिन आप कभी भी 100%
00:12:36सुरक्षित नहीं होते हैं और इसलिए यह कुछ ऐसा है जिसके बारे में जागरूक होना चाहिए। इसलिए जब भी आप किसी और के द्वारा लिखे गए कौशल का उपयोग कर रहे हों,
00:12:40तो इसे पढ़ें, यह आपके पढ़ने के लिए है, इसे देखें और देखें कि क्या इसमें कुछ
00:12:47दुर्भावनापूर्ण है। यह बस चेतावनी का एक शब्द है लेकिन हाँ, इसके अलावा कौशल का उपयोग करें, ऐसा महसूस न करें
00:12:54कि आपको यहाँ वह सुपर जटिल सुपर सिस्टम बनाने की ज़रूरत है, बल्कि उनके साथ खेलें और इन
00:13:00तीन मुख्य प्रकार के कौशलों को ध्यान में रखें।

Key Takeaway

एजेंटिक इंजीनियरिंग में 'एजेंट स्किल्स' का रणनीतिक उपयोग करके आप एआई की कार्यक्षमता को बेहतर बना सकते हैं, बशर्ते आप उन्हें ज्ञान, व्यवहार और कार्यक्षमता के आधार पर व्यवस्थित करें।

Highlights

एजेंट स्किल्स (Agent Skills) मुख्य रूप से मार्कडाउन (.md) फाइलें हैं जो एआई एजेंट को अतिरिक्त संदर्भ और निर्देश प्रदान करती हैं।

कुशलतापूर्वक काम करने के लिए सभी स्किल्स को एक साथ लोड करने के बजाय मेटाडेटा का उपयोग किया जाता है ताकि एजेंट जरूरत के अनुसार उन्हें चुन सके।

लेखक ने स्किल्स को तीन मुख्य श्रेणियों में विभाजित किया है: ज्ञान (Knowledge), व्यवहार (Behavior), और कार्यक्षमता (Functionality)।

व्यवहार कौशल का उपयोग एआई द्वारा उत्पन्न कोड की गुणवत्ता और शैली को नियंत्रित करने के लिए किया जा सकता है, जैसे कि React में 'useEffect' के गलत उपयोग को रोकना।

कार्यक्षमता संचालित कौशल के माध्यम से एआई एजेंट को बाहरी एपीआई (जैसे इमेज जनरेशन) के साथ इंटरैक्ट करने के लिए स्क्रिप्ट चलाने का निर्देश दिया जा सकता है।

कौशल पुस्तकालय (Skill Library) को एक बार में बनाने के बजाय धीरे-धीरे, अपनी आवश्यकताओं के अनुसार विकसित करना अधिक प्रभावी होता है।

अन्य लोगों द्वारा बनाई गई स्किल्स का उपयोग करते समय सुरक्षा और 'प्रॉम्प्ट इंजेक्शन' (Prompt Injection) के खतरों के प्रति सतर्क रहना आवश्यक है।

Timeline

एजेंट स्किल्स का परिचय और महत्व

इस शुरुआती खंड में वक्ता क्लाउड कोड और कोडेक्स जैसे एजेंटिक इंजीनियरिंग टूल में 'एजेंट स्किल्स' की अवधारणा को समझाते हैं। वे बताते हैं कि हालांकि ये केवल मार्कडाउन फाइलें हैं, लेकिन इन्हें अनदेखा करना एक बड़ी भूल हो सकती है क्योंकि ये बेहतर परिणाम देने में सक्षम हैं। एंथ्रोपिक की टीम के उदाहरण का उपयोग करते हुए वे बताते हैं कि आंतरिक रूप से विभिन्न प्रकार के कौशलों का उपयोग कैसे किया जाता है। वक्ता यह भी स्पष्ट करते हैं कि इन कौशलों को सेट करना डरावना लग सकता है, लेकिन वे इस वीडियो में एक सरल विकल्प प्रदान कर रहे हैं। अंततः, ये फाइलें प्रॉम्प्ट टेम्प्लेट के रूप में कार्य करती हैं जो आपके इंजीनियरिंग सत्रों को अधिक सटीक बनाती हैं।

पहला प्रकार: दस्तावेज़ीकरण और ज्ञान कौशल

यहाँ वक्ता पहले प्रकार के कौशल, यानी 'नॉलेज स्किल्स' पर चर्चा करते हैं, जो एआई एजेंट को विशिष्ट तकनीकी जानकारी प्रदान करते हैं। वे अपनी वेबसाइट के प्रोजेक्ट का उदाहरण देते हैं जहाँ उन्होंने टाइपस्क्रिप्ट की आधुनिक विशेषताओं, जैसे 'satisfies' कीवर्ड, के लिए अलग फाइलें बनाई हैं। यह महत्वपूर्ण है क्योंकि एआई शायद अपने पुराने प्रशिक्षण डेटा के कारण इन नई विशेषताओं को प्राथमिकता न दे। मेटाडेटा का उपयोग यहाँ महत्वपूर्ण है क्योंकि यह एजेंट को यह तय करने में मदद करता है कि कब कौन सी जानकारी लोड करनी है। यह दृष्टिकोण सुनिश्चित करता है कि एजेंट के पास हमेशा अद्यतन और प्रासंगिक आधिकारिक दस्तावेज़ीकरण तक पहुँच हो।

दूसरा प्रकार: व्यवहार और सर्वोत्तम अभ्यास

इस खंड में 'व्यवहार कौशल' (Behavioral Skills) के बारे में बताया गया है, जो कोड की शैली और नियमों को स्थापित करने पर केंद्रित हैं। वक्ता React कोड का उदाहरण देते हैं जहाँ वे एजेंट को 'useEffect' जैसे एंटी-पैटर्न से बचने और बेहतर कोडिंग आदतों का पालन करने के लिए निर्देशित करते हैं। वे तर्क देते हैं कि कोड की गुणवत्ता केवल दिखावे के लिए नहीं, बल्कि रखरखाव और प्रदर्शन के लिए भी अनिवार्य है। स्किल्स को 'आलसी तरीके' (lazily) से लोड किया जा सकता है, जिससे संदर्भ विंडो अनावश्यक डेटा से नहीं भरती है। वक्ता सलाह देते हैं कि जैसे-जैसे आप एआई की गलतियों को पहचानें, वैसे-वैसे कदम दर कदम अपने कौशल पुस्तकालय का विस्तार करें।

तीसरा प्रकार: कार्यक्षमता संचालित कौशल

तीसरा प्रकार 'कार्यक्षमता संचालित कौशल' है, जो एआई को कोड लिखने से परे कार्य करने की अनुमति देता है, जैसे कि इमेज जनरेशन। वक्ता बताते हैं कि कैसे एक मार्कडाउन फ़ाइल और एक स्क्रिप्ट का उपयोग करके एजेंट को 'fell.ai' जैसे थर्ड-पार्टी एपीआई के साथ जोड़ा जा सकता है। इसमें एक छोटी सीएलआई स्क्रिप्ट का उपयोग किया जाता है जिसे एआई ने ही लिखा है, और एजेंट केवल मार्कडाउन निर्देशों का पालन करके उसे निष्पादित करता है। यह विधि सुरक्षा के लिहाज से भी अच्छी है क्योंकि संवेदनशील 'API Keys' को .env फाइलों में सुरक्षित रखा जा सकता है। यह दिखाता है कि एजेंटिक टूल्स का उपयोग करके जटिल और विविध कार्यों को कैसे स्वचालित किया जा सकता है।

कौशल रजिस्ट्रियां और सुरक्षा संबंधी सावधानियां

वीडियो के अंतिम भाग में वक्ता 'skills.sh' जैसी सार्वजनिक कौशल रजिस्ट्रियों के उपयोग के बारे में चेतावनी और सुझाव देते हैं। वे सलाह देते हैं कि अपने प्रोजेक्ट में अंधाधुंध स्किल्स न जोड़ें क्योंकि इससे मेटाडेटा का बोझ बढ़ सकता है और प्रदर्शन धीमा हो सकता है। सबसे महत्वपूर्ण बात 'प्रॉम्प्ट इंजेक्शन' के खतरों के प्रति जागरूक रहना है, क्योंकि बाहरी लोगों द्वारा लिखे गए प्रॉम्प्ट दुर्भावनापूर्ण हो सकते हैं। वक्ता उपयोगकर्ताओं को प्रोत्साहित करते हैं कि वे किसी भी बाहरी कौशल को लागू करने से पहले उसे स्वयं पढ़ें और समझें। अंत में, वे संदेश देते हैं कि चीजों को जटिल न बनाएं, बल्कि इन तीन श्रेणियों का उपयोग करके प्रयोग करना शुरू करें।

Community Posts

View all posts