Vercel Agent Skills के साथ मैंने Claude Code को और भी बेहतर कैसे बनाया

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00यह है 'स्किल्स बाय द सेल', जो एजेंट स्किल्स की एक डायरेक्टरी है जिसे आप किसी भी एजेंट में जोड़ सकते हैं
00:00:04ताकि उसकी क्षमताओं को बढ़ाया जा सके, जैसे उसे React में माहिर बनाना, उसे फ्रंट-एंड डिजाइनर बनाना,
00:00:10या उसे एक मोशन ग्राफिक्स एडिटर बनाना। यह पूरा सिस्टम किसी स्किल को इंस्टॉल करने से पहले
00:00:15एक रेपो को क्लोन और स्कैन करके यह देखता है कि क्या उसमें skills.md फाइल मौजूद है। लेकिन क्या क्लाउडफ्लेयर का नया प्रस्ताव
00:00:22इस शानदार रिसोर्स को बेकार कर देगा? सब्सक्राइब बटन दबाएं और चलिए इसके बारे में विस्तार से जानते हैं।
00:00:27एजेंट स्किल्स को पिछले साल एंथ्रोपिक द्वारा पेश किया गया था ताकि विशिष्ट कार्यों पर क्लाउड की क्षमताओं को बेहतर बनाया जा सके,
00:00:32और यह .cloud फोल्डर में एक स्किल्स डायरेक्टरी जोड़कर काम करता है और फिर उसके अंदर
00:00:37स्किल के नाम वाली एक और डायरेक्टरी और उसके बाद एक skills.md फाइल जोड़ी जाती है।
00:00:42अब स्किल के काम करने के लिए इस फाइल में कुछ मुख्य चीजों का होना जरूरी है। सबसे पहले, इसका ऊपरी हिस्सा,
00:00:47जो YAML में फ्रंट मैटर होता है, उसमें कम से कम स्किल का नाम और उसका विवरण होना चाहिए।
00:00:52उसके बाद, फ्रंट मैटर के नीचे, वो जगह है जहाँ स्किल के लिए निर्देश दिए जाते हैं।
00:00:58ये निर्देश मॉडल के कॉन्टेक्स्ट में लोड किए जाते हैं ताकि इसका उपयोग विशिष्ट कार्य के लिए किया जा सके।
00:01:03इन स्किल्स की खूबसूरती 'प्रोग्रेसिव डिस्क्लोजर' नामक तकनीक में है, जहाँ शुरुआत में केवल आवश्यक
00:01:08जानकारी ही दिखाई जाती है, और मॉडल जरूरत पड़ने पर गहराई से जानकारी ढूँढ सकता है।
00:01:13इसलिए जब कोई एजेंट लोड होता है, तो केवल प्रत्येक स्किल के फ्रंट मैटर की जानकारी ही कॉन्टेक्स्ट में लोड होती है,
00:01:19और प्रॉम्प्ट पढ़ने के बाद, वह हर स्किल के विवरण की जाँच करता है कि क्या कोई
00:01:24स्किल उस प्रॉम्प्ट को बेहतर बना सकती है, और यदि उसे ऐसी स्किल मिलती है, तो वह फ्रंट मैटर के बाहर की
00:01:31सारी जानकारी मॉडल के एक्टिव कॉन्टेक्स्ट में जोड़ देता है। आप स्किल्स के साथ दूसरी फाइलों को भी लिंक कर सकते हैं,
00:01:36जैसे कि रेफरेंस, ताकि जरूरत पड़ने पर मॉडल उन्हें एक्सेस कर सके।
00:01:40तब से, माइक्रोसॉफ्ट, ओपनएआई और ओपनकोड जैसी अन्य कंपनियों ने भी एजेंट स्किल्स को अपना लिया है।
00:01:46लेकिन मैन्युअल रूप से डायरेक्टरी में जाकर रेपो क्लोन किए बिना, कई एजेंटों के लिए स्किल इंस्टॉल करने का कोई आसान तरीका नहीं था।
00:01:52यह बात तब और भी स्पष्ट हो गई जब वासल अपने टूल्स के स्किल्स को लोगों के साथ शेयर करना चाहते थे ताकि वे उन्हें अपने विशिष्ट एजेंट में डाल सकें।
00:01:58इसलिए उन्होंने 'ऐड स्किल' नाम का एक प्रोजेक्ट बनाया, जिससे 16 अलग-अलग एजेंटों में स्किल जोड़ना आसान हो जाता है।
00:02:03बस NPX Add Skill टाइप करें, और उसके बाद स्किल का नाम या रेपो की लोकेशन लिख दें।
00:02:14अब मैं जानता हूँ कि आप क्या सोच रहे हैं, लोगों को 'ऐड स्किल' का उपयोग करके कोई भी रेपो जोड़ने से क्या रोक रहा है?
00:02:19दरअसल, यह कमांड को प्रोसेस करने के बाद रेपो को क्लोन करता है, और फिर
00:02:25skill.md फाइल की तलाश करता है। अगर उसे यह नहीं मिलती, तो वह रेपो को हटाकर सफाई कर देता है। लेकिन अगर मिल जाती है,
00:02:32तो यह कॉन्फ़िगरेशन को देखकर यूजर के इंस्टॉल किए गए एजेंट का ऑटो-डिटेक्ट करता है, और फिर
00:02:37.agents/skills से उस जगह का एक सिम-लिंक बना देता है जहाँ उस एजेंट के लिए स्किल्स होनी चाहिए। जैसे कर्सर के लिए .cursor और क्लाउड कोड के लिए .clause।
00:02:44इसमें ट्रैकिंग के लिए टेलीमेट्री भी है, जिसके बारे में मैं बाद में बात करूँगा। लेकिन इस मोड़ पर, वासल के पास लोगों के लिए किसी भी एजेंट में आसानी से स्किल इंस्टॉल करने का एक तरीका था।
00:02:55लेकिन स्किल खोजने का क्या? यहीं पर skills.sh काम आता है, जो फिलहाल बिना कैटेगरी और बिना पेजिनेशन वाली स्किल्स की एक लंबी लिस्ट दिखाता है।
00:03:01और मुझे लगता है कि यह लिस्ट तब अपडेट होती है जब कोई पहली बार 'ऐड स्किल्स' या 'स्किल्स' का उपयोग करके स्किल इंस्टॉल करता है,
00:03:08जिससे पैकेज के अंदर की टेलीमेट्री ट्रिगर होती है और नाम, एजेंट और अन्य जानकारी जोड़ती है।
00:03:14यह टेलीमेट्री पूरी तरह से गुमनाम है और इसका उपयोग न केवल लिस्ट बनाने के लिए किया जाता है, बल्कि यह भी जानने के लिए कि कोई स्किल कितनी बार डाउनलोड हुई है
00:03:20और किस विशिष्ट एजेंट द्वारा की गई है, जिससे पिछले 24 घंटों के ट्रेंडिंग स्किल्स को भी ट्रैक किया जा सकता है।
00:03:32इसके अलावा, अगर आप ट्रैकिंग को लेकर चिंतित हैं, तो आप टेलीमेट्री को पूरी तरह से डिसेबल भी कर सकते हैं।
00:03:37यह अद्भुत है कि वासल लैब्स ने स्किल डिस्कवरी में कितनी मेहनत की है और बहुत सारे लोग इसका उपयोग
00:03:42अपने एजेंटों के लिए React Native स्किल्स, बेहतर ऑथेंटिकेशन के लिए बेस्ट प्रैक्टिस और यहाँ तक कि
00:03:48बेहद लोकप्रिय ReMotion स्किल खोजने के लिए कर रहे हैं, जिसका उपयोग लोग सिर्फ एक प्रॉम्प्ट से हर तरह के शानदार वीडियो बनाने के लिए कर रहे हैं।
00:03:53लेकिन क्या क्लाउडफ्लेयर के नए प्रस्ताव ने इन सब पर पानी फेर दिया है? क्योंकि यह एजेंटों के लिए स्किल खोजने का एक वैकल्पिक तरीका पेश करता है,
00:04:05जिसमें सबसे पहले एक जाने-पहचाने स्थान से एक लाइटवेट JSON फाइल ली जाती है जो उपलब्ध सभी स्किल्स को लिस्ट करती है।
00:04:12तो आप अनिवार्य रूप से एक प्रॉम्प्ट लिख सकते हैं कि “Wrangler का उपयोग करके मेरे लिए एक क्लाउडफ्लेयर प्रोजेक्ट बनाओ”
00:04:18और एजेंट पहले प्रॉम्प्ट पढ़ेगा और फिर [cloudflare.com/well-known](https://www.google.com/search?q=https://cloudflare.com/well-known) जैसे जाने-पहचाने स्थान की जाँच करेगा।
00:04:24बेशक यह वास्तव में 'well-known' नहीं होगा, यह /skills जैसा कुछ होगा
00:04:30और फिर उस स्थान से index.json प्राप्त करेगा जिसमें प्रत्येक स्किल की अनिवार्य जानकारी जैसे नाम, विवरण और संबंधित फाइलों की संख्या शामिल होगी।
00:04:38इसके बाद यह जानकारी एजेंट को दी जाती है और फिर प्रॉम्प्ट के आधार पर एजेंट को समझ आ जाता है कि
00:04:44index.json फाइल के अनुसार इस लोकेशन से Wrangler स्किल की आवश्यकता है।
00:04:49इसलिए वह उस स्थान पर एक कॉल करेगा ताकि उस स्किल से संबंधित सभी फाइलें प्राप्त की जा सकें और उन्हें कैश कर सके ताकि दोबारा जरूरत पड़ने पर वे काम आ सकें,
00:05:01और उसी स्किल का उपयोग करके यूजर को अपना जवाब देगा।
00:05:08तो हालांकि क्लाउडफ्लेयर का प्रस्ताव वाकई शानदार लगता है, लेकिन यह स्किल को खोजने लायक बनाने के लिए कुछ अतिरिक्त कदम जोड़ देता है,
00:05:14जैसे संबंधित जानकारी के साथ index.json फाइल जोड़ना और उसे एक वेल-नोन URL पर डालना,
00:05:20जिसका सटीक मतलब मुझे नहीं पता, लेकिन GitHub पर स्किल डालने और उसे वर्सेल द्वारा खोजे जाने की तुलना में,
00:05:27मुझे लगता है कि क्लाउडफ्लेयर का तरीका छोटे डेवलपर्स के लिए नुकसानदायक है क्योंकि इसमें कई अतिरिक्त स्टेप्स हैं। लेकिन अगर इसे स्वीकार कर लिया जाता है,
00:05:33और मुझे यह भी नहीं पता कि इसका रिव्यू कौन कर रहा है और किसे इसे स्वीकार करना है, तो इसका मतलब है कि वर्सेल के skills.sh प्रोजेक्ट को अलविदा कहना होगा।
00:05:46हालांकि, मुझे यकीन है कि उनके साथ काम करने का कोई रास्ता निकल सकता है क्योंकि आप इंडी और कम प्रसिद्ध डेवलपर्स की स्किल्स खोजने के लिए skill.sh का उपयोग कर सकते हैं
00:05:57और क्लाउडफ्लेयर और वर्सेल जैसी बड़ी कंपनियों की स्किल्स को ऑटोमैटिक डिस्कवर करने के लिए क्लाउडफ्लेयर का तरीका अपना सकते हैं। चाहे जो भी हो,
00:06:03इन स्किल्स का उपयोग करके नए प्रोजेक्ट्स बनाने वाले डेवलपर्स को एरर ट्रैकिंग की जरूरत होगी ताकि कहीं कुछ गड़बड़ होने पर उन्हें पता चल सके,
00:06:07और यहीं 'बेटर स्टैक' काम आता है क्योंकि यह न केवल आपके बैक-एंड से लॉग्स लेता है,
00:06:12बल्कि अपने AI-नेटिव एरर ट्रैकिंग का उपयोग करके फ्रंट-एंड की गलतियों पर भी नज़र रख सकता है
00:06:18और सोने पर सुहागा यह कि बेटर स्टैक सुंदर स्टेटस पेज भी बना सकता है, तो आज ही बेटर स्टैक को आजमाएं।

Key Takeaway

यह वीडियो वर्सेल और क्लाउडफ्लेयर द्वारा एआई एजेंटों की कार्यक्षमता बढ़ाने के लिए विकसित किए जा रहे नए 'एजेंट स्किल्स' फ्रेमवर्क और उनके बीच के तकनीकी अंतर को समझाता है।

Highlights

वर्सेल एजेंट स्किल्स एक डायरेक्टरी है जो एआई एजेंटों की क्षमताओं को बढ़ाने के लिए विशिष्ट 'स्किल्स' प्रदान करती है।

एजेंट स्किल्स .cloud फोल्डर और skills.md फाइल का उपयोग करके काम करती हैं, जिसमें निर्देश और विवरण होते हैं।

'प्रोग्रेसिव डिस्क्लोजर' तकनीक का उपयोग करके मॉडल केवल आवश्यकता पड़ने पर ही गहरी जानकारी लोड करता है।

NPX Add Skill टूल 16 अलग-अलग एजेंटों में आसानी से स्किल्स इंस्टॉल करने और ऑटो-डिटेक्ट करने की सुविधा देता है।

क्लाउडफ्लेयर का नया प्रस्ताव JSON आधारित ऑटोमैटिक डिस्कवरी का सुझाव देता है, जो वर्सेल के वर्तमान सिस्टम के लिए एक विकल्प हो सकता है।

टेलीमेट्री का उपयोग स्किल्स की लोकप्रियता और ट्रेंड्स को ट्रैक करने के लिए किया जाता है, जिसे यूजर चाहें तो बंद कर सकते हैं।

बेटर स्टैक जैसे टूल्स डेवलपर्स को उनके एआई प्रोजेक्ट्स में एरर ट्रैकिंग और लॉगिंग में मदद करते हैं।

Timeline

एजेंट स्किल्स का परिचय और संरचना

इस शुरुआती भाग में वर्सेल एजेंट स्किल्स की डायरेक्टरी और इसकी कार्यप्रणाली के बारे में बताया गया है। स्पीकर बताते हैं कि कैसे ये स्किल्स किसी साधारण एआई एजेंट को रिएक्ट विशेषज्ञ या मोशन ग्राफिक्स एडिटर में बदल सकती हैं। तकनीकी रूप से, यह सिस्टम .cloud फोल्डर के भीतर एक विशिष्ट डायरेक्टरी संरचना और skills.md फाइल पर निर्भर करता है। इसमें YAML फ्रंट मैटर का होना अनिवार्य है जिसमें स्किल का नाम और विवरण दिया जाता है। यह खंड स्पष्ट करता है कि कैसे ये निर्देश मॉडल के कॉन्टेक्स्ट में लोड होकर उसे विशिष्ट कार्यों के लिए तैयार करते हैं।

प्रोग्रेसिव डिस्क्लोजर और व्यापक अपनाव

यहाँ 'प्रोग्रेसिव डिस्क्लोजर' तकनीक की सुंदरता पर चर्चा की गई है, जो कॉन्टेक्स्ट विंडो को कुशलतापूर्वक प्रबंधित करती है। शुरुआत में केवल फ्रंट मैटर की जानकारी लोड होती है, और यदि प्रॉम्प्ट को इसकी आवश्यकता होती है, तभी पूरी फाइल का विवरण एक्टिव कॉन्टेक्स्ट में जोड़ा जाता है। एंथ्रोपिक द्वारा शुरू की गई इस तकनीक को अब माइक्रोसॉफ्ट और ओपनएआई जैसी बड़ी कंपनियों ने भी अपना लिया है। हालाँकि, शुरुआत में स्किल्स को मैन्युअल रूप से क्लोन करना पड़ता था, जो एक बड़ी चुनौती थी। यह खंड एआई मॉडल्स के प्रभावी उपयोग के लिए सूचना के क्रमिक प्रकटीकरण के महत्व को रेखांकित करता है।

NPX Add Skill और ऑटो-डिटेक्शन

वर्सेल ने स्किल्स को इंस्टॉल करना आसान बनाने के लिए 'NPX Add Skill' प्रोजेक्ट पेश किया है, जो 16 विभिन्न एजेंटों का समर्थन करता है। यह टूल स्वचालित रूप से यूजर के एजेंट (जैसे कर्सर या क्लाउड कोड) को पहचानता है और सही स्थान पर सिम-लिंक बना देता है। सुरक्षा के लिए, यह रेपो को क्लोन करने के बाद skills.md फाइल की जाँच करता है और न मिलने पर उसे हटा देता है। यह प्रक्रिया तकनीकी जटिलता को कम करती है ताकि डेवलपर्स आसानी से नई क्षमताएं जोड़ सकें। इस खंड में कर्सर के लिए .cursor और क्लाउड कोड के लिए .clause जैसी फाइलों के उपयोग का उदाहरण दिया गया है।

स्किल डिस्कवरी और टेलीमेट्री सिस्टम

वीडियो का यह हिस्सा skills.sh वेबसाइट के बारे में है, जो उपलब्ध स्किल्स को खोजने के लिए एक हब के रूप में कार्य करता है। यह सिस्टम गुमनाम टेलीमेट्री का उपयोग करता है ताकि यह पता लगाया जा सके कि कौन सी स्किल्स ट्रेंड कर रही हैं और कितनी बार डाउनलोड हुई हैं। डेवलपर्स इस प्लेटफॉर्म पर रिएक्ट नेटिव और रीमोशन (ReMotion) जैसी लोकप्रिय स्किल्स पा सकते हैं। प्राइवेसी के प्रति जागरूक यूजर्स के लिए टेलीमेट्री को डिसेबल करने का विकल्प भी उपलब्ध है। यह खंड बताता है कि कैसे डेटा के माध्यम से एक बेहतर डेवलपर ईकोसिस्टम बनाया जा रहा है।

क्लाउडफ्लेयर का प्रस्ताव बनाम वर्सेल

यहाँ क्लाउडफ्लेयर द्वारा प्रस्तावित एक वैकल्पिक 'ऑटो-डिस्कवरी' पद्धति की व्याख्या की गई है जो JSON फाइलों पर आधारित है। इस तरीके में एजेंट एक 'well-known' URL से index.json फाइल लोड करता है और आवश्यकतानुसार फाइलों को कैश करता है। स्पीकर का मानना है कि क्लाउडफ्लेयर का तरीका बड़ी कंपनियों के लिए अच्छा है लेकिन छोटे डेवलपर्स के लिए इसमें कदम अधिक हैं। यदि यह प्रस्ताव मान लिया जाता है, तो वर्सेल के प्रोजेक्ट के भविष्य पर सवाल उठ सकते हैं। यह खंड भविष्य की तकनीकी प्रतिस्पर्धा और मानकीकरण की संभावनाओं पर गहराई से विचार करता है।

निष्कर्ष और एरर ट्रैकिंग समाधान

अंतिम भाग में स्पीकर सुझाव देते हैं कि वर्सेल और क्लाउडफ्लेयर के दोनों तरीके एक साथ सह-अस्तित्व में रह सकते हैं। छोटे और स्वतंत्र डेवलपर्स के लिए वर्सेल का तरीका बेहतर रह सकता है, जबकि बड़ी सेवाओं के लिए क्लाउडफ्लेयर का। इसके साथ ही, एआई प्रोजेक्ट्स में आने वाली गलतियों को पकड़ने के लिए 'बेटर स्टैक' (Better Stack) जैसे टूल का उपयोग करने की सलाह दी गई है। यह टूल बैक-एंड लॉग्स और एआई-नेटिव फ्रंट-एंड एरर ट्रैकिंग दोनों में सक्षम है। वीडियो एक व्यावहारिक समाधान और डेवलपर टूल्स के सुझाव के साथ समाप्त होता है।

Community Posts

View all posts