"PI" (कोडिंग) एजेंट सिर्फ एक और अद्भुत कोडिंग एजेंट से कहीं बढ़कर है!

MMaximilian Schwarzmüller
컴퓨터/소프트웨어창업/스타트업주식 투자AI/미래기술

Transcript

00:00:00मुझे एक और कोडिंग एजेंट के बारे में बात करनी है। और मुझे पता है, मुझे पता है, मैंने पहले ही वीडियो बनाए हैं
00:00:07और क्लाउड कोड (Claude Code) और कोडेक्स (Codex) पर कोर्स भी दिए हैं क्योंकि वे दोनों शानदार हैं और निश्चित रूप से आपके पास
00:00:15कर्सर (Cursor) और गिटहब कोपायलट (GitHub Copilot) भी हैं और उस पर भी मेरा एक कोर्स है, जिसके लिंक नीचे दिए गए हैं। लेकिन आज मैं
00:00:21पाई (Pi) कोडिंग एजेंट के बारे में बात करना चाहता हूँ, क्योंकि यह सिर्फ एक कोडिंग एजेंट से कहीं बढ़कर है। अब,
00:00:31फिर से कहूँ तो, ये सभी टूल्स आपका काम कर देंगे। कोई भी चुनाव गलत या सही नहीं है। और मैं पूरी तरह समझता हूँ कि
00:00:38यह सब फिर से 2019 के जावास्क्रिप्ट फ्रेमवर्क युद्ध (framework wars) जैसा महसूस हो सकता है जहाँ
00:00:46हर हफ्ते एक नया चमकता हुआ टूल सामने आता था। और हाँ, कुछ हद तक यह वैसा ही है,
00:00:53मुझे लगता है। लेकिन फिर से, बिल्कुल पहले की तरह, अगर हम ईमानदारी से कहें, तो इससे बहुत ज़्यादा फर्क नहीं पड़ता कि
00:01:00आप किसे चुनते हैं। यह कोई स्पॉन्सर्ड वीडियो भी नहीं है और इस पर मेरा कोई कोर्स नहीं है।
00:01:06मुझे सच में लगता है कि यह पाई कोडिंग एजेंट एक ऐसा टूल है जिसे आपको आज़माना चाहिए। अब,
00:01:13कोडेक्स और क्लाउड कोड या ओपन कोड की तरह, इसमें कोई फिक्स्ड सब्सक्रिप्शन
00:01:20नहीं मिलता। ओपन कोड के साथ, ज़ाहिर है, आप इसे बिना सब्सक्रिप्शन के भी इस्तेमाल कर सकते हैं किसी दूसरे
00:01:27सब्सक्रिप्शन जैसे कोडेक्स का उपयोग करके या उपयोग के अनुसार भुगतान (pay per use) करके। पाई कोडिंग एजेंट के साथ,
00:01:32आपके पास केवल 'पे पर यूज़' या किसी अन्य सब्सक्रिप्शन का उपयोग करने का विकल्प है। उदाहरण के लिए,
00:01:39यहाँ, अगर मैं इसे शुरू करूँ, मैंने इसे अपने सिस्टम पर इंस्टॉल किया है, मैं इसे अपने कोडेक्स सब्सक्रिप्शन के साथ उपयोग कर रहा हूँ, जिसे मैं
00:01:45कोडेक्स ऐप, कोडेक्स CLI के साथ उपयोग कर सकता था, लेकिन यहाँ भी कर सकता हूँ। मुझे लगता है कि आप इसे
00:01:50एंथ्रोपिक, यानी क्लाउड कोड सब्सक्रिप्शन के साथ भी उपयोग कर सकते हैं, लेकिन शायद आपने सुना होगा कि वे
00:01:55इसे पसंद नहीं करते और जहाँ तक मुझे पता है, इससे आपका अकाउंट बैन हो सकता है। अब, इस पाई में ऐसा क्या खास है?
00:02:00आप इसे रेगुलर कोडेक्स CLI के बजाय क्यों उपयोग करेंगे? इसके कुछ कारण हैं। पहली बात तो,
00:02:08पाई, यह एजेंट सकारात्मक तरीके से बहुत ही हल्का (lean) और सरल है। इसका सिस्टम प्रॉम्प्ट बहुत छोटा है
00:02:20और यह केवल कुछ ही टूल्स के साथ आता है। मूल रूप से, जहाँ तक मुझे पता है, अगर यह बदला नहीं है,
00:02:28तो यह केवल रीड (read), राइट (write), एडिट (edit) और एक बैश (bash) टूल के साथ आता है। और बैश टूल, ज़ाहिर है, सबसे शक्तिशाली है
00:02:36क्योंकि अगर आपके पास बैश टूल है, तो आपके पास अनिवार्य रूप से हर चीज़ तक पहुँच है क्योंकि आप,
00:02:44अंततः सिर्फ बैश के साथ, सिर्फ कमांड लाइन के ज़रिए अपने पूरे सिस्टम, अपनी पूरी मशीन को नियंत्रित कर सकते हैं
00:02:50क्योंकि आप वहाँ से कई अन्य टूल्स को कॉल कर सकते हैं। और जैसा कि पता चला है,
00:02:55और जैसा कि मैंने एक अन्य वीडियो में भी बताया है, CLI ही वे मुख्य चीज़ें लगती हैं जिन्हें आप अभी
00:03:03अपने एजेंटों, अपने कोडिंग एजेंटों को देना चाहते हैं, क्योंकि वे CLI का उपयोग करने में बहुत अच्छे हैं, यहाँ तक कि
00:03:10उनका भी जिन्हें उन्होंने पहले कभी नहीं देखा। और निश्चित रूप से, CLI के माध्यम से, यानी कमांड लाइन इंटरफेस
00:03:15या अन्य लोगों द्वारा लिखे गए टूल्स के ज़रिए, आपके एजेंट आपके कंप्यूटर पर बहुत कुछ कर सकते हैं। वे
00:03:21HTTP रिक्वेस्ट भेज सकते हैं। वे स्क्रिप्ट शुरू और निष्पादित कर सकते हैं। वे JSON डेटा पार्स कर सकते हैं। वे
00:03:29हर तरह के काम कर सकते हैं। और यही इस पाई एजेंट का दर्शन है। बहुत ही न्यूनतम, लेकिन इसे सबसे शक्तिशाली टूल,
00:03:35बैश टूल की पहुँच दें, ताकि यह सब कुछ कर सके। और जब इसे
00:03:41एक बहुत ही छोटे, सरल सिस्टम प्रॉम्प्ट के साथ जोड़ा जाता है, तो आपको एक ऐसा एजेंट मिलता है जिसका कॉन्टेक्स्ट विंडो
00:03:50फालतू चीज़ों से भरा नहीं होता और वह आपकी इच्छानुसार कुछ भी करने के लिए बहुत लचीला होता है। और
00:03:57उनका पूरा दर्शन यही है कि इसमें बहुत सारी चीज़ें भरने के बजाय, आपको एक ऐसा एजेंट मिलता है
00:04:04जो सुपर एक्सटेंसिबल है। आप इसमें 'एक्सटेंशन' नामक चीज़ें इंस्टॉल कर सकते हैं। हम उस पर वापस आएंगे।
00:04:10आप एजेंट स्किल्स (skills) का उपयोग कर सकते हैं। यहाँ मैं इस आधिकारिक मानक की बात कर रहा हूँ, जो एक तरह का मानक ही है,
00:04:17हालाँकि अलग-अलग टूल्स इसे अलग तरह से लागू करते हैं। लेकिन एजेंट स्किल्स के पीछे मूल विचार यह है
00:04:24कि आपके पास स्किल डायरेक्टरी और स्किल MD फाइलें होती हैं, और उनमें प्रॉम्प्ट या अतिरिक्त कॉन्टेक्स्ट होता है,
00:04:31आप इसे जो भी नाम देना चाहें। और वे मांग पर लोड होते हैं, तुरंत नहीं, बल्कि काम के आधार पर ज़रूरत पड़ने पर
00:04:39कि आपका एजेंट किस टास्क पर काम कर रहा है। उदाहरण के लिए, यहाँ चल रहे इस पाई सेशन में,
00:04:46मैंने बहुत सारी स्किल्स लोड की हैं, कुछ ग्लोबल स्किल्स जिन्हें मैंने सेट किया है जहाँ मैंने कुछ खास स्किल्स
00:04:53के साथ प्रयोग किया और कुछ स्किल्स जो बहुत काम आती हैं, जैसे कि कोड रिसर्च स्किल। और अगर मैं
00:04:59उस पर नज़र डालूँ, तो आप देखेंगे कि वह सिर्फ एक नाम और विवरण वाली मार्कडाउन फाइल है। इन स्किल्स में
00:05:03विवरण (description) बहुत महत्वपूर्ण है क्योंकि अंततः यही चीज़ एजेंट को किसी स्किल को सक्रिय करने
00:05:08और उसका उपयोग करने के लिए प्रेरित करती है। वह इस फाइल के बाकी हिस्से को तभी लोड करता है जब उसे लगता है कि
00:05:16दी गई टास्क के लिए यह स्किल प्रासंगिक है, जो इस नाम और विवरण पर आधारित होता है। और फिर, फिर से,
00:05:21यह सिर्फ कुछ अतिरिक्त कॉन्टेक्स्ट है, एक अतिरिक्त प्रॉम्प्ट है जहाँ इस मामले में मेरी कोड रिसर्च
00:05:26स्किल के लिए, मैं उस एजेंट को बताता हूँ जो इसमें रुचि रखता है, जैसे कि पाई, लेकिन कोडेक्स भी, अगर वह इस स्किल को लोड करता है,
00:05:32कि कोड रिसर्च कैसे करना है, मैं उसे कैसे करवाना चाहता हूँ, कि उसे पीटर स्टीनबर्गर द्वारा बनाए गए
00:05:38MC पोर्टर टूल का उपयोग करना चाहिए ताकि वह अन्य MCP सर्वर जैसे डीप विकी MCP सर्वर का उपयोग कर सके, जो एक MCP सर्वर है
00:05:46जिसका उपयोग गिटहब रिपॉजिटरी को एक्सप्लोर करने और उनके बारे में अधिक जानने के लिए किया जा सकता है, और कुछ अन्य टूल्स
00:05:51जिनका उसे रिसर्च के लिए उपयोग करना चाहिए। और यहाँ एक और महत्वपूर्ण बात है, MCPs की बात करें तो, पाई
00:05:58एजेंट में MCP के लिए कोई सपोर्ट नहीं है। इसका कारण यह है कि MCPs वास्तव में आपकी कॉन्टेक्स्ट
00:06:05विंडो क्योंकि उपलब्ध MCP टूल्स और संसाधनों के बारे में बहुत सारी जानकारी होती है
00:06:10जिन्हें AI को जागरूक करने के लिए कॉन्टेक्स्ट विंडो में डालना पड़ता है। और पाई के पीछे की टीम या व्यक्ति
00:06:18ऐसा नहीं चाहते। यहाँ यही तर्क है। यह मेरी तरह कई अन्य लोगों द्वारा भी साझा की गई एक राय है।
00:06:23और मुझे पता है कि इसके लिए MCP सर्च जैसे समाधान मौजूद हैं, लेकिन फिर भी
00:06:28यहाँ कोई MCP सपोर्ट नहीं है। और अगर आप इस MC पोर्टर टूल जैसी किसी चीज़ का उपयोग करते हैं तो आपको इसकी ज़रूरत भी नहीं है।
00:06:35और जब मैं 'उपयोग' कहता हूँ, तो मेरा मतलब है, मैं AI को बता रहा हूँ कि इस MC पोर्टर टूल को ज़रूरत पड़ने पर कैसे चलाना है
00:06:43जब वह वास्तव में MCP के साथ काम करना चाहता है, ताकि यह ऐसी चीज़ न हो जिसे इंस्टॉल करने या कॉन्टेक्स्ट
00:06:49विंडो में दिखाने की ज़रूरत हो। तो आपको अंदाज़ा हो गया होगा। यह वास्तव में न्यूनतम और हल्का है। और यही
00:06:54इस पाई कोडिंग एजेंट की पूरी कहानी या मुख्य बात है। मैंने पहले ही इसका उल्लेख किया है। इस एजेंट की
00:07:01एक और बड़ी बात इसकी 'एक्सटेंसिबिलिटी' (विस्तार क्षमता) है। और यह सिर्फ स्किल्स तक सीमित नहीं है। यह सबसे पहले,
00:07:08मुझे लगता है, एक्सटेंशन के बारे में है। और एक्सटेंशन के पीछे विचार यह है कि इस पाई कोडिंग एजेंट में
00:07:16इसे विस्तारित करने के लिए, एजेंट के विभिन्न हिस्सों और एजेंटिक लूप के विभिन्न चरणों
00:07:22से जुड़ने के लिए फर्स्ट-पार्टी सपोर्ट है। इसलिए जब एजेंट काम कर रहा होता है और आपको हर तरह की चीज़ें करने और
00:07:30इस एजेंट को हर तरह से विस्तारित करने की अनुमति देता है। और उदाहरण के लिए, यदि आप चाहें तो MCP सपोर्ट जोड़ सकते हैं।
00:07:36अब मैंने यहाँ खुद कुछ एक्सटेंशन सेट किए हैं। उदाहरण के लिए, मैंने एक एक्सटेंशन के माध्यम से
00:07:41एक 'प्लान मोड' जोड़ा है। आप ऐसा कर सकते हैं। डिफ़ॉल्ट रूप से कोई प्लान मोड नहीं दिया गया है, लेकिन यह इतना विस्तार योग्य है
00:07:47कि आप एक ऐसा मोड जोड़ सकते हैं जो एजेंट को राइट या एडिट टूल्स का उपयोग करने से रोकता है। यदि यह अभी भी
00:07:53प्लान मोड में है, तो यह एक्सटेंशन आपको एक शॉर्टकट सेट करने की अनुमति देता है जो आपको उस प्लान
00:08:00मोड में स्विच करने की सुविधा देता है। यह आपको UI, यानी टर्मिनल UI को अपडेट करने की अनुमति देता है ताकि उपयोगकर्ता को दिखे कि आप प्लान मोड में हैं।
00:08:07आप अतिरिक्त स्लैश कमांड जैसे /plan भी जोड़ सकते हैं, जो मुझे प्लान मोड में डाल देता है, और यह संकेतक देता है।
00:08:14और अब, उदाहरण के लिए, कुछ टूल्स ब्लॉक हो जाएंगे और मैं फिर से इससे बाहर निकल सकता हूँ।
00:08:20तो इस तरह की चीज़ें आप एक्सटेंशन के साथ कर सकते हैं। और एक तरह का
00:08:24आधिकारिक एक्सटेंशन मार्केटप्लेस भी है क्योंकि इस PAI एजेंट का विचार आपको अपने एक्सटेंशन
00:08:31या स्किल्स को पैकेज करने और दूसरों के साथ साझा करने की अनुमति देना भी है। और आपके और मेरे जैसे अन्य लोग,
00:08:36अन्य लोगों द्वारा बनाए गए एक्सटेंशन को इंस्टॉल करने के लिए उन पैकेजों को इंस्टॉल कर सकते हैं।
00:08:40और सब-एजेंट्स (subagents) जैसी चीज़ें भी हैं, जिन्हें आप एक पैकेज के माध्यम से जोड़ सकते हैं जिसमें सब-एजेंट्स
00:08:47जोड़ने का एक्सटेंशन या वेब एक्सेस पैकेज शामिल है, जो बहुत अच्छा है, जो एजेंट को वेब रिसर्च करने
00:08:54और वेबसाइट की सामग्री को कुशलतापूर्वक प्राप्त करने के लिए अतिरिक्त टूल्स देता है। तो आपको अंदाज़ा हो गया होगा। यह वास्तव में
00:09:00विस्तार योग्य है। आपको एक बहुत ही न्यूनतम कोर मिलता है और फिर आप इसे किसी भी तरह से विस्तारित कर सकते हैं, कोई भी
00:09:06स्किल या एक्सटेंशन जोड़ सकते हैं। और यह अपने आप में ही बहुत दिलचस्प है क्योंकि, निश्चित रूप से,
00:09:12क्लाउड कोड और कोडेक्स और इन सभी अन्य टूल्स के साथ, आपको पहले से बने टूल्स मिलते हैं जो
00:09:20शुरुआत में ही बहुत शक्तिशाली होते हैं, लेकिन कम विस्तार योग्य होते हैं। PAI के साथ विचार इसके विपरीत है।
00:09:28आपको एक न्यूनतम कोर मिलता है और फिर आप इसे अपनी पसंद की किसी भी चीज़ में बदल सकते हैं। और आप ऐसा
00:09:33वैश्विक स्तर पर कर सकते हैं, लेकिन हर प्रोजेक्ट के आधार पर भी कर सकते हैं क्योंकि ये सभी स्किल्स, ये सभी एक्सटेंशन
00:09:39ग्लोबली या प्रति प्रोजेक्ट इंस्टॉल किए जा सकते हैं। और यही इसे इतना बहुमुखी बनाता है। और इसीलिए यह
00:09:46देखने लायक हो सकता है। मैं पिछले हफ्तों से इसका उपयोग कर रहा हूँ। क्लाउड कोड और कोडेक्स के साथ-साथ, मैं हर समय
00:09:51स्विच करता रहता हूँ क्योंकि ये टूल्स इतनी तेज़ी से विकसित हो रहे हैं और मुझे PAI बहुत पसंद है। अब, यहाँ एक
00:09:59दिलचस्प बात है। आप PAI को सिर्फ कोडिंग के लिए उपयोग करने तक सीमित नहीं हैं। इसे कोडिंग एजेंट
00:10:08कहा जाता है और मुख्य रूप से आप इसका उपयोग उसी के लिए करेंगे और मैं भी इसका उपयोग उसी के लिए
00:10:15कर रहा हूँ। लेकिन यह ऐसी चीज़ नहीं है जिस तक आप सीमित हैं। उदाहरण के लिए, मैंने यहाँ वेब एक्सेस
00:10:21पैकेज इंस्टॉल किया और उसे अपनी जेमिनी (Gemini) API की से जोड़ दिया ताकि इस PAI एजेंट को जेमिनी API
00:10:30पर आधारित वेब रिसर्च तक पूरी पहुँच मिल सके। और इसलिए, मैं इस एजेंट को किसी भी प्रोजेक्ट,
00:10:35किसी भी कोडिंग प्रोजेक्ट के बाहर चला सकता था, और मैं अपने एजेंट को इस तरह का काम दे सकता था: एप्पल
00:10:41और एनवीडिया (Nvidia) के शेयरों के पिछले सात दिनों पर कुछ रिसर्च करो, उनकी कीमतें लाओ, और उनके
00:10:46सात दिनों के प्रदर्शन का विश्लेषण करो। और अगर मैं ऐसा करता हूँ, तो यह आगे बढ़ेगा और वह काम करेगा। और यह
00:10:55इन शेयरों के लिए मूल्य डेटा प्राप्त करने का एक तरीका खोज लेगा। यह वेब सर्च करेगा, शायद उनके 'इन्वेस्टर रिलेशन'
00:11:04पेजों पर जाएगा, देखते हैं। और फिर यह निश्चित रूप से वास्तविक गणना भी करेगा, एक अस्थायी
00:11:12स्क्रिप्ट चलाएगा या ऐसा ही कुछ करेगा। देखते हैं यह क्या करता है। उदाहरण के लिए, यहाँ इसने एक वेब रिसर्च
00:11:18स्किल को सक्रिय किया जिसे मैंने जोड़ा था जहाँ मैं उसे वेब रिसर्च करने के तरीके के बारे में अधिक विवरण देता हूँ। और फिर यह
00:11:23उसे करने की कोशिश करता है। अब, यहाँ एक समस्या आ रही है क्योंकि मेरे पास पायथन इंस्टॉल नहीं है या पायथन
00:11:29एग्जीक्यूटेबल इस तरह नहीं है, यह 'पायथन 3' होना चाहिए था और इसने वह भी समझ लिया। और फिर इसने
00:11:34स्क्रिप्ट लिखी जहाँ इसने पायथन की मदद से एक वेबसाइट से कुछ डेटा प्राप्त किया, एक अस्थायी स्क्रिप्ट,
00:11:40जिसे इसने यहाँ निष्पादित किया, और लगता है कि इसे यहाँ शेयरों की कुछ कीमतें मिल गई हैं। और फिर यह बहुत संभव है कि
00:11:47यह एक छोटी स्क्रिप्ट भी लिखेगा जो इसे उसके आधार पर गणना करने और शेयर की कीमत में
00:11:55उतार-चढ़ाव की गणना करने की अनुमति देगी। और थोड़ी देर काम करने और कई चीज़ों पर रिसर्च करने के बाद,
00:12:01जिसमें कुछ समाचार रिसर्च भी शामिल है, यह पूरा हो गया है। और यह मुझे एप्पल और एनवीडिया के पिछले सात दिनों का डेटा
00:12:08देता है और दिखाता है कि इन दिनों उनके शेयरों में कैसा विकास हुआ। यहाँ मुझे कुछ प्रदर्शन सारांश
00:12:14मिलते हैं। और यह मुझे कुछ मौखिक विश्लेषण भी देता है जहाँ यह मेरे पढ़ने के लिए अपने परिणामों को
00:12:23एक 'एग्जीक्यूटिव रिपोर्ट' की तरह सारांशित करता है। और यह सब इस पाई कोडिंग एजेंट द्वारा उन एक्सटेंशन
00:12:29और स्किल्स के साथ किया गया जो मैंने इसे दिए थे, और कुछ नहीं। मेरी तरफ से कोई कोड नहीं, कोई विशिष्ट निर्देश नहीं,
00:12:36कि किन साइटों पर जाना है। इसने यह सब अपने आप किया। और आप क्लाउड कोड या कोडेक्स के साथ
00:12:43भी ऐसा बिल्कुल कर सकते हैं, क्योंकि अंततः, ये सभी AI एजेंट हैं जिनके पास काम पूरा करने के लिए बहुत सारे टूल्स हैं।
00:12:50और हालाँकि वे मुख्य रूप से कोडिंग के लिए बनाए गए हैं, आप निश्चित रूप से उनका उपयोग हर तरह के
00:12:56अन्य कामों के लिए कर सकते हैं। क्योंकि अंत में, निश्चित रूप से, इस टास्क में कुछ वेबसाइटों को प्राप्त करना
00:13:01और कुछ स्क्रिप्ट लिखना शामिल था, जो कोडिंग प्रोजेक्ट्स के बहुत समान है जहाँ आप यह भी
00:13:06चाह सकते हैं कि यह कुछ डॉक्यूमेंट्स लाए और कुछ कोड लिखे, है ना? तो यह बहुत सी अन्य चीज़ें भी कर सकता है।
00:13:11मेरे विचार में पाई इस तरह के कामों के लिए कोडेक्स या क्लाउड की तुलना में थोड़ा बेहतर क्यों है,
00:13:17क्योंकि इसका एक न्यूनतम कोर है और इसे बिल्कुल वैसा टूल बनाने के लिए विस्तारित किया जा सकता है जैसा आप चाहते हैं,
00:13:24यहाँ तक कि हर प्रोजेक्ट के आधार पर भी। तो आपके पास अपने सिस्टम पर एक प्रोजेक्ट हो सकता है जिसमें एक
00:13:29रिसर्च एक्सपर्ट हो, दूसरा प्रोजेक्ट जिसमें शेयर मार्केट रिसर्च एक्सपर्ट हो, और तीसरा प्रोजेक्ट
00:13:37जिसमें पूरी तरह से अलग एक्सपर्ट हो, जो आपके सिस्टम और आपकी हार्ड ड्राइव के उपयोग का विश्लेषण करने वाला एक्सपर्ट हो,
00:13:42या ऐसा ही कुछ। और शायद यही कारण है कि 'ओपनक्ला' (OpenClaw)
00:13:50आंतरिक रूप से पाई का उपयोग कर रहा है। तो यहाँ मैं ओपनक्ला रिपॉजिटरी के लिए डीप विकी पर हूँ। यदि आप
00:13:55इसे नहीं जानते हैं, तो यह गिटहब रिपॉजिटरी के बारे में अधिक जानने के लिए एक बेहतरीन वेबसाइट है। यह उनका विश्लेषण करती है और फिर
00:14:00वहाँ दिखने वाले कोड के आधार पर तुरंत बनाया गया डॉक्यूमेंटेशन प्रदान करती है। और आप रिपॉजिटरी के साथ
00:14:05चैट भी कर सकते हैं। और यहाँ मैं पूछ सकता था, क्या ओपनक्ला आंतरिक रूप से पाई कोडिंग एजेंट का उपयोग कर रहा है?
00:14:12यदि हाँ, तो कैसे? और यह उस कोड का विश्लेषण करेगा, जिसे इसने पहले ही लोड कर लिया है। और यह मुझे बताता है,
00:14:18हाँ, ओपनक्ला पाई कोडिंग एजेंट का उपयोग कर रहा है। और यह मुझे बताता है कि वास्तव में इसे कैसे लागू किया गया है। तो
00:14:24हाँ, यह पाई कोडिंग एजेंट है। और मुझे बस इसे साझा करने का मन हुआ। फिर से, इसलिए नहीं कि मैं इससे
00:14:31कुछ कमा रहा हूँ। मेरा कोई कोर्स नहीं है, कुछ भी नहीं है। लेकिन यह एक बेहतरीन टूल है, खासकर
00:14:38यदि आप नॉन-कोडिंग कामों के लिए एजेंटों के साथ खेलना चाहते हैं। लेकिन निश्चित रूप से,
00:14:44इस बारे में बहुत स्पष्ट होने के लिए, कोडिंग टास्क के लिए भी, यह दोनों काम कर सकता है। यह एक बहुत ही
00:14:50बहुमुखी AI एजेंट है। आप इनके ऊपर अपने खुद के टूल्स भी बना सकते हैं, जैसा कि आप ओपनक्ला के साथ देख रहे हैं।
00:14:56और आप ये सभी चीज़ें कोडेक्स के साथ भी कर सकते हैं। लेकिन फिर से, यहाँ इसका न्यूनतम कोर वास्तव में अद्भुत है।
00:15:02तो कोडेक्स या क्लाउड कोड के अतिरिक्त, या उनके स्थान पर, यह देखने लायक हो सकता है। और हाँ,
00:15:09यह ऐसी चीज़ है जिसे इस्तेमाल करने में मुझे पिछले हफ्तों में बहुत मज़ा आया है। और मैं यह देखने के लिए उत्साहित हूँ
00:15:14कि यह सब एजेंट वाली चीज़ें कहाँ जा रही हैं और अब से एक साल बाद हम इनके साथ क्या कर सकते हैं। यह
00:15:18थोड़ा डरावना तो है, मैं कहूँगा, लेकिन बहुत ही दिलचस्प भी है। एक अजीब सा मिश्रण।

Key Takeaway

PI कोडिंग एजेंट एक बहुत ही न्यूनतम और लचीला टूल है जिसे उपयोगकर्ता अपनी आवश्यकताओं के अनुसार स्किल्स और एक्सटेंशन के माध्यम से पूरी तरह से कस्टमाइज़ कर सकते हैं।

Highlights

PI कोडिंग एजेंट एक न्यूनतम (minimalist) और हल्का टूल है जो अपनी सरलता के लिए जाना जाता है।

इसमें एक शक्तिशाली 'बैश टूल' (bash tool) है जो सिस्टम के सभी कमांड्स और टूल्स तक पहुँच प्रदान करता है।

यह एजेंट 'स्किल्स' और 'एक्सटेंशन' के माध्यम से अत्यधिक विस्तार योग्य (extensible) बनाया गया है।

PI में MCP सपोर्ट जानबूझकर नहीं दिया गया है ताकि कॉन्टेक्स्ट विंडो फालतू की जानकारी से न भरे।

यह कोडिंग के अलावा वेब रिसर्च और वित्तीय विश्लेषण जैसे गैर-कोडिंग कार्यों में भी सक्षम है।

Timeline

कोडिंग एजेंटों का परिचय और PI का चुनाव

वक्ता क्लाउड कोड और कोडेक्स जैसे मौजूदा प्रसिद्ध कोडिंग एजेंटों का उल्लेख करते हुए वीडियो की शुरुआत करते हैं। वे बताते हैं कि हालांकि कर्सर और गिटहब कोपायलट जैसे कई विकल्प मौजूद हैं, लेकिन PI कोडिंग एजेंट कुछ अलग और विशेष पेश करता है। वक्ता स्पष्ट करते हैं कि यह कोई प्रायोजित वीडियो नहीं है और वे इसे ईमानदारी से एक उपयोगी टूल मानते हैं। इसकी तुलना 2019 के जावास्क्रिप्ट फ्रेमवर्क युद्धों से की गई है जहाँ हर हफ्ते नए उपकरण आते थे। यह खंड स्थापित करता है कि चुनाव चाहे जो भी हो, आज़माना और सही टूल खोजना महत्वपूर्ण है।

PI का दर्शन: न्यूनतम डिजाइन और बैश टूल की शक्ति

इस खंड में PI की कार्यप्रणाली और इसकी विशिष्टता पर चर्चा की गई है, जो बिना किसी निश्चित सदस्यता के 'पे-पर-यूज़' मॉडल पर काम करता है। वक्ता बताते हैं कि इसका सिस्टम प्रॉम्प्ट बहुत छोटा है और यह केवल रीड, राइट, एडिट और बैश जैसे बुनियादी टूल्स के साथ आता है। बैश टूल को सबसे शक्तिशाली बताया गया है क्योंकि इसके ज़रिए पूरे सिस्टम और अन्य CLI टूल्स को नियंत्रित किया जा सकता है। यह न्यूनतम दृष्टिकोण कॉन्टेक्स्ट विंडो को साफ रखता है और एजेंट को अधिक कुशल बनाता है। वक्ता का तर्क है कि CLI एजेंटों के लिए सबसे प्रभावी इंटरफेस है।

एजेंट स्किल्स और MCP सपोर्ट की अनुपस्थिति

यहाँ वक्ता 'एजेंट स्किल्स' की अवधारणा को समझाते हैं जो मार्कडाउन फाइलों के माध्यम से मांग पर लोड होती हैं। PI में MCP (मॉडल संदर्भ प्रोटोकॉल) सपोर्ट नहीं है क्योंकि यह कॉन्टेक्स्ट विंडो को बहुत अधिक जानकारी से भर देता है, जो PI के दर्शन के खिलाफ है। इसके बजाय, 'MC पोर्टर' जैसे टूल्स का उपयोग करके ज़रूरत पड़ने पर MCP सर्वर से जुड़ने का सुझाव दिया गया है। स्किल्स केवल तभी सक्रिय होती हैं जब उनका विवरण कार्य के लिए प्रासंगिक पाया जाता है। यह दृष्टिकोण संसाधन प्रबंधन को बेहतर बनाता है और एजेंट को लचीला रखता है।

एक्सटेंशन और कस्टम मोड्स का उपयोग

PI की विस्तार क्षमता (extensibility) इसके मुख्य आकर्षणों में से एक है, जिसमें उपयोगकर्ता स्वयं के एक्सटेंशन जोड़ सकते हैं। वक्ता ने उदाहरण के रूप में एक 'प्लान मोड' दिखाया है जो एजेंट को गलती से कोड एडिट करने से रोकता है जब तक कि योजना तैयार न हो जाए। इसमें एक एक्सटेंशन मार्केटप्लेस भी है जहाँ सब-एजेंट्स और वेब एक्सेस जैसे पैकेज साझा किए जा सकते हैं। यह इसे क्लाउड कोड जैसे अन्य 'आउट-ऑफ-द-बॉक्स' टूल्स की तुलना में अधिक वर्सेटाइल बनाता है। उपयोगकर्ता इन सुविधाओं को वैश्विक स्तर पर या विशिष्ट प्रोजेक्ट के आधार पर कॉन्फ़िगर कर सकते हैं।

गैर-कोडिंग कार्यों के लिए PI का प्रदर्शन

अंतिम भाग में यह दिखाया गया है कि PI केवल कोडिंग तक सीमित नहीं है और जटिल शोध कार्यों को संभाल सकता है। वक्ता ने एप्पल और एनवीडिया के शेयरों का विश्लेषण करने का एक उदाहरण दिया, जहाँ एजेंट ने वेब सर्च किया और पायथन स्क्रिप्ट लिखकर डेटा प्रोसेस किया। यह ओपनक्ला (OpenClaw) जैसे प्रोजेक्ट्स में भी आंतरिक रूप से उपयोग किया जा रहा है, जो इसकी विश्वसनीयता को दर्शाता है। वक्ता भविष्य में इन एजेंटों की क्षमताओं को लेकर उत्साहित और थोड़े आशंकित भी हैं। कुल मिलाकर, PI को एक शक्तिशाली और अनुकूलन योग्य AI साथी के रूप में प्रस्तुत किया गया है।

Community Posts

View all posts