इस नए डिज़ाइनर ने खोला Claude Code का रहस्य

AAI LABS
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00काम के पैमाने और इसमें शामिल विभिन्न भूमिकाओं के कारण इंजीनियरिंग हमेशा एक बहुत ही सहयोगात्मक प्रक्रिया रही है।
00:00:05एआई के कारण इसमें बदलाव आया है, लेकिन साथ ही यह सहयोग के नए तरीके भी लाता है।
00:00:09विभिन्न मॉडलों की अपनी अलग ताकत होती है, चाहे उनकी भूमिकाओं में हो या उनकी लागत में।
00:00:13आइए एक उदाहरण लेते हैं।
00:00:14यह एक सर्वविदित तथ्य है कि नवीनतम जेमिनी मॉडल डिजाइनिंग में वास्तव में बेहतरीन हैं।
00:00:18वे किसी भी क्लाउड मॉडल की तुलना में बहुत अधिक रचनात्मक हैं, खासकर यदि आप उन्हें कम निर्देश देते हैं।
00:00:23लेकिन कुल मिलाकर, ओपस 4.6 एक उत्कृष्ट मॉडल है,
00:00:26विशेष रूप से इसके टूलिंग के रूप में क्लाउड कोड के साथ, जो जेमिनी सीएलआई की तुलना में बहुत अधिक स्थिर टूल है।
00:00:31लेकिन एक साझा वर्कफ़्लो में इनका एक साथ उपयोग करने का कोई कुशल तरीका नहीं है।
00:00:35भले ही आप उनका उपयोग करने की कोशिश करें, आपको बहुत सारा काम मैन्युअल रूप से करना होगा,
00:00:38और इन एजेंटों को स्वायत्त रूप से काम करने का कोई तरीका नहीं है।
00:00:41हाल ही में, हमें एक ऐसा टूल मिला जो विभिन्न एजेंटों को
00:00:46विभिन्न मॉडलों के साथ एक-दूसरे से चैट करने की अनुमति देकर और हमें बीच से हटाकर इस संचार समस्या को हल करता है।
00:00:50एजेंट चैटर एआई एजेंटों के रीयल-टाइम समन्वय के लिए एक चैट इंटरफ़ेस है।
00:00:55यह क्लाउड कोड, जेमिनी सीएलआई और कोडेक्स जैसे तीन सबसे लोकप्रिय एजेंटों का समर्थन करता है,
00:01:00और किमी, क्वेन और अन्य जैसे ओपन-सोर्स मॉडलों का भी।
00:01:03आप इसका उपयोग लागत बचाने के लिए भी कर सकते हैं, जैसे क्लाउड जैसे महंगे एजेंटों को योजना बनाने देना
00:01:07और किमी या जीएलएम को कार्यान्वयन करने देना।
00:01:10यह कई चैनलों के साथ एक साझा चैट का उपयोग करता है और एजेंटों को एक-दूसरे से बात करने
00:01:14और समन्वय में सुविधाएं लागू करने की अनुमति देता है।
00:01:16टूल के बारे में हमारी शुरुआती धारणा यह थी कि इसका डिफॉल्ट यूआई उतना परिष्कृत नहीं था।
00:01:20लेकिन चूंकि यह एक ओपन-सोर्स प्रोजेक्ट है, इसलिए हमने मूल रेपो को फोर्क किया और इसके ऊपर
00:01:24एक विजुअल लेयर बनाई, जो हमें बहुत बेहतर लगती है और कुछ परिवर्तनों के साथ नेविगेट करना आसान है
00:01:28जो हमारी जरूरतों के अनुकूल थे।
00:01:31हमने मूल कार्यक्षमता को बरकरार रखते हुए इस संस्करण को अपने फोर्क किए गए रेपो में पुश किया।
00:01:35लेकिन इस प्लेटफॉर्म के अंतर्निहित आर्किटेक्चर का पूरा श्रेय मूल निर्माता को जाता है।
00:01:40अब, इस प्रोजेक्ट में वास्तव में बहुत सारी स्क्रिप्ट्स हैं
00:01:43जिन्हें आपको इस टूल के लिए एजेंटों को इनिशियलाइज़ करने के लिए एक बार चलाने की आवश्यकता है।
00:01:46ये स्क्रिप्ट्स सिस्टम चलाने के प्रवेश बिंदु हैं,
00:01:49और उनके बिना आप कोई भी एजेंट नहीं चला सकते।
00:01:51इन स्क्रिप्ट्स तक पहुँचने के लिए, आपको पूरे रेपो को क्लोन करना होगा।
00:01:54रेपो में मुख्य रूप से सभी एजेंटों को अलग से इनिशियलाइज़ करने की स्क्रिप्ट्स हैं।
00:01:58लेकिन स्क्रिप्ट्स का उपयोग करने से पहले, यदि आप मैक ओएस या लिनक्स पर हैं, तो आपके पास TMUX इंस्टॉल होना चाहिए।
00:02:02TMUX मूल रूप से एक टर्मिनल मल्टीप्लेक्सर है।
00:02:05यह आपको कई टर्मिनल सत्र बनाने और उन सभी को एक ही बिंदु से नियंत्रित करने की अनुमति देता है।
00:02:09एजेंट चैट इसी का उपयोग करता है,
00:02:11प्रत्येक टर्मिनल एजेंट को कार्य भेजने के लिए जिसे वह चला रहा है।
00:02:14विंडोज वालों के लिए, आप सीधे स्क्रिप्ट चला सकते हैं और यह आपके लिए काम करेगा।
00:02:18उन्होंने प्रत्येक एजेंट की स्क्रिप्ट चलाने के लिए सभी कमांड सूचीबद्ध किए हैं।
00:02:21उदाहरण के लिए, यदि आप क्लाउड कोड और जेमिनी सीएलआई का एक साथ उपयोग करने जा रहे हैं,
00:02:26तो आप उनके कमांड कॉपी करें और उन्हें उस फोल्डर के टर्मिनल में पेस्ट करें जहां आपने रेपो क्लोन किया है।
00:02:31आप जो भी एजेंट चलाना चाहते हैं, उनके लिए कमांड चुन सकते हैं।
00:02:34कमांड पेस्ट करते ही, TMUX सत्र में एक एजेंट सत्र शुरू हो जाएगा।
00:02:38आप अपने सेटअप में जितने चाहें उतने एजेंटों का उपयोग कर सकते हैं।
00:02:40उदाहरण के लिए, आप चार एजेंट सेट कर सकते हैं, तीन क्लाउड सत्र और एक जेमिनी सत्र।
00:02:44लेकिन चाहे आप कितने भी एजेंटों का उपयोग करें, प्रत्येक को एक समर्पित टर्मिनल में चलाने की आवश्यकता होती है।
00:02:49इसलिए यदि आप चार सत्र चला रहे हैं, तो आपको साथ-साथ चार टर्मिनलों की आवश्यकता होगी,
00:02:53और आप उन सभी को टूल के एकल चैट सत्र से नियंत्रित करने में सक्षम होंगे।
00:02:56अब, एक बार सब कुछ इंस्टॉल हो जाने के बाद, जब आप लोकलहोस्ट पर जाते हैं,
00:03:00तो आपको चैट पैनल में आपके द्वारा चलाए जा रहे सभी एजेंट दिखाई देने चाहिए।
00:03:03अब, इस टूल का अधिकतम लाभ उठाने के लिए,
00:03:06कुछ ऐसे कदम हैं जो आपको अधिक कुशलता से काम करने में मदद करेंगे।
00:03:09टूल का उपयोग करने से पहले आप जिस फ्रेमवर्क का उपयोग कर रहे हैं उसे इनिशियलाइज़ करने की अनुशंसा की जाती है,
00:03:14क्योंकि यह एक ऐसा बिंदु है जो कई एजेंटों के बीच संघर्ष का कारण बनता है, भले ही उन्हें अलग-अलग भूमिकाएँ सौंपी गई हों।
00:03:20इसलिए सुनिश्चित करें कि आपका नेक्स्ट जेएस ऐप या जो भी फ्रेमवर्क आप उपयोग कर रहे हैं, शुरू करने से पहले पहले से ही इनिशियलाइज़्ड है।
00:03:25सबसे पहले, चूंकि प्रत्येक एजेंट वास्तव में एक अलग क्लाउड या जेमिनी सत्र के रूप में चल रहा है,
00:03:29इसलिए आपको उनमें से प्रत्येक के लिए व्यक्तिगत रूप से अनुमति को मैन्युअल रूप से स्वीकृत करना होगा।
00:03:33हालाँकि वे स्किप परमिशन मोड में चलाने के लिए स्क्रिप्ट भी प्रदान करते हैं,
00:03:36लेकिन इसकी अनुशंसा नहीं की जाती है क्योंकि कई एजेंटों के साथ, एक एजेंट द्वारा दूसरे के काम को हटाने का जोखिम बहुत अधिक होता है।
00:03:42इसलिए आपको उचित अनुमतियों के साथ क्लाउड कोड और जेमिनी सीएलआई दोनों के लिए settings.json सेट करना होगा।
00:03:48इस तरह, यदि कोई फ़ाइल एडिट या बिल्ड कमांड चलाने की आवश्यकता है, तो यह आपकी मैन्युअल स्वीकृति का इंतजार नहीं करेगा
00:03:53और साथ ही खतरनाक कमांड पर आपका नियंत्रण भी रहेगा।
00:03:56एक और महत्वपूर्ण बात यह सुनिश्चित करना है कि MCP टूल्स फ़ाइल में भी कॉन्फ़िगर किए गए हैं,
00:04:01वरना आपको उन्हें भी स्वीकृत करना होगा।
00:04:03आपको एक agents.md फ़ाइल भी बनानी चाहिए।
00:04:05यह वर्तमान में एक टेम्पलेट के रूप में कार्य करता है जिसमें एजेंटों के उपयोग के लिए एक अनुकूलित संरचना होती है,
00:04:09जिसे बाद में उनके द्वारा भरा जाता है।
00:04:11इसमें भूमिका नियम, व्यवहार और वे सभी सिद्धांत शामिल हैं जिनका एजेंटों को पालन करने की आवश्यकता है।
00:04:15आपको PRD, बैक-एंड और UI स्पेक टेम्पलेट्स जैसी प्लानिंग फाइलों की भी आवश्यकता होगी,
00:04:20जिनके लिए हम वर्तमान में टेम्पलेट्स का उपयोग कर रहे थे और जिन्हें बाद में प्लानिंग एजेंट द्वारा भरा जाएगा।
00:04:24इन टेम्पलेट्स का उपयोग करने का उद्देश्य संरचना प्रदान करना है ताकि एजेंट अनावश्यक सामग्री न जोड़ें।
00:04:30ये सभी टेम्पलेट्स एआई लैब्स प्रो पर उपलब्ध हैं जहां से आप उन्हें डाउनलोड कर सकते हैं और स्वयं उपयोग कर सकते हैं।
00:04:35अगर आपको हमारे काम में वैल्यू मिली है और आप चैनल का समर्थन करना चाहते हैं,
00:04:38तो एआई लैब्स प्रो ऐसा करने का सबसे अच्छा तरीका है।
00:04:40लिंक डिस्क्रिप्शन में दिया जाएगा।
00:04:42एक और चीज़ जो यह टूल आपको करने देता है वह है प्रत्येक एजेंट को एक नाम देना और उसे एक विशिष्ट भूमिका सौंपना।
00:04:47इससे एजेंट की पहचान करना और उसे विशेष रूप से उसके लिए तैयार की गई भूमिका के अनुसार काम करवाना आसान हो जाता है।
00:04:52उदाहरण के लिए, यदि आप यूआई डिज़ाइन के लिए जेमिनी का उपयोग कर रहे हैं,
00:04:55तो आप उसका नाम बदल सकते हैं और उसे UI UX एक्सपर्ट की कस्टम भूमिका सौंप सकते हैं।
00:04:59आप प्रत्येक एजेंट को नाम और भूमिकाएँ सौंपते हैं ताकि वे उनके लिए निर्धारित व्यक्तित्व के अनुसार काम करें।
00:05:04और अंत में, आपको कुछ नियम सेट करने होंगे ताकि एजेंट कार्यों का ठीक से पालन करें।
00:05:09जैसा कि पहले उल्लेख किया गया है, आपको agents.md का उपयोग करना चाहिए।
00:05:12लेकिन क्लाउड Claude.md का उपयोग करता है और जेमिनी Gemini.md का
00:05:16और कोई भी दूसरे को अपनी मुख्य निर्देश फ़ाइल के रूप में उपयोग नहीं करता है।
00:05:19इसलिए उन्हें समन्वित करने के लिए, आप agents.md का उपयोग करते हैं और एक नियम जोड़ते हैं ताकि वे दोनों इसे मुख्य मार्गदर्शक फ़ाइल के रूप में देखें।
00:05:25आप अपनी आवश्यकताओं के अनुसार कई नियम सेट कर सकते हैं और जितने चाहें उतने जोड़ सकते हैं।
00:05:29लेकिन जब आप कोई नियम बनाते हैं, तो वह पहले ड्राफ्ट में रहता है
00:05:31और एजेंटों द्वारा इसे पहचानने के लिए आपको इसे मैन्युअल रूप से सक्रिय (active) में ले जाना होता है।
00:05:35नियम हर 10 चैट ट्रिगर के बाद रिफ्रेश होते हैं, जिन्हें आप अपनी आवश्यकताओं के अनुसार समायोजित कर सकते हैं।
00:05:39एक और ध्यान देने योग्य बात लूप गार्ड है, जो डिफ़ॉल्ट रूप से 4 पर सेट है।
00:05:43लूप गार्ड एजेंट-टू-एजेंट हॉप्स की अधिकतम संख्या है
00:05:46इससे पहले कि एजेंट अपने कार्यों को रोक दें और इनपुट की प्रतीक्षा करें।
00:05:49इसे एजेंटों को बहुत लंबे समय तक क्रॉस-क्वेश्चनिंग लूप में फंसने से रोकने के लिए जोड़ा गया था।
00:05:53एक बार जब लूप गार्ड की सीमा पूरी हो जाती है, तो एजेंट संचार करना बंद कर देते हैं
00:05:56और आपको फिर से शुरू करने के लिए एक कंटिन्यू (continue) कमांड भेजना होता है।
00:05:59यदि आप चाहते हैं कि एजेंट लंबे समय तक एक-दूसरे के साथ बेहतर तालमेल बिठाएं तो आपको इसे बढ़ाना चाहिए।
00:06:03लेकिन इससे पहले कि हम कार्यान्वयन की योजना बनाएं, आइए हमारे प्रायोजक, एयरटॉप (Airtop) के बारे में कुछ शब्द सुनें।
00:06:06यदि आप हर हफ्ते डेटा को मैन्युअल रूप से स्क्रैप करने
00:06:10या दर्जनों ब्राउज़र टैब के माध्यम से क्लिक करने में घंटों बिता रहे हैं, तो इसे संभालने का एक बहुत बेहतर तरीका है।
00:06:13एयरटॉप एक क्लाउड-आधारित प्लेटफॉर्म है जो एआई एजेंटों को वेब के साथ ठीक वैसे ही इंटरैक्ट करने देता है जैसे कोई इंसान करेगा
00:06:19कस्टम या प्री-बिल्ट टेम्पलेट्स का उपयोग करके जो सबसे कष्टप्रद मैन्युअल कार्यों को हल करते हैं।
00:06:23इसे एक क्लाउड ब्राउज़र के रूप में सोचें जो आपके लिए सारा मेहनत वाला काम संभालता है।
00:06:27उदाहरण के लिए, मैं प्रतिस्पर्धी कीमतों पर शोध करने के लिए एक टेम्पलेट का उपयोग कर रहा हूँ।
00:06:30मैं बस एजेंट को सरल अंग्रेजी में निर्देश देता हूँ, किसी कोड की आवश्यकता नहीं है,
00:06:33और यह साइट पर नेविगेट करता है, लॉगिन संभालता है, और ठीक वही निकालता है जिसकी मुझे एक स्पष्ट प्रारूप में आवश्यकता है।
00:06:39मेरा पसंदीदा हिस्सा यह है कि यह निराशाजनक एंटी-बॉट उपायों और
00:06:43कैप्चा (CAPTCHAs) को बायपास करता है जो आमतौर पर पारंपरिक ऑटोमेशन को तोड़ देते हैं,
00:06:46जो इसे उच्च-मात्रा वाले काम के लिए अविश्वसनीय रूप से विश्वसनीय बनाता है।
00:06:48मिनटों में विश्वसनीय ऑटोमेशन बनाएं और अभी मुफ्त में एयरटॉप के लिए साइन अप करें।
00:06:53पिन किए गए कमेंट में दिए गए लिंक पर क्लिक करें और आज ही बनाना शुरू करें।
00:06:56अब एक बार सभी चरण पूरे हो जाने के बाद, कार्यान्वयन की ओर बढ़ने का समय है।
00:07:00जैसा कि हमने हमेशा कार्यान्वयन से पहले योजना के महत्व पर जोर दिया है,
00:07:03आपको यहां भी योजना से शुरुआत करनी चाहिए।
00:07:05स्लैक चैनल कैसे काम करते हैं, इसके समान आप यहां भी अलग-अलग चैनल बना सकते हैं।
00:07:09आप फ्रंट-एंड और बैक-एंड दोनों के लिए अलग-अलग चैनल सेट करना चाहेंगे।
00:07:12एक बार जब आप ऐप का विचार देते हैं, तो यह वास्तव में Tmux सत्र को एक अनुरोध भेजता है
00:07:16और इसे संदेश की जांच करने के लिए कहता है क्योंकि इसका उल्लेख किया गया था।
00:07:18प्लानर एजेंट एक पूरी योजना बनाता है, आपको सूचित करता है, और आपसे अनुमोदन करने या परिवर्तन जोड़ने के लिए कहता।
00:07:23यह आपके द्वारा शुरू में जोड़े गए टेम्पलेट के ठीक ऊपर PRD में योजना का दस्तावेजीकरण करता है।
00:07:28आप अपनी इच्छानुसार परिवर्तन कर सकते हैं, और यह उन परिवर्तनों के साथ PRD को अपडेट करता है।
00:07:32यह टूल क्लाउड को प्रतिक्रिया भेजने और चैट इंटरफ़ेस से चैट पढ़ने देने के लिए MCP का उपयोग करता है,
00:07:37जिससे दोतरफा संचार संभव हो पाता है।
00:07:39एक बार योजना की पुष्टि हो जाने के बाद, आप इसे आगे बढ़ने के लिए कहते हैं।
00:07:41और एक बार PRD स्वीकृत हो जाने के बाद, यह अपने आप जेमिनी को सचेत करता है
00:07:44और इसे UI स्पेक दस्तावेजों को लागू करने के लिए कहता है।
00:07:47लेकिन फिर यूआई डिज़ाइनर और प्लानर एजेंट कार्यान्वयन विवरणों पर एक-दूसरे के साथ समन्वय करना शुरू करते हैं,
00:07:51जिसमें प्लानर विवरण का सुझाव देता है
00:07:54और यूआई डिज़ाइनर उन्हें योजना में शामिल करता है, और फिर समीक्षा आगे-पीछे जारी रहती है।
00:07:59अब एक बात ध्यान देने वाली है, भले ही हमने लूप गार्ड को 8 पर सेट किया था,
00:08:02इसने किसी कारण से उसे दर्ज नहीं किया।
00:08:04इसलिए हम केवल 4 पुनरावृत्तियों के बाद अधिकतम लूप तक पहुँच गए और हमें बातचीत जारी रखने के लिए प्रेरित किया गया।
00:08:08अब बिल्डर को सूचित किया जाता है कि योजनाएं यूआई डिज़ाइनर द्वारा कार्यान्वयन के लिए तैयार हैं,
00:08:13और बिल्डर स्वीकार करता है कि उसे योजनाएं मिल गई हैं और आगे बढ़ने के लिए अनुमोदन की प्रतीक्षा करता है।
00:08:18डिज़ाइनर एजेंट आपको यह भी सूचित करता है कि वह यूआई कार्यान्वयन के साथ आगे बढ़ना चाहता है,
00:08:22जिसे आपको तब तक रोक कर रखना चाहिए जब तक कि आपने स्वयं योजनाओं की समीक्षा न कर ली हो।
00:08:25बैकएंड चैनल में, आप बिल्डर एजेंट और प्लानर को backend.md की जांच करने के लिए कह सकते हैं,
00:08:30जो PRD को लागू करते समय प्लानर द्वारा बनाया जाता है।
00:08:33आप दस्तावेजों को मान्य करने के लिए एक-दूसरे के साथ समन्वय करने के लिए उनका उपयोग करते हैं,
00:08:37लेकिन उनमें से प्रत्येक कार्यान्वयन में कमियों की पहचान कर सकता है।
00:08:40इसलिए वे सभी एक-दूसरे के साथ समन्वय करते हैं और यूआई स्पेक्स से निपटने के लिए यूआई डिज़ाइनर को शामिल करते हैं,
00:08:44जिससे वे मुद्दों को ठीक करने के लिए मिलकर काम करते हैं।
00:08:47एक बार जब उन्होंने सब कुछ लागू कर लिया हो, तो आप प्लानर से एक और समीक्षा के लिए कह सकते हैं।
00:08:50हमारे मामले में, उन्हें अंतिम समीक्षा के दौरान कुछ अतिरिक्त मुद्दे मिले।
00:08:54उनका समाधान करने के बाद, सभी एजेंटों ने पुष्टि की कि
00:08:56मुद्दे हल हो गए थे और ऐप बनने के लिए तैयार था।
00:08:59लेकिन आप इसे अभी नहीं बनाना चाहते हैं। एक और कदम है जो आपको उठाना चाहिए।
00:09:02आप चाहते हैं कि वे एक-दूसरे के साथ योजनाओं की समीक्षा करें।
00:09:04इस टूल में आज़माने के लिए कई मोड हैं, और आपको प्लानर मोड का परीक्षण करना चाहिए।
00:09:08आप डिज़ाइन समीक्षा, कोड आलोचना और अन्य के लिए कई मोड आज़मा सकते हैं।
00:09:12ये मोड 3 चरणों में काम करते हैं जिसमें विभिन्न मॉडल विभिन्न भूमिकाएँ निभाते हैं।
00:09:16आप प्लानर एजेंट को प्रस्तुतकर्ता (presenter) के रूप में सेट करते हैं, जो बताता है कि उसने पहले क्या किया था,
00:09:20और समीक्षक (reviewer) एजेंट को चुनौती देने वाले (challenger) के रूप में, जो प्रस्तुतकर्ता की बातों को गंभीर रूप से चुनौती देता है।
00:09:24प्लानिंग एजेंट सिंथेसाइज़र (synthesizer) है, जो प्रत्येक के निष्कर्षों को मिलाता है।
00:09:28सत्र तब शुरू होता है जब प्रस्तुतकर्ता अपनी बात रखता है, जिसके बाद चुनौती देने वाला गंभीर रूप से विश्लेषण करता है
00:09:32निष्कर्षों का और दस्तावेजों का स्ट्रेस टेस्ट करता है, जिससे कई कमियों की पहचान होती है।
00:09:36क्योंकि एजेंट एक-दूसरे से क्रॉस-क्वेश्चनिंग कर रहे हैं,
00:09:38वे कई ऐसे मुद्दों को पहचानने और ठीक करने में सक्षम होते हैं जो अन्यथा छूट जाते।
00:09:42जिसके बाद आपके पास अंतिम योजना होती है, जो 3-चरणीय सत्र के अंत को चिह्नित करती है।
00:09:46साथ ही, यदि आप हमारी सामग्री का आनंद ले रहे हैं, तो हाइप बटन दबाने पर विचार करें,
00:09:50क्योंकि यह हमें इस तरह की और सामग्री बनाने और अधिक लोगों तक पहुंचने में मदद करता है।
00:09:54एक बार समीक्षा पूरी हो जाने के बाद, आप प्लानर को एक ऑर्केस्ट्रेटर के रूप में कार्य करने और
00:09:58प्रोजेक्ट को लागू करने के लिए अन्य सभी एजेंटों के साथ समन्वय करने के लिए कहते हैं, उनके कार्यों के लिए संबंधित मॉडलों का उपयोग करते हुए।
00:10:03यह स्वीकार करता है और डिज़ाइनर और बिल्डर दोनों को समानांतर में काम करने के लिए कहता है।
00:10:06यह बैकएंड और frontend दोनों चैनलों पर संदेश भेजता है, जिससे बिल्डर को
00:10:10निर्माण शुरू करने के लिए हरी झंडी मिल जाती है और फ्रंटएंड इंजीनियर का रास्ता साफ हो जाता है, ताकि वे डिज़ाइन को लागू कर सकें।
00:10:15इसके साथ काम करना वास्तव में दिलचस्प है क्योंकि आप अनिवार्य रूप से बस
00:10:18प्लानिंग एजेंट को काम सौंपते हैं और केवल अपडेट के लिए पूछने की आवश्यकता होती है।
00:10:22एजेंटों को एक साथ काम करते देखना आकर्षक है क्योंकि जब गलतियाँ होती हैं तो वे एक-दूसरे को टोकते हैं।
00:10:26उदाहरण के लिए, हमारे मामले में, यूआई डिज़ाइनर ने गलती से एक ऐसी त्रुटि को हल करने की कोशिश की
00:10:30जो बिल्डर की ज़िम्मेदारी होनी चाहिए थी।
00:10:32प्लानर और बिल्डर दोनों एजेंटों ने बताया कि उसे फिक्स लागू नहीं करना चाहिए था,
00:10:37क्योंकि इसने उस फ़ाइल को ओवरराइट कर दिया जिस पर बिल्डर काम कर रहा था।
00:10:39यदि एजेंट समर्पित वर्क ट्री में काम करते हैं, तो यह वर्कफ़्लो बहुत आसान होगा,
00:10:44जिसमें एक एजेंट पूरे के रूप में सब कुछ मर्ज और समीक्षा करता है,
00:10:47क्योंकि इससे एजेंटों द्वारा एक-दूसरे के काम को ओवरराइट करने की समस्या समाप्त हो जाएगी।
00:10:50तो अधिक जटिल सेटअप के लिए यह ध्यान रखने वाली बात है।
00:10:53प्लानर फिर रिव्यू एजेंट को ट्रिगर करता है, जो विस्तार से मुद्दों की पहचान करता है,
00:10:57एक विस्तृत रिपोर्ट प्रदान करता है, और एजेंटों को कार्य सौंपता है।
00:11:01चूंकि हमने पहले ही नियम सेट कर दिया था कि यदि किसी एजेंट को दूसरे से कुछ चाहिए,
00:11:04तो उसे बस पूछना चाहिए, यूआई डिज़ाइनर ने बिल्डर से एक विशेष वेरिएबल तक पहुँच का अनुरोध किया,
00:11:09और बिल्डर ने उसे अनुमति दे दी।
00:11:10एक बार जब उनके अंत की समीक्षा पूरी हो जाती है, तो प्लानर आपसे अंतिम फ्रंट-एंड समीक्षा करने के लिए कहता है।
00:11:15जब आप डेवलपमेंट सर्वर पर जाते हैं,
00:11:17तो आप पाएंगे कि यूआई आपके द्वारा चाहा गया गेम-जैसा वर्शन से मेल खाता है।
00:11:20लैंडिंग पेज में हाई कंट्रास्ट है, जो इसे गेम जैसा अनुभव देता है,
00:11:23और इसमें ऐसे हाइप वर्ड्स और संदर्भों का उपयोग किया गया है जो इसे आज़माने के लिए रोमांचक बनाते हैं।
00:11:26टाइपिंग टेस्ट के बाद, आपको एक प्रदर्शन रिपोर्ट प्राप्त होती है।
00:11:29परिणाम डैशबोर्ड पर प्रदर्शित होते हैं, जो अब तक की सबसे अच्छी गति दिखाते हैं,
00:11:33वर्तमान स्तरों और प्रगति के साथ, जो डिज़ाइन अनुभव को इमर्सिव बनाते हैं।
00:11:37यह हमें इस वीडियो के अंत में लाता है। यदि आप चैनल का समर्थन करना चाहते हैं और
00:11:40इस तरह के और वीडियो बनाने में हमारी मदद करना चाहते हैं, तो आप नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके ऐसा कर सकते हैं।
00:11:45हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।

Key Takeaway

यह वीडियो बताता है कि कैसे 'एजेंट चैटर' टूल का उपयोग करके क्लाउड और जेमिनी जैसे विभिन्न एआई एजेंटों को एक समन्वित वर्कफ़्लो में स्वायत्त रूप से जोड़कर जटिल कोडिंग परियोजनाओं को कुशलतापूर्वक पूरा किया जा सकता है।

Highlights

इंजीनियरिंग में एआई के कारण सहयोग के नए तरीके विकसित हो रहे हैं, जहाँ विभिन्न मॉडलों की अपनी अलग ताकत होती है।

एजेंट चैटर (Agent Chatter) एक नया ओपन-सोर्स टूल है जो क्लाउड कोड, जेमिनी सीएलआई और कोडेक्स जैसे विभिन्न एआई एजेंटों को एक साथ काम करने की अनुमति देता है।

मैक ओएस और लिनक्स उपयोगकर्ताओं के लिए टीएमयूएक्स (TMUX) का उपयोग करके कई टर्मिनल सत्रों को एक साथ नियंत्रित किया जा सकता है।

सफलतापूर्वक कार्यान्वयन के लिए 'agents.md' जैसी कॉन्फ़िगरेशन फ़ाइलों और भूमिका-आधारित निर्देशों का उपयोग करना आवश्यक है।

3-चरणीय समीक्षा मोड (प्रस्तुतकर्ता, चुनौती देने वाला और सिंथेसाइज़र) के माध्यम से योजनाओं का स्ट्रेस टेस्ट किया जा सकता है।

लूप गार्ड (Loop Guard) जैसी सुविधाएँ एजेंटों को अनंत क्रॉस-क्वेश्चनिंग लूप में फंसने से रोकती हैं।

Timeline

एआई सहयोग और एजेंट चैटर का परिचय

वीडियो की शुरुआत इंजीनियरिंग में सहयोग के महत्व और एआई के आने से इसमें हुए बदलावों की चर्चा से होती है। वक्ता बताते हैं कि जेमिनी मॉडल डिजाइनिंग में उत्कृष्ट हैं, जबकि क्लाउड कोड (Claude Code) एक अधिक स्थिर टूलिंग प्रदान करता है। इन दोनों के बीच संचार की समस्या को हल करने के लिए 'एजेंट चैटर' (Agent Chatter) नामक टूल पेश किया गया है। यह टूल क्लाउड कोड, जेमिनी सीएलआई और कोडेक्स जैसे लोकप्रिय एजेंटों के साथ-साथ ओपन-सोर्स मॉडलों का भी समर्थन करता है। इसका मुख्य उद्देश्य विभिन्न एजेंटों को एक साझा चैनल में एक-दूसरे से बात करने और समन्वय करने की सुविधा देना है।

सेटअप प्रक्रिया और टीएमयूएक्स (TMUX) का उपयोग

इस खंड में टूल के तकनीकी सेटअप और इसके विजुअल लेयर के बारे में बताया गया है जिसे वक्ता ने अपनी जरूरतों के अनुसार फोर्क किया है। प्रोजेक्ट को चलाने के लिए पूरे रेपो को क्लोन करना और विशिष्ट स्क्रिप्ट्स को इनिशियलाइज़ करना अनिवार्य है। मैक और लिनक्स उपयोगकर्ताओं के लिए टर्मिनल मल्टीप्लेक्सर 'TMUX' का उपयोग करना आवश्यक है ताकि कई टर्मिनल सत्रों को एक ही बिंदु से नियंत्रित किया जा सके। विंडोज उपयोगकर्ता सीधे स्क्रिप्ट चला सकते हैं, लेकिन प्रत्येक एजेंट को एक समर्पित टर्मिनल सत्र की आवश्यकता होती है। यह सेटअप उपयोगकर्ता को एक ही इंटरफ़ेस से कई एआई सत्रों को समानांतर में प्रबंधित करने की शक्ति देता है।

एजेंटों को कॉन्फ़िगर करना और नियम निर्धारित करना

सफलतापूर्वक काम शुरू करने के लिए कुछ महत्वपूर्ण पूर्व-आवश्यकताओं पर चर्चा की गई है, जैसे कि फ्रेमवर्क को पहले से इनिशियलाइज़ करना। प्रत्येक एजेंट के लिए व्यक्तिगत अनुमति और 'settings.json' फ़ाइल को सही ढंग से सेट करना महत्वपूर्ण है ताकि स्वायत्त कार्य के दौरान कोई बाधा न आए। 'agents.md' फ़ाइल का उपयोग करके एजेंटों को विशिष्ट भूमिकाएँ, जैसे 'UI UX एक्सपर्ट', और नियम सौंपे जाते हैं। लूप गार्ड (Loop Guard) के बारे में भी बताया गया है, जो डिफ़ॉल्ट रूप से 4 पर सेट होता है और एजेंटों को अंतहीन बातचीत में फंसने से रोकता है। वक्ता सलाह देते हैं कि जटिल कार्यों के लिए इस सीमा को अपनी आवश्यकतानुसार बढ़ाया जा सकता है।

एयरटॉप (Airtop) प्रायोजक और वेब ऑटोमेशन

यहाँ वक्ता एयरटॉप (Airtop) नामक प्लेटफॉर्म का परिचय देते हैं जो एआई एजेंटों को मानवीय तरीके से वेब के साथ इंटरैक्ट करने की अनुमति देता है। यह क्लाउड-आधारित ब्राउज़र डेटा स्क्रैपिंग और दोहराव वाले कार्यों को सरल अंग्रेजी निर्देशों के साथ स्वचालित कर सकता है। इसकी सबसे बड़ी खूबी यह है कि यह एंटी-बॉट उपायों और कैप्चा (CAPTCHAs) को बायपास कर सकता है जो अक्सर पारंपरिक ऑटोमेशन को विफल कर देते हैं। वक्ता बताते हैं कि वे स्वयं प्रतिस्पर्धी कीमतों पर शोध करने के लिए इसका उपयोग कर रहे हैं। यह उपकरण उन लोगों के लिए आदर्श है जो मैन्युअल डेटा प्रविष्टि में अपना समय बर्बाद नहीं करना चाहते हैं।

कार्यान्वयन और 3-चरणीय समीक्षा प्रक्रिया

प्रोजेक्ट का वास्तविक कार्यान्वयन शुरू होता है जहाँ प्लानर एजेंट पीआरडी (PRD) और योजनाएँ बनाना शुरू करता है। वक्ता 'डिजाइन समीक्षा' और 'कोड आलोचना' के लिए एक विशेष 3-चरणीय मोड का वर्णन करते हैं जिसमें प्रस्तुतकर्ता, चुनौती देने वाला और सिंथेसाइज़र शामिल होते हैं। चुनौतीपूर्ण एजेंट योजनाओं का स्ट्रेस टेस्ट करता है और उन कमियों को उजागर करता है जो शायद इंसान से छूट सकती थीं। यह दोतरफा संचार सुनिश्चित करता है कि कार्यान्वयन शुरू होने से पहले ही सभी संभावित त्रुटियों को ठीक कर लिया जाए। इसके बाद, योजना स्वीकृत होने पर जेमिनी को यूआई स्पेक्स लागू करने के लिए स्वचालित रूप से अलर्ट भेजा जाता है।

अंतिम निर्माण और परिणाम विश्लेषण

अंतिम चरण में, प्लानर एजेंट एक ऑर्केस्ट्रेटर के रूप में कार्य करता है और सभी एजेंटों के बीच कार्यों का समन्वय करता है। वक्ता एक दिलचस्प घटना साझा करते हैं जहाँ एजेंटों ने एक-दूसरे की गलतियों को पकड़ा और काम के ओवरराइट होने से बचाया। अंत में, एक इमर्सिव और गेम जैसा टाइपिंग टेस्ट ऐप बनकर तैयार होता है, जिसका यूआई बहुत प्रभावशाली है। ऐप में प्रदर्शन रिपोर्ट और डैशबोर्ड जैसी सुविधाएँ शामिल हैं जो उपयोगकर्ता की प्रगति को ट्रैक करती हैं। वीडियो का समापन सुपर थैंक्स के माध्यम से चैनल का समर्थन करने के अनुरोध और देखने के लिए आभार व्यक्त करने के साथ होता है।

Community Posts

View all posts