ये फॉल्ट लूप्स 90% कोडिंग एरर्स को पकड़ रहे हैं

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00क्या होता है जब आप एक कोडिंग एजेंट को नियमों का पालन करने के लिए मजबूर करते हैं?
00:00:03Claude और अन्य कोडिंग एजेंटों के साथ काम करते समय हम सभी को एक ही समस्या आती है।
00:00:07वे अक्सर निर्देशों का पालन नहीं करते और Claude.md फ़ाइल को पूरी तरह से नज़रअंदाज़ कर देते हैं।
00:00:11और जब हमने TDD (टेस्ट ड्रिवन डेवलपमेंट) के लिए दबाव डाला, तो उसने खुद ही टेस्ट फाइलों को बदलने की कोशिश की।
00:00:15तभी हमें इस प्लगइन के बारे में पता चला जो काफी लोकप्रिय हो रहा था, जिसने मात्र 24 घंटों में 58,000 स्टार्स हासिल किए थे।
00:00:21लेकिन इससे सिर्फ AI टूल्स के इर्द-गिर्द चल रहे हाइप का पता चलता है।
00:00:25यह प्लगइन वर्कफ़्लो में सॉफ़्टवेयर डेवलपमेंट के कड़े तरीकों को लागू करने का वादा करता है।
00:00:30पर सवाल यह था कि क्या यह वाकई वैसा करता है जैसा कहता है।
00:00:33हमारी टीम ने पहले भी ऐसे कई वर्कफ़्लो देखे हैं जो सिर्फ दिखावा साबित हुए।
00:00:37इसलिए हमने इस प्लगइन को असली वर्कफ़्लो में इस्तेमाल किया ताकि देखें कि यह असल प्रोजेक्ट्स के लिए सही है या सिर्फ कोरा शोर।
00:00:43Superpowers एक प्लगइन है जो आपके AI IDE में ही पारंपरिक सॉफ़्टवेयर डेवलपमेंट के तरीके को लागू कर देता है।
00:00:50कुछ लोग सोच सकते हैं कि BMAD और OpenSpec जैसे मौजूदा एजाइल फ्रेमवर्क भी यही करते हैं।
00:00:56पर यह अलग है क्योंकि यह केवल प्रोजेक्ट की रूपरेखा लिखने वाला कोई एजेंट सिस्टम नहीं है।
00:01:01यह वर्कफ़्लो में ही एजाइल पद्धति को लागू करता है, जिसमें सख्त गेट्स हैं जो सुनिश्चित करते हैं कि पिछला कदम पूरा हुए बिना एजेंट आगे न बढ़े।
00:01:10ये गेट्स चेकपॉइंट्स की तरह काम करते हैं ताकि Claude दिए गए निर्देशों से भटक न जाए।
00:01:15इस प्लगइन का मूल दर्शन TDD और अंदाज़ा लगाने के बजाय एक व्यवस्थित प्रक्रिया पर आधारित है।
00:01:20यह सफलता का दावा करने से पहले जांच करता है और इसमें AI की आम गलतियों को सुधारने के लिए खास निर्देश दिए गए हैं।
00:01:28जब तक यूजर हरी झंडी नहीं देता, यह अगले चरण पर नहीं जाता।
00:01:32संक्षेप में, यह उन सभी बेहतरीन तरीकों का इस्तेमाल करता है जिनकी हम बात करते रहे हैं, वो भी इन-बिल्ट रूप में।
00:01:40यह प्लगइन सही मायने में रेड-ग्रीन TDD और DRY एवं YAGNI जैसे प्रोग्रामिंग सिद्धांतों पर ज़ोर देता है।
00:01:50यह सभी AI प्लेटफॉर्म्स के लिए उपलब्ध है।
00:01:52लेकिन हमारी टीम Claude Code का उपयोग कर रही थी, इसलिए हमने पहले रजिस्टर कमांड को कॉपी किया और फिर मार्केटप्लेस से प्लगइन इंस्टॉल किया।
00:02:02इंस्टॉल करने और Claude Code को रीस्टार्ट करने के बाद, यह Superpowers प्लगइन प्रोजेक्ट के लिए उपलब्ध हो गया।
00:02:08रीस्टार्ट करने के बाद, हमने इसे Trello जैसा एक प्रोजेक्ट मैनेजमेंट सॉफ़्टवेयर बनाने का प्रॉम्प्ट दिया।
00:02:15इसने खुद ही अपनी ब्रेनस्टॉर्मिंग स्किल को सक्रिय कर लिया और अंदाज़ा लगाने के बजाय पहले यह पहचाना कि प्रोजेक्ट में क्या ज़रूरतें हैं।
00:02:24इसने ऐप को समझने के लिए कई सवाल पूछे, जैसे यह किसके लिए है, कौन सा टेक स्टैक इस्तेमाल करना है और हर विकल्प की चुनौतियां क्या हैं।
00:02:33जैसे डेटाबेस के चुनाव पर इसने सुझाव दिया कि हमारा चयन सुरक्षा के लिए सही नहीं हो सकता क्योंकि वह ब्राउज़र में चलता है और सर्वर-साइड से एक्सेस नहीं किया जा सकता।
00:02:44यह तब तक चीज़ों को स्पष्ट करता रहा जब तक हम विकल्पों से संतुष्ट नहीं हो गए।
00:02:48सब कुछ पक्का होने के बाद, इसने हमें तीन तरीके दिए जिनमें से हमें लागू करने के लिए एक को चुनना था।
00:02:55हमने अपना मनपसंद विकल्प चुना और उसके साथ कुछ बदलाव भी सुझाए।
00:02:58काम पूरा होने के बाद, इसने हमें आर्किटेक्चर डिज़ाइन भी दिखाया।
00:03:02इसके बाद इसने UX डिज़ाइन दिया और बताया कि बोर्ड्स को कैसे मैनेज किया जाएगा।
00:03:06इसने हमारे साथ पूरे प्रोजेक्ट स्ट्रक्चर की भी पुष्टि की।
00:03:09डिज़ाइन मंज़ूर होने के बाद, इसने सारा डेटा एक docs फोल्डर में सुरक्षित कर दिया।
00:03:13यहीं पर यह प्लगइन दूसरों से बेहतर साबित होता है क्योंकि इसमें हर बदलाव को कमिट करने के लिए इन-बिल्ट git निर्देश थे।
00:03:22ब्रेनस्टॉर्मिंग के बाद, प्लान लिखने वाली स्किल शुरू हुई जिसने कार्यान्वयन योजना बनाई और उसे कमिट किया।
00:03:29प्लान ने बड़े एप्लीकेशन को छोटे-छोटे टास्क में बाँट दिया ताकि उन्हें लागू करना आसान हो।
00:03:33आपको लग सकता है कि Claude का अपना प्लान मोड भी तो यही सब करता है।
00:03:37पर मुख्य अंतर यह है कि Claude Code की प्लानिंग सिर्फ एजेंट के मार्गदर्शन के लिए होती है।
00:03:44वह सिर्फ टेक स्टैक से जुड़े वही सवाल पूछता है जो उसे ज़रूरी लगते हैं और UI लाइब्रेरी जैसे छोटे फैसले खुद ही ले लेता है।
00:03:52इसके विपरीत, Superpowers इसे कड़ाई से लागू करता है, यानी आप अगले स्टेप पर तब तक नहीं जा सकते जब तक मौजूदा स्टेप पास न हो जाए।
00:04:01प्लानिंग के बाद, इसने पूछा कि हम इसे कैसे लागू करना चाहेंगे, और हमने सब-एजेंट आधारित विकल्प चुना।
00:04:09Claude भी सब-एजेंट बनाता है, लेकिन यहाँ की स्किल्स अलग थीं क्योंकि इसने हर सब-एजेंट के लिए एक git work tree बना दिया ताकि उनका काम एक-दूसरे को प्रभावित न करे।
00:04:20एजेंटों को आइसोलेशन में रखना ज़रूरी है क्योंकि एक ही डायरेक्टरी में काम करने पर वे एक-दूसरे के काम को ओवरराइट कर सकते हैं।
00:04:28और यह प्लगइन इसे अपने आप ही संभाल लेता है।
00:04:31प्लानिंग फाइनल होने के बाद, Claude ने कार्यान्वयन (implementation) शुरू किया।
00:04:34इसने एक टास्क शुरू किया और उसे पूरा करने के बाद, उसे स्पेसिफिकेशन के हिसाब से जांचने के लिए एक अलग रिव्यू टास्क बनाया।
00:04:41Git पर कमिट करने के बाद, इसने अपनी एक और खूबी “कोड रिव्यूअर” का इस्तेमाल किया।
00:04:46जब पिछले एजेंटों ने कोड की क्वालिटी को मंज़ूरी दे दी, तभी इसने अगला काम शुरू किया।
00:04:54जब हर काम पूरा, रिव्यू और कमिट हो गया, तब इसने हमसे पूछा कि इसे मेन ब्रांच में मर्ज करें या PR (पुल रिक्वेस्ट) बनाएं।
00:05:04हमने इसे जल्दी से मेन ब्रांच में मर्ज करने को कहा।
00:05:06इसके बाद इसने सारे वर्क ट्री हटा दिए और पूरे प्रोजेक्ट को मेन ब्रांच में कमिट कर दिया।
00:05:11इस प्रक्रिया में बहुत ज़्यादा कॉन्टेक्स्ट विंडो खर्च होती है; हमारे लिए सिर्फ एक बार में ही 50% विंडो भर गई, इसलिए सावधानी ज़रूरी है।
00:05:24इसने जो प्रोजेक्ट बनाया वह साधारण था और उसमें बुनियादी फंक्शनलिटी थी।
00:05:27हम चाहते थे कि लिस्ट्स उनके स्टेटस (To do, In progress, Done) के हिसाब से व्यवस्थित हों।
00:05:32कार्ड्स के साथ-साथ हम यह भी चाहते थे कि पूरी लिस्ट्स को भी इधर-उधर खिसकाया जा सके।
00:05:36इसलिए हम वापस Claude Code पर गए, लेकिन उसने बिना प्लगइन स्किल्स के सामान्य तरीके से काम शुरू कर दिया।
00:05:42शायद कॉन्टेक्स्ट ज़्यादा भर जाने के कारण ऐसा हुआ, और हमें उसे Superpowers प्लगइन इस्तेमाल करने की याद दिलानी पड़ी।
00:05:48याद दिलाने के बाद, उसने फिर से उसी व्यवस्थित तरीके से काम करना शुरू किया।
00:05:52जब सब स्टेप्स हो गए, तो Claude ने सब-एजेंट बनाए, और यहाँ वे बेहतर साबित हुए क्योंकि वे TDD अप्रोच का इस्तेमाल कर रहे थे।
00:06:02ये एजेंट सबसे पहले हर उस हिस्से के लिए टेस्ट लिखते हैं जिसे लागू किया जाना है।
00:06:05टेस्ट लिखने के बाद, इसने सुनिश्चित किया कि एजेंट टेस्ट केस बदले बिना ही कोड लिखे और उन्हें पास करे।
00:06:13प्लगइन के निर्देश इतने कड़े थे कि Claude टेस्ट में बदलाव नहीं कर सका, जिससे उसके बहाने बनाने की गुंजाइश खत्म हो गई।
00:06:23ये निर्देश कुछ इस तरह के थे: “अगर किसी स्किल के इस्तेमाल की 1% संभावना भी हो, तो उसे इस्तेमाल करें”।
00:06:29इससे यह पक्का हुआ कि हर काम एक सही और संरचित तरीके से पूरा हो।
00:06:32एक बात गौर करने वाली है कि ये एजेंट एक-एक करके काम कर रहे थे, इसलिए इसमें सामान्य Claude से ज़्यादा समय लगा।
00:06:41लेकिन सख्त नियमों की वजह से यह सुनिश्चित हुआ कि एप्लीकेशन बिल्कुल वैसी ही बनी जैसा सोचा गया था।
00:06:45जैसा कि पहले बताया, इस प्लगइन के साथ कॉन्टेक्स्ट बहुत जल्दी खत्म होता है, कुछ ही टास्क में सिर्फ 5% कॉन्टेक्स्ट बचा था।
00:06:53इसलिए आगे बढ़ने से पहले, हमने 'compact' कमांड चलाई ताकि ब्रेनस्टॉर्मिंग के दौरान पिछला कॉन्टेक्स्ट गायब न हो जाए।
00:07:01कन्वर्सेशन को छोटा करने के बाद, हमने अगले फीचर का प्रॉम्प्ट दिया और उसने फिर से काम शुरू कर दिया।
00:07:07लेकिन इस सेशन की सबसे अच्छी बात यह थी कि उसने अंदाज़ा नहीं लगाया, बल्कि कई तरह के सवाल पूछकर ऐप को हमारी मर्ज़ी के मुताबिक बनाया।
00:07:17इस प्लगइन ने Claude से छोटी-छोटी बातें भी साफ़ करवाईं, जैसे खाली कॉलम कैसे दिखेंगे—जो Claude अक्सर खुद ही मान लेता।
00:07:29इस प्लगइन को बेहतर तरीके से इस्तेमाल करने की गाइडलाइन AI Labs Pro पर उपलब्ध है।
00:07:33यह हमारी हाल ही में लॉन्च की गई कम्युनिटी है जहाँ आपको बने-बनाए टेम्पलेट्स मिलते हैं जिन्हें आप सीधे अपने प्रोजेक्ट्स में इस्तेमाल कर सकते हैं।
00:07:42अगर आपको हमारे काम से फायदा मिला है और आप सपोर्ट करना चाहते हैं, तो यह सबसे अच्छा तरीका है। लिंक डिस्क्रिप्शन में है।
00:07:48इसकी एक और बड़ी ताकत व्यवस्थित तरीके से डीबगिंग (Systematic Debugging) करने की क्षमता है।
00:07:52डेटा सेव होने में एक बग आ रहा था, हमने Claude को बिना जगह बताए बस व्यवस्थित डीबगिंग का इस्तेमाल करने को कहा।
00:08:01इसने काम करने के लिए अपनी सिस्टमैटिक डीबगिंग स्किल लोड की, जो चार चरणों में बंटी हुई थी।
00:08:06पहले चरण में हमसे सवाल पूछकर समस्या की जड़ (root cause) पहचानने की कोशिश की गई।
00:08:10हमारे जवाब के आधार पर, उसने जांच की और उस सही फ़ाइल को ढूंढ निकाला जिसमें समस्या हो सकती थी।
00:08:16दूसरे चरण में बग को अलग किया गया, जबकि तीसरे चरण में उसके होने का असली कारण खोजा गया ताकि उसे ठीक किया जा सके।
00:08:25चौथा चरण उसे ठीक करना था। पूरी प्रक्रिया बहुत ही व्यवस्थित थी और अंत में उसने उसे टेस्ट भी किया।
00:08:35कई ऐसे काम होते हैं जिनमें पूरे प्लगइन वर्कफ़्लो की ज़रूरत नहीं होती, जैसे मामूली UI बदलाव के लिए 15 मिनट इंतज़ार करना बेमानी है।
00:08:47तो ऐसे कामों के लिए जिन्हें पूरी प्रक्रिया की ज़रूरत नहीं है, हम उन्हें आसान तरीके से कर सकते हैं।
00:08:51हमने उसे UI सुधारने को कहा, पर निर्देश दिया कि अभी उसे लागू न करे, सिर्फ ब्रेनस्टॉर्मिंग और प्लानिंग करे।
00:09:01उसने डिज़ाइन के अलग-अलग पहलुओं पर स्पष्टीकरण मांगते हुए हमसे पूछा कि हम किस तरह का लुक चाहते हैं।
00:09:08प्रॉम्ट के अनुसार Claude प्लानिंग के बाद रुक गया, जिसके बाद हमने उसे बिना लंबी प्रक्रिया के प्लान लागू करने को कहा।
00:09:15पूरे ऐप का UI बहुत कम समय में बदल गया, और फिर भी उसने बदलावों को उसी फॉर्मेट में कमिट किया जो प्लगइन ने तय किया था।
00:09:25ऐप का लेआउट अब बेसिक से बदलकर काफी प्रोफेशनल, बेहतर कलर स्कीम और होवर स्टेट्स वाला हो गया था।
00:09:32यही बात इस फ्रेमवर्क को व्यावहारिक बनाती है—जहाँ Claude अच्छा है उसे करने दें, और जहाँ वो गलती करता है वहाँ इस सख्त प्रक्रिया को अपनाएं।
00:09:43इसके साथ ही हम वीडियो के अंत में पहुँच गए हैं। अगर आप चैनल को सपोर्ट करना चाहते हैं, तो 'Super Thanks' बटन का इस्तेमाल कर सकते हैं।
00:09:51हमेशा की तरह, देखने के लिए धन्यवाद और मिलते हैं अगले वीडियो में।

Key Takeaway

Superpowers प्लगइन Claude जैसे AI टूल्स के लिए एक सख्त अनुशासनात्मक ढांचा प्रदान करता है, जो व्यवस्थित योजना, परीक्षण और डीबगिंग के माध्यम से कोडिंग की गलतियों को 90% तक कम कर देता है।

Highlights

Superpowers प्लगइन AI कोडिंग एजेंटों (जैसे Claude) को सख्त सॉफ्टवेयर डेवलपमेंट नियमों का पालन करने के लिए मजबूर करता है।

यह प्लगइन TDD (टेस्ट ड्रिवन डेवलपमेंट), DRY और YAGNI जैसे महत्वपूर्ण प्रोग्रामिंग सिद्धांतों को वर्कफ़्लो में लागू करता है।

इसमें 'गेट्स' और 'चेकपॉइंट्स' हैं जो सुनिश्चित करते हैं कि AI बिना यूजर की अनुमति के अगले चरण पर न बढ़े।

मल्टी-एजेंट सिस्टम में 'Git Work Trees' का उपयोग किया जाता है ताकि अलग-अलग एजेंट एक-दूसरे के कोड को ओवरराइट न करें।

प्लगइन में एक विशेष 'सिस्टमैटिक डीबगिंग' स्किल है जो चार चरणों में बग की जड़ तक पहुँचकर उसे ठीक करती है।

यह वर्कफ़्लो बहुत अधिक कॉन्टेक्स्ट विंडो का उपयोग करता है, जिसे 'compact' कमांड के जरिए मैनेज करना पड़ता है।

Timeline

AI कोडिंग एजेंटों की चुनौतियां और Superpowers का परिचय

वीडियो की शुरुआत कोडिंग एजेंटों द्वारा निर्देशों की अनदेखी करने और टेस्ट फाइलों को मनमाने ढंग से बदलने की समस्या से होती है। वक्ता Superpowers प्लगइन का परिचय देता है जिसने अपनी लोकप्रियता के कारण 24 घंटों में 58,000 स्टार्स हासिल किए। यह प्लगइन पारंपरिक सॉफ्टवेयर विकास के कड़े तरीकों को AI वर्कफ़्लो में लागू करने का वादा करता है। इसमें विशेष 'गेट्स' और 'चेकपॉइंट्स' शामिल हैं जो एजेंट को भटकने से रोकते हैं। यह पूरी तरह से व्यवस्थित प्रक्रिया और यूजर की मंजूरी पर आधारित है।

प्लगइन इंस्टॉलेशन और प्रोजेक्ट की शुरुआत

यहाँ Claude Code में प्लगइन को इंस्टॉल करने और रजिस्टर करने की प्रक्रिया को विस्तार से समझाया गया है। एक बार सक्रिय होने पर, टीम ने इसे Trello जैसा प्रोजेक्ट बनाने का काम सौंपा जिससे इसकी 'ब्रेनस्टॉर्मिंग' क्षमता का परीक्षण किया जा सके। AI ने तुरंत काम शुरू करने के बजाय टेक स्टैक और डेटाबेस सुरक्षा से जुड़े महत्वपूर्ण सवाल पूछे। इसने विकल्पों की चुनौतियों को स्पष्ट किया और यूजर की संतुष्टि के बाद ही आर्किटेक्चर डिज़ाइन तैयार किया। अंत में, सारा डेटा एक सुरक्षित फोल्डर में रखा गया जिसमें Git कमिट के निर्देश भी शामिल थे।

नियोजन और आइसोलेशन में कार्यान्वयन

इस भाग में प्लानिंग स्किल और सब-एजेंटों के प्रबंधन पर चर्चा की गई है जो सामान्य Claude प्लानिंग से काफी अलग है। Superpowers प्लगइन हर सब-एजेंट के लिए एक अलग 'Git Work Tree' बनाता है ताकि उनके काम में टकराव न हो। यह आइसोलेशन कोड की गुणवत्ता बनाए रखने और एक-दूसरे के काम को ओवरराइट करने से बचाने के लिए अनिवार्य है। प्रत्येक कार्य पूरा होने के बाद एक अलग 'रिव्यू टास्क' बनाया जाता है जो कोड की गुणवत्ता की जांच करता है। जब सभी एजेंटों और रिव्यूअर्स की सहमति मिल जाती है, तभी कोड को मेन ब्रांच में मर्ज किया जाता है।

TDD दृष्टिकोण और कॉन्टेक्स्ट प्रबंधन

वीडियो यहाँ दर्शाता है कि कैसे प्लगइन AI को बहाने बनाने से रोकता है और उसे सख्त TDD (टेस्ट ड्रिवन डेवलपमेंट) का पालन करने पर मजबूर करता है। एजेंटों को पहले टेस्ट लिखने होते हैं और फिर बिना टेस्ट केस बदले कोड को पास करना होता है। वक्ता चेतावनी देता है कि यह प्रक्रिया बहुत अधिक 'कॉन्टेक्स्ट विंडो' (लगभग 50-95%) की खपत करती है। इस समस्या से निपटने के लिए 'compact' कमांड का उपयोग करने की सलाह दी गई है ताकि महत्वपूर्ण जानकारी गायब न हो। हालांकि इसमें समय अधिक लगता है, लेकिन परिणाम बिल्कुल यूजर की अपेक्षाओं के अनुरूप होते हैं।

सिस्टमैटिक डीबगिंग और UI संवर्धन

अंतिम भाग में प्लगइन की व्यवस्थित डीबगिंग प्रक्रिया को दिखाया गया है जो चार चरणों (पहचान, अलगाव, कारण खोज और समाधान) में बंटी है। टीम ने एक डेटा सेविंग बग को इसी तरीके से सफलतापूर्वक ठीक किया। वक्ता यह भी समझाता है कि हर छोटे काम के लिए लंबी प्रक्रिया की जरूरत नहीं होती और इसे लचीले ढंग से भी इस्तेमाल किया जा सकता है। उदाहरण के तौर पर, ऐप के UI को बहुत कम समय में एक पेशेवर लुक दिया गया जबकि फॉर्मेटिंग के नियमों का पालन जारी रहा। अंत में, AI Labs Pro कम्युनिटी और सपोर्ट के विकल्पों के बारे में जानकारी दी गई है।

Community Posts

View all posts