मैंने /grill-me को अपडेट किया और Claude Code को हल किया

CChase AI
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00सिर्फ 'प्लान मोड' काफी नहीं है। मैट पोकॉक की 'Grill Me' जैसी स्किल्स या फिर और बड़ी ऑर्केस्ट्रेशन लेयर्स
00:00:06जैसे GSD या सुपरपावर्स, सब एक ही समस्या सुलझाने की कोशिश कर रहे हैं। अपने दिमाग के उस धुंधले विचार को लें
00:00:11और उसे कुछ ऐसा बनाएं जिसे Claude Code वास्तव में बना सके। लेकिन आप चाहे कोई भी रास्ता चुनें
00:00:16या कोई भी स्किल चुनें, वे सभी एक ही समस्या का सामना करती हैं। आप एक ही मॉडल पर भरोसा कर रहे हैं
00:00:21जो न केवल योजना बनाता और बनाता है, बल्कि आप उसी मॉडल पर अपना काम खुद ग्रेड करने के लिए भी भरोसा कर रहे हैं।
00:00:26तो जब आप Claude से पूछते हैं, 'हे, क्या यह आगे बढ़ने का सबसे अच्छा तरीका था?' तो वह क्या कहेगा? खैर,
00:00:31वह यही कहेगा कि यह बहुत अच्छा था, आपने कुछ भी किया हो। और यह एक समस्या है क्योंकि यदि आप
00:00:35तकनीकी बैकग्राउंड से नहीं आते हैं, तो आप वास्तव में नहीं जानते कि Claude ने जो लिखा है वह क्या वाकई सही है।
00:00:41लेकिन इस वीडियो में, मैं आपको इसे ठीक करना सिखाऊंगा। हम मैट पोकॉक की
00:00:45'Grill Me' स्किल पर निर्माण करेंगे और हम Codex से एक एडवरसैरियल (विरोधाभासी) कोड रिव्यू जोड़ेंगे। लेकिन यह
00:00:51एक ऐसा कोड रिव्यू है जो आपके द्वारा पहले देखे गए Codex प्लगइन से कहीं आगे जाता है। यह कोड रिव्यू
00:00:55पुनरावर्ती (इटरेशन) है। Claude Code और Codex कई राउंड में एक-दूसरे से बात करने वाले हैं
00:01:00ताकि आपको उस स्थिति तक पहुँचाया जा सके जहाँ दोनों प्रमुख AI टूल्स आपकी योजना पर हस्ताक्षर कर दें। ताकि आप वास्तव में महसूस कर सकें
00:01:07कि Claude Code ने जो सोचा वह वास्तव में समझ में आता है। और इस स्किल के साथ, आप
00:01:12हर प्रोजेक्ट को दो चीजों के साथ शुरू कर पाएंगे। पहला, एक ऐसी योजना जिसे आप वास्तव में समझते हैं। और दूसरा,
00:01:18एक ऐसी योजना जिसे कई AI टूल्स ने मंजूरी दी है। तो आज आपको मुझसे दो स्किल्स मिलने वाली हैं।
00:01:23और वे दोनों स्किल्स उस पर आधारित हैं जो मैट पोकॉक ने अपने GitHub रेपो में दिया है।
00:01:28उनकी दो स्किल्स हैं 'Grill Me' और 'Grill with Docs'। मैं आपको जो दो स्किल्स देने वाला हूँ, वे हैं 'Grill Me Codex'
00:01:35और 'Grill with Docs Codex'। तो क्या हो रहा है? खैर, 'Grill Me' और 'Grill with Docs' अनिवार्य रूप से एक
00:01:41प्लान मोड का बेहतर वर्ज़न (on steroids) हैं। GSD की तरह, सुपरपावर्स की तरह, यह इसे एक कदम और आगे ले जाता है। यह जो सवाल पूछता है,
00:01:48वे गहरे हैं। यह आपको बेहतर अंतर्दृष्टि देगा कि आप वास्तव में क्या बनाने की कोशिश कर रहे हैं क्योंकि चाहे आप
00:01:53इसे स्वीकार करना चाहें या न चाहें, आप शायद यह स्पष्ट रूप से बताने में सक्षम नहीं हैं कि आप क्या चाहते हैं। और यदि आप
00:01:57शुरुआत में Claude Code को यह नहीं बता सकते कि आप क्या चाहते हैं, तो आप AI की तरफ से
00:02:01बहुत सारी धारणाएं पाएंगे, जो आपको अंत में एक औसत दर्जे का उत्पाद देगी। तो 'Grill Me' और 'Grill with'
00:02:07Docs' आपको प्लानिंग चरण में गहराई में जाकर बेहतर परिणाम देते हैं ताकि यह सुनिश्चित हो सके कि आप सभी एक ही पेज पर हैं।
00:02:12मेरी स्किल्स आपको इसका दूसरा चरण देंगी, जहाँ आपके और Claude
00:02:19Codex के एक पेज पर आने के बाद, Codex अंदर आता है और कहता है, 'हे, यह समझ में आता है। यह ठीक नहीं है,
00:02:24इसे ठीक करें।' और फिर Claude Code और Codex आगे-पीछे बात करते हैं। और मुझे लगता है कि यह महत्वपूर्ण है क्योंकि
00:02:28Grill Me, GSD और सुपरपावर्स जैसी चीजों ने ठीक इसी अंतराल (gap) की पहचान की, आपके
00:02:34और Claude Code के बीच का वह अंतराल, जहाँ आपके पास एक विचार है, आप उसे स्पष्ट कर सकते हैं, हम आगे-पीछे
00:02:38बात करने जा रहे हैं, हम एक ही पेज पर आने वाले हैं, है ना? 'Grill Me', आप जानते हैं, 'GM' इसके लिए एकदम सही है।
00:02:44समस्या यह है, भले ही आप और Claude Codex एक ही पेज पर हों, क्या इसका मतलब यह है कि हम स्वचालित रूप से
00:02:51सर्वोत्तम कोड (optimal code) की इस यात्रा पर हैं, जहाँ यह वही है जो वास्तव में बनाया जाना चाहिए? शायद, शायद
00:02:57नहीं, कौन कह सकता है? शायद आप नहीं कह सकते, क्या आप एक विशेषज्ञ सॉफ्टवेयर इंजीनियर हैं? आप हो सकते हैं,
00:03:03लेकिन मेरा अनुमान है कि इसे देख रहे अधिकांश दर्शक उस श्रेणी में नहीं आते हैं।
00:03:08और मैट पोकॉक की चीज़ जैसी चीजें, जितनी भी महान हैं, मेरा मतलब है, यह असली इंजीनियरों के लिए स्किल्स हैं।
00:03:13क्या आप एक असली इंजीनियर हैं? शायद नहीं। हो सकता है आप हों। यदि आप नहीं हैं, तो क्या आप उस समस्या में पड़ेंगे
00:03:19जहाँ आप यह मूल्यांकन भी नहीं कर सकते कि Claude Codex ने क्या लिखा है? भले ही आप एक ही पेज पर हों,
00:03:23यह कचरा हो सकता है, यह अद्भुत हो सकता है, कौन जानता है? और दूसरी समस्या यह है कि आप इसका न्याय नहीं कर सकते,
00:03:28और न ही Claude Codex कर सकता है क्योंकि Claude Codex, और यह कुछ ऐसा है जिसे Anthropic ने खुद कहा है,
00:03:34बहुत अच्छा है और इसने जो कोड लिखा है उसके बारे में बहुत अच्छी तरह से बात करता है, है ना? आप Claude Codex से जज करने के लिए
00:03:40कहते हैं जो उसने लिखा है, वह ऐसा है, 'ओह हाँ, बहुत बढ़िया, A+।' तो, क्या वे इस मामले में एक विश्वसनीय कथावाचक और एक विश्वसनीय
00:03:46मूल्यांकनकर्ता हैं? नहीं, वे नहीं हैं। तो, यदि आपको पता नहीं है कि क्या चल रहा है, और हम
00:03:50जरूरी तौर पर Claude Codex पर भरोसा नहीं कर सकते, तो यह हमें कहाँ छोड़ता है? खैर, हमारे पास यहाँ यह अंतराल है, है ना?
00:03:56हमारे पास Claude Code और तथाकथित 'सर्वोत्तम कोड' के बीच यह अंतराल है। और इसलिए, स्पष्ट समाधान यह है,
00:04:02खैर, आइए एक तीसरे पक्ष को लाएं, एक तटस्थ तीसरा पक्ष जो हमारी योजना पर एक नज़र डाले। अंदर आता है Codex।
00:04:09और यह Codex रिव्यू वह है जिसे मैंने पोकॉक स्किल्स में जोड़ा है, और यह वह है जो मैं आज आपको देने वाला हूँ।
00:04:16तो, पहला आधा हिस्सा 'GrillMe' जैसा ही है। आगे-पीछे सवाल, हम इस योजना को एक साथ शुरू करते हैं
00:04:21सब कुछ यहाँ बहुत अच्छा और साफ है। और एक बार जब हमारे पास योजना पूरी तरह से तैयार हो जाती है, तो खैर,
00:04:27फिर Codex अंदर आता है, यह देखता है कि Claude Codex क्या लेकर आया है और कहता है,
00:04:32'यह अच्छा लग रहा है, यह बुरा लग रहा है, आप क्या सोचते हैं?' Claude Code इसे देखता है और कहता है,
00:04:36'ओह, यह समझ में आता है, चलिए इसे ठीक करते हैं, यहाँ है जो मैंने किया है, फिर से देखें, Codex।' और यह
00:04:41एक चक्र से गुजरने वाला है, जैसे, यह पाँच मोड़ पर अधिकतम होता है, आप आसानी से इसे संपादित कर सकते हैं, लेकिन यह
00:04:48पाँच आगे-पीछे करेगा, जो मानक एडवरसैरियल रिव्यू Codex प्लगइन से थोड़ा अलग है,
00:04:52क्योंकि यह अधिक पुनरावर्ती है। और विचार यह है कि, यदि वे पर्याप्त बार आगे-पीछे बात करते हैं
00:04:57तो हम अंततः एक ऐसी जगह पर पहुँच जाएंगे, उम्मीद है कि पाँच मोड़ से पहले, जहाँ वे दोनों कहते हैं,
00:05:01'हे, थम्स अप, यह जाने के लिए तैयार है, आगे बढ़ें।' तो यह सब कहने का मतलब है कि मैं आज आपको जो दे रहा हूँ,
00:05:09वह यहाँ इस अंतराल को ठीक करने के लिए है। Claude Code और सर्वोत्तम कोड के बीच का वह अंतराल जो आप
00:05:16और मैं पहचानने के लिए संघर्ष करेंगे क्योंकि हम विशेषज्ञ सॉफ्टवेयर इंजीनियर नहीं हैं और Claude Code पर भरोसा नहीं किया जा सकता
00:05:21है कि वह इसे एक हद तक कर सके। तो यही हम कवर कर रहे हैं। और अब हम सब एक ही पेज पर हैं।
00:05:28लेकिन डेमो में कूदने से पहले, आज के प्रायोजक, यानी मुझसे एक त्वरित शब्द। जैसा कि आप जानते हैं,
00:05:33'Chase AI Plus' मेरी 'Claude Code मास्टरक्लास' का घर है। और यह शून्य से AI देव बनने का नंबर एक तरीका है,
00:05:37खासकर यदि आप तकनीकी बैकग्राउंड से नहीं आते हैं। हम वास्तविक उपयोग के मामलों (use cases) पर ध्यान केंद्रित करते हैं।
00:05:42और मैंने हाल ही में वहाँ 'Claude OS मास्टरक्लास' भी जोड़ा है। तो यदि आप कहते हैं, 'हे, मैं यह भी सीखना चाहता हूँ कि
00:05:49Obsidian जैसी चीजों को कैसे एकीकृत करें और एक पूर्ण कमांड सेंटर कैसे बनाएं।' तो यह आपके लिए जगह है।
00:05:54आप इसका लिंक पिन किए गए कमेंट में पा सकते हैं। तो आज के डेमो के लिए, हम अपनी वेबसाइट पर एक नया पेज जोड़ने जा रहे हैं।
00:05:59तो यह मेरी AI एजेंसी की वेबसाइट है। और नया पेज लोगों को कुछ विशेष स्किल्स तक
00:06:05पहुँच प्रदान करेगा। और इस पेज तक पहुँचने के लिए, जब वे उस पर क्लिक करते हैं, तो उन्हें अपना ईमेल डालना होगा।
00:06:11तो यह थोड़ा गेटेड है, हम उनका ईमेल ले लेते हैं, फिर उनके पास उन चीजों तक पहुंच होती है जिन्हें वे डाउनलोड कर सकते हैं।
00:06:16अब ईमेल को हमारे डेटाबेस के साथ संभाला जाना चाहिए, जो पहले से मौजूद है।
00:06:22तो हम सिर्फ पतली हवा से कोई सुविधा नहीं बना रहे हैं, इसे उस कोडबेस पर एक नज़र डालने की ज़रूरत है
00:06:27जो पहले से मौजूद है और इसे सुसंगत (coherent) बनाना है। तो यह वह प्रॉम्प्ट है जो मैं Claude Code को दे रहा हूँ, 'रन ग्रिल मी कोडेक्स (run grill me codex)'।
00:06:32मैं साइट पर एक ईमेल कैप्चर गेट जोड़ना चाहता हूँ जो 'Grill Me Codex' Claude Code स्किल को अनलॉक करता है।
00:06:38यदि आगंतुक (visitor) किसी ऐसे पेज पर आता है जहाँ स्किल डाउनलोड एक ओवरले के पीछे धुंधला है,
00:06:42तो वे इसे अनलॉक करने के लिए अपना ईमेल दर्ज करते हैं और उनका ईमेल संग्रहीत हो जाता है। और फिर मैंने इसे कुछ अतिरिक्त संदर्भ दिया।
00:06:49तो पहला हिस्सा 'Grill Me' स्किल होगा। यह बिल्कुल वही 'Grill Me' हिस्सा है
00:06:56जैसा कि मैट पोकॉक का है, जिस पर हम थोड़ा बहुत निर्माण कर रहे हैं। तो वह हिस्सा वही है।
00:07:00और एक बार जब हम सभी सवालों से गुजरते हैं, तो कोडेक्स अंदर आ जाएगा। तो मेरे द्वारा
00:07:03कोडबेस देखने के बाद, यह अब मुझसे पहला सवाल पूछ रहा है और कह रहा है, 'यह गेट कितना असली है
00:07:07जब ब्लर की बात आती है? क्या यह एक कॉस्मेटिक चीज़ है या इसे वास्तव में लागू किया जाने वाला है?'
00:07:11और 'Grill Me' के साथ, जब भी यह आपसे कोई सवाल पूछता है और कुछ संभावित उत्तर देता है,
00:07:16तो यह अपनी सिफारिश (recommendation) और कारण भी देता है। तो इसके लिए, यह सिर्फ कॉस्मेटिक होगा।
00:07:21यह एक फ्री स्किल है। यहाँ लक्ष्य सिर्फ ईमेल कैप्चर करना है। तो हम बस कहेंगे,
00:07:25'कॉस्मेटिक ठीक है। फाइल वैसे भी फ्री है।' अगला सवाल यह है कि एसेट कहाँ रहने वाला है
00:07:30और किस फॉर्मेट में। और फिर से, इस डेमो के लिए, मैं बस अनुशंसित (recommended)
00:07:36विकल्प के साथ जा रहा हूँ। और मैं आपको बाकी सवालों के जवाब नहीं दिखाने वाला हूँ क्योंकि यह
00:07:40'Grill Me' वीडियो नहीं होने वाला है। बस यह समझें कि यदि आपने इसे पहले नहीं देखा है, तो यह सामान्य गति है।
00:07:44यह आपसे सवालों की एक श्रृंखला पूछेगा, संभावित उत्तर और एक सिफारिश देगा।
00:07:48प्लान मोड के समान ही, बस प्लान मोड 'स्टेरॉयड' पर। तो आप यहाँ देख सकते हैं,
00:07:51हम 'Grill Me' साइड पर 10 सवालों से गुजरे, और फिर हम कोडेक्स
00:07:56वाले हिस्से में चले गए। अब कोडेक्स हिस्सा हमारे लिए दो मार्कडाउन फाइलें बनाने वाला है। हमारे पास 'plan.md'
00:08:02है और फिर 'plan review log' है। तो 'plan.md' वह है जो हम बनाने जा रहे हैं, उसके लिए सत्य का स्रोत है।
00:08:10यह हमारा अंतिम डिलिवरेबल है। 'plan review log.md', यह वह जगह है
00:08:16जहाँ Claude Code और Codex आपस में भिड़ने वाले हैं। Codex मूल 'plan.md' पर एक नज़र डालने वाला है और
00:08:21उस पूरी चीज पर एक नज़र डालने वाला है जिसे Claude Code ने बनाया है। और यह 'plan review log' में है कि Codex
00:08:28कहने वाला है, 'हे, यह बेकार है। यह नहीं, आदि।' यह हमें उनके आगे और
00:08:33पीछे के सभी चक्रों का लॉग भी देता है। और Codex और Claude Code के इस आगे-पीछे के अंत में,
00:08:38हमारे पास एक अपडेटेड 'plan.md' होगा। तो 'plan.md' अंतिम डिलिवरेबल है। सब कुछ इसी पर आधारित होगा।
00:08:46 'plan review log' आगे-पीछे का है और जहाँ सॉसेज वास्तव में बनता है। इस एडवरसैरियल रिव्यू के दौरान एक और
00:08:52नोट यह है कि हालाँकि यह हेडलेस (headless) है, फिर भी हम Codex को सेशन आईडी देते हैं।
00:08:59तो ऐसा नहीं है कि यह Codex की तरफ से एक पूरी तरह से खाली स्लेट है, जैसे कि इटरेशन एक बनाम इटरेशन
00:09:05दो बनाम इटरेशन तीन। इसमें हमेशा Claude Code के साथ पूरी बातचीत की स्मृति होती है। तो हम
00:09:12यहाँ दौर एक में देख सकते हैं, कि Codex ने 11 चीजें पाईं जिन्हें उसने समस्याएं माना। और हम यह भी
00:09:18देख सकते हैं कि Claude Code ने उन निष्कर्षों के आधार पर 'plan.md' को अपडेट किया जिन्हें उसने स्वीकार किया और महसूस किया
00:09:25कि वे मान्य थे। दौर दो में, उसने चार अतिरिक्त निष्कर्ष पाए। हम 11 से घटकर चार पर आ गए हैं। और फिर,
00:09:31प्लान को अपडेट किया गया था। और यहाँ दौर तीन में, हम देखते हैं कि फैसला अब मंजूर (approved) है। यह उस बिंदु पर
00:09:35है कि Codex और Claude Code अब एक ही पेज पर हैं। Codex ने अभी भी कुछ चीजों को फ्लैग किया है,
00:09:40लेकिन वे सिर्फ तीन निम्न-स्तरीय नट्स (knits) हैं। तो वे नॉन-ब्लॉकर हैं। और यह अंत में यहाँ दोहराया गया है
00:09:45जहाँ यह बता रहा है कि यह मंजूर (approved) है, पाँच में से दौर तीन हमें बताता है कि अंतिम योजना कैसी दिखती है,
00:09:50दो एक्ट्स ने हमें क्या दिया और विशेष रूप से एक्ट दो के संदर्भ में, जो कि Codex और Claude
00:09:56Code का भिड़ना है। आप जानते हैं, हमने वास्तविक सुरक्षा और शुद्धता के छेद पकड़े।
00:10:01वहाँ अनबाउंडेड क्लाइंट स्किल स्लग, केस सेंसिटिव डिडुप बाईपास, रिलेटिव ईमेल लिंक,
00:10:06रॉ लिस्ट बॉम्बिंग वेक्टर और एक टेबल स्कैनिंग रेट लिमिट थी। और दूसरे दौर में, इसने गलत
00:10:12फिक्सेस को पकड़ा। तो दौर एक में Codex ने कहा, 'हे, यहाँ मुद्दे हैं।' Claude Code ने उन्हें ठीक करने की कोशिश की। और
00:10:18दूसरे इटरेशन में Codex ऐसा है, 'वे वास्तविक फिक्सेस नहीं हैं, है ना?' तो इसने देखा कि डबल ऑप्ट-इन
00:10:24का दावा किया, लेकिन वायर नहीं किया गया था, एक्सप्रेशन इंडेक्स डिडुप जिसे सुपरबेस जेएस टारगेट नहीं कर सकता
00:10:30और रिस्पॉन्स से पहले अवे, जो अभी भी अनलॉक को ब्लॉक करता था, उसे बाद में ले जाया गया। तो बस तीन दौर,
00:10:38लेकिन यह पहली योजना को निष्पादित करने की कोशिश करने की तुलना में एक बड़ा समय बचाने वाला है। Claude Code आया
00:10:44और फिर पूरी ट्रबलशूटिंग प्रक्रिया से गुजरा। अंत में, यह कुछ ओपन
00:10:49आइटम भी लाता है, मुख्य रूप से जैसे SQL माइग्रेशन और वह सब। लेकिन यह Claude Code का आलसी होना भी है क्योंकि यह
00:10:54इसे अपने दम पर कर सकता है। तो वेबसाइट पर वापस ऊपर, हमारे पास फ्री स्किल है। मैं उस पर क्लिक करता हूँ। अब यह
00:10:58मुझसे मेरा ईमेल मांग रहा है। और कूल। अब मेरे पास यहाँ स्किल है जिसे मैं .zip फाइल में डाउनलोड कर सकता हूँ।
00:11:08जाहिर है वास्तविकता में, मैं वास्तव में क्या करना चाहूँगा? खैर, मैं शायद चाहूँगा कि टेक्स्ट और
00:11:12सब कुछ वास्तव में बाकी वेबसाइट से मेल खाए, लेकिन आप देख सकते हैं कि इसने वह बना दिया जो हम करने के लिए निकले थे।
00:11:18इस वीडियो का उद्देश्य विशिष्ट डेमो नहीं था, बल्कि सिर्फ आपको कार्रवाई में यह स्किल दिखाना था। जहाँ तक
00:11:23इन स्किल्स को खुद प्राप्त करने की बात है, मैं उन्हें पिन और कमेंट में डाल दूँगा ताकि आपके लिए आसान हो सके।
00:11:27लेकिन इसके अलावा, यह काफी कुछ है जो मेरे पास है। जाहिर है इसके लिए आपको जो जानना ज़रूरी है वह है,
00:11:31हे, हम कोडेक्स का उपयोग कर रहे हैं। तो आपको एक ओपन AI अकाउंट की आवश्यकता होगी। आपको कोडेक्स की आवश्यकता होगी
00:11:35डाउनलोड किया हुआ, जो करना अपेक्षाकृत आसान है। और कोई कारण नहीं है कि आपको
00:11:39इससे बहुत कुछ पाने के लिए $20 प्रति माह के ओपन AI प्लान से अधिक की आवश्यकता है। यह सिस्टम जिसे हमने बनाया है, वह भी कुछ
00:11:45ऐसा है जिसे आप आसानी से किसी प्रकार के लोकल मॉडल के लिए स्वैप कर सकते हैं। तो यदि आप कहते हैं, 'हे, मैं
00:11:50ओपन AI को $20 प्रति माह नहीं देना चाहता। मैं DeepSeq या जो भी, किसी भी लोकल या सस्ते मॉडल का उपयोग करना पसंद करूँगा
00:11:55जो आपके पास है, करना वास्तव में बहुत आसान है। जैसे हड्डियाँ वहाँ हैं। मैं बस उस स्किल को लूँगा जो मैंने बनाई है,
00:12:00Claude Code के अंदर लाऊँगा और कहूँगा, 'हे, क्या हम कोडेक्स को उस मॉडल के लिए स्वैप कर सकते हैं जिसका आप उपयोग करने की कोशिश कर रहे हैं?'
00:12:07यह वास्तव में इतना आसान है। यह बहुत, बहुत लचीला है। तो इसके साथ आप बहुत कुछ कर सकते हैं।
00:12:12और मुझे लगता है कि इसकी हड्डियाँ उन लोगों के लिए बहुत समझ में आती हैं जो खुद को
00:12:16विशेषज्ञ कोडर नहीं मानते हैं जो Claude Code ने जो किया है उसे जल्दी और कुशलता से देख सकते हैं और कह सकते हैं,
00:12:22'यह समझ में आता है। यह नहीं।' यह बस बहुत से लोगों के व्हीलहाउस में नहीं है,
00:12:26और न ही इसे होने की आवश्यकता है। स्पष्ट रूप से, हमारे पास टूल्स हैं जो हमारे लिए यह कर सकते हैं। तो हमेशा की तरह,
00:12:32मुझे बताएं कि आपने क्या सोचा। यदि आप 'Claude Code मास्टरक्लास' पर हाथ आजमाना चाहते हैं तो 'Chase AI Plus' को देखना सुनिश्चित करें,
00:12:35और मैं आपको आसपास देखूँगा।
00:12:37अलविदा।

Key Takeaway

Claude Code और Codex के बीच एक पुनरावर्ती एडवरसैरियल रिव्यू लूप जोड़ने से विशेषज्ञ इंजीनियर न होने पर भी सुरक्षित और सटीक कोड जनरेशन सुनिश्चित किया जा सकता है।

Highlights

  • Claude Code और अन्य ऑर्केस्ट्रेशन लेयर्स एक ही मॉडल पर योजना बनाने और उसे ग्रेड करने के लिए निर्भर हैं, जिससे सुरक्षा और गुणवत्ता संबंधी जोखिम बढ़ते हैं।

  • एडवरसैरियल कोड रिव्यू के लिए 'Grill Me Codex' और 'Grill with Docs Codex' स्किल्स को Claude Code के साथ एकीकृत किया गया है।

  • कोडेक्स और Claude Code के बीच पुनरावर्ती (recursive) फीडबैक लूप, जो अधिकतम पांच चरणों में चलता है, तकनीकी कमियों को पकड़ता है।

  • परीक्षण के दौरान Codex ने 11 प्रारंभिक समस्याओं की पहचान की, जिनमें असुरक्षित क्लाइंट स्किल स्लग और रॉ लिस्ट बॉम्बिंग वेक्टर शामिल थे।

  • दूसरे इटरेशन में Codex ने Claude Code द्वारा किए गए गलत फिक्सेस को भी सफलतापूर्वक पकड़ा और संशोधित करवाया।

Timeline

AI डेवलपमेंट में एक-तरफा निर्भरता की समस्या

  • AI मॉडल स्वयं योजना बनाते हैं और स्वयं ही अपने कोड का मूल्यांकन करते हैं।
  • तकनीकी बैकग्राउंड न होने पर उपयोगकर्ता यह नहीं परख सकते कि AI द्वारा लिखा गया कोड सही है या नहीं।

Claude Code जैसे टूल्स योजना बनाने और उसे लागू करने के साथ-साथ खुद को ग्रेड भी करते हैं। यह एक समस्या है क्योंकि बिना विशेषज्ञ ज्ञान के उपयोगकर्ता यह पुष्टि नहीं कर सकते कि आउटपुट वास्तव में गुणवत्तापूर्ण है या केवल आत्मविश्वास के साथ प्रस्तुत किया गया गलत कोड है।

Codex एडवरसैरियल रिव्यू का एकीकरण

  • Codex को एक तटस्थ तीसरे पक्ष के रूप में जोड़कर एडवरसैरियल रिव्यू प्रक्रिया लागू की गई है।
  • यह प्रक्रिया पुनरावर्ती है और दोनों टूल्स के बीच कई बार संवाद के माध्यम से एक आम सहमति तक पहुँचती है।

Claude Code और Codex के बीच एक फीडबैक लूप स्थापित किया गया है। Codex, Claude Code द्वारा बनाई गई योजना और कोड की समीक्षा करता है, त्रुटियों को चिह्नित करता है और Claude Code को उन्हें ठीक करने का निर्देश देता है। यह चक्र तब तक चलता है जब तक कि दोनों टूल्स अंतिम योजना पर सहमत नहीं हो जाते।

ईमेल कैप्चर गेट के साथ व्यावहारिक डेमो

  • एक ईमेल कैप्चर गेट बनाने के लिए 'Grill Me Codex' स्किल का उपयोग किया गया।
  • Codex ने तीन दौर की समीक्षा के बाद अंतिम योजना को मंजूरी दी।

एक वेबसाइट पर ईमेल गेट जोड़ने की प्रक्रिया में 'Grill Me Codex' का उपयोग किया गया। यह प्रक्रिया 11 मुद्दों के साथ शुरू हुई, जिनमें सुरक्षा खामियाँ और रेट लिमिट जैसी समस्याएं थीं। तीन पुनरावृत्तियों के बाद, Codex ने उन सभी को सफलतापूर्वक संबोधित किया और अंतिम कोड संरचना को मंजूरी दी।

लचीलापन और भविष्य की संभावनाएं

  • यह सिस्टम बहुत लचीला है और इसे ओपन एआई के स्थान पर लोकल मॉडल्स के साथ स्वैप किया जा सकता है।
  • इन स्किल्स का उद्देश्य उन लोगों को सशक्त बनाना है जो खुद को विशेषज्ञ कोडर नहीं मानते हैं।

सिस्टम की बनावट को किसी भी लोकल या सस्ते मॉडल के साथ एकीकृत करना सरल है। इसका मुख्य लक्ष्य ऐसे उपयोगकर्ताओं को एक सुरक्षित वातावरण प्रदान करना है जो विशेषज्ञ सॉफ्टवेयर इंजीनियर नहीं हैं, जिससे वे AI द्वारा उत्पन्न कोड की शुद्धता को लेकर निश्चिंत रह सकें।

Community Posts

No posts yet. Be the first to write about this video!

Write about this video