00:00:00आजकल कई AI कोड एडिटर्स मौजूद हैं, और हर एक में ऐसे खास टूल्स और फीचर्स हैं जो उसे दूसरों से अलग बनाते हैं।
00:00:04Claude Code शायद सबसे बेहतरीन है, खास तौर पर Opus मॉडल के साथ, लेकिन यह काफी महंगा भी है।
00:00:09वहीं दूसरी ओर, Cursor उन डेवलपर्स का पसंदीदा है जो एजेंट के काम को कोड के साथ-साथ देखना पसंद करते हैं, पर इसकी अपनी कुछ कमियां हैं।
00:00:16Google ने भी Gemini 3 के साथ Anti-Gravity रिलीज किया है, जो अपने मॉडल और फ्री इस्तेमाल की वजह से डेवलपर्स के बीच तेजी से लोकप्रिय हुआ है।
00:00:23यह Claude Code और Cursor दोनों से नया है, लेकिन इसने कई चीजों को Cursor से बेहतर तरीके से लागू किया है।
00:00:28जब से AI कोडिंग इतनी पावरफुल हुई है, बहुत से लोग इन टूल्स के साथ अपना खुद का वर्कफ़्लो बना रहे हैं।
00:00:35लेकिन किसी भी अच्छे वर्कफ़्लो की असली कुंजी यह है कि वह आपके कॉन्टेक्स्ट को कितनी कुशलता से मैनेज करता है।
00:00:39इससे पहले, Anthropic ने लंबे समय तक चलने वाले टास्क के लिए एक एजेंट हार्नेस निकाला था, और अब Cursor ने अपना खुद का हार्नेस रिलीज किया है जिसे Cursor की क्षमताओं का पूरा फायदा उठाने के लिए बनाया गया है।
00:00:50इस लेख में बताए गए सिद्धांत सभी एजेंटों पर लागू होते हैं, इसलिए मैं इन सिद्धांतों को Google के Anti-Gravity पर इस्तेमाल कर रहा हूँ।
00:00:57हो सकता है कि यह अभी सबसे अच्छा न हो, लेकिन इसमें ऐसे फीचर्स हैं जो इसे दूसरों से अलग खड़ा करते हैं।
00:01:01आज हमारे पास बात करने के लिए बहुत कुछ है क्योंकि इस हार्नेस के जुड़ने से Anti-Gravity की परफॉरमेंस काफी बेहतर हो गई है।
00:01:28आखिर में बात आती है कि आप एक यूजर के तौर पर इससे कैसे इंटरैक्ट करते हैं, इसे कैसे प्रॉम्प्ट देते हैं और इसके जवाबों पर कैसे फॉलो-अप करते हैं।
00:01:38हार्नेस इसलिए जरूरी है क्योंकि अलग-अलग मॉडल्स एक ही प्रॉम्प्ट पर अलग तरह से रिस्पॉन्स देते हैं, क्योंकि हर मॉडल की अपनी खूबियां होती हैं।
00:01:48मिसाल के तौर पर, शेल-बेस्ड एनवायरनमेंट में ट्रेंड मॉडल किसी समर्पित सर्च टूल के बजाय GREP का इस्तेमाल करना ज्यादा पसंद कर सकता है।
00:01:54यह मायने रखता है क्योंकि हमें पता है कि Claude जैसे मॉडल्स XML प्रॉम्प्ट्स के साथ अच्छा काम करते हैं, जबकि अन्य Markdown के साथ बेहतर प्रदर्शन करते हैं।
00:02:00इसलिए, यह बहुत जरूरी है कि हम जिस हार्नेस का इस्तेमाल करें, वह उसी खास मॉडल के हिसाब से बना हो जिस पर हम काम कर रहे हैं।
00:02:04काम शुरू करने से पहले प्लानिंग करना बहुत जरूरी है ताकि कोड आपकी उम्मीदों के मुताबिक बने।
00:02:10अनुभवी डेवलपर्स कोड जेनरेट करने से पहले प्लानिंग करना पसंद करते हैं क्योंकि इससे उन्हें अपनी सोच साफ करने में मदद मिलती है और एजेंट को सटीक लक्ष्य मिलते हैं।
00:02:18मुझे Anti-Gravity का प्लानिंग फीचर सबसे ज्यादा पसंद है क्योंकि इसमें कमेंट्स के जरिए प्लान को सुधारना बहुत आसान है।
00:02:24जब मैंने प्लानिंग मोड शुरू किया, तो इसने मेरे निर्देशों और मौजूदा कोड बेस का बारीकी से विश्लेषण किया और फिर एक विस्तृत प्लान तैयार किया।
00:02:30हालांकि प्लान को पूरा पढ़ना थोड़ा थकाऊ था, लेकिन यह सुनिश्चित करने के लिए इसे ध्यान से पढ़ना जरूरी है कि काम आपकी सोच के मुताबिक हो।
00:02:38बदलावों के लिए, मुझे बस उस लाइन पर कमेंट करना था जो मेरे लक्ष्य से मेल नहीं खाती थी, और इसने उसे संशोधित प्लान में शामिल कर लिया।
00:02:46प्लान को तब तक सुधारते रहना जरूरी है जब तक कि वह एकदम परफेक्ट न हो जाए।
00:02:49एक बार प्लान फाइनल हो जाने के बाद, एजेंट सब कुछ खुद-ब-खुद लागू कर सकता है।
00:02:52अगर नतीजा आपकी पसंद का नहीं है, तब भी फॉलो-अप प्रॉम्प्ट्स देने के बजाय प्लानिंग मोड में जाकर प्लान को एडिट करना ज्यादा बेहतर है।
00:03:00इसके बाद, एजेंट को सही कॉन्टेक्स्ट के साथ काम करने की जरूरत होती है।
00:03:03लेकिन उससे पहले, हमारे स्पॉन्सर की ओर से एक जरूरी जानकारी।
00:03:05पेश है Luma AI का नया टूल Dream Machine, Ray3 Modify।
00:03:08अगर आपने AI वीडियो पर काम किया है, तो आप उस झुंझलाहट को समझते होंगे जब आप कुछ बढ़िया जेनरेट करते हैं, लेकिन स्टाइल या सीन बदलते ही कैरेक्टर और मोशन बिगड़ जाता है।
00:03:18Ray3 Modify इस समस्या को हल करता है।
00:03:20पहली बार ऐसा लग रहा है कि AI वीडियो को वास्तव में डायरेक्ट किया जा रहा है, न कि सिर्फ अंदाजा लगाया जा रहा है।
00:03:23आप किसी मौजूदा क्लिप या असली एक्टिंग को लेकर उसके वर्ल्ड, लाइटिंग या सिनेमैटिक स्टाइल को बदल सकते हैं, जबकि कैरेक्टर और इमोशन्स वैसे ही रहेंगे।
00:03:33एक्टिंग वही रहती है, बस उसका लुक बिल्कुल वैसा हो जाता है जैसा आप चाहते हैं।
00:03:36कैरेक्टर रेफरेंस और मॉडिफिएबल कीफ्रेम्स के साथ, आप कंट्रोल कर सकते हैं कि अलग-अलग शॉट्स में क्या एक जैसा रहेगा और क्या बदलेगा।
00:03:42यह हाइब्रिड वर्कफ़्लो, शॉर्ट फिल्मों, म्यूजिक वीडियो और सिनेमैटिक कॉन्सेप्ट्स के लिए बेहतरीन है।
00:03:47यहां तक कि छोटे प्रोडक्शंस के लिए भी यह शानदार है।
00:03:48सच कहूं तो, यह असली AI पोस्ट-प्रोडक्शन जैसा महसूस होता है।
00:03:51अंदाजा लगाना छोड़िए, डायरेक्ट करना शुरू कीजिए।
00:03:53पिन किए गए कमेंट में Ray3 Modify को चेक करें या QR कोड स्कैन करके देखें कि क्या कुछ मुमकिन है।
00:03:58एक बार जब आपकी प्लानिंग परफेक्ट हो जाए, तो आपका काम हर एजेंट को वह कॉन्टेक्स्ट देना है जो काम पूरा करने के लिए जरूरी है।
00:04:04एक और गलती जो लोग अक्सर करते हैं, वह है हर फाइल को मैन्युअल रूप से टैग करना।
00:04:08आपको ऐसा मैन्युअल रूप से करने की जरूरत नहीं है, क्योंकि एजेंटों के पास शक्तिशाली सर्च टूल्स होते हैं जो जरूरत पड़ने पर खुद कॉन्टेक्स्ट निकाल लेते हैं।
00:04:13फाइलों को मैन्युअल रूप से टैग करने से सब कुछ कॉन्टेक्स्ट में लोड हो जाता है, भले ही उन सभी लाइनों की जरूरत न हो।
00:04:18एजेंट अपनी जरूरत के खास हिस्सों को लोड करने के लिए 'grep' का इस्तेमाल कर सकते हैं।
00:04:21उदाहरण के लिए, अगर मैं साइनअप पेज में बदलाव करना चाहता हूँ, तो पूरी फाइल टैग करने से 200 से ज्यादा लाइनों वाला कंपोनेंट लोड हो जाएगा, जिससे कॉन्टेक्स्ट फालतू में भर जाएगा।
00:04:30भले ही मुझे सिर्फ 50 लाइनों के एक फंक्शन की जरूरत हो, बाकी की गैर-जरूरी लाइनें भी उसमें शामिल हो जाएंगी।
00:04:38इसलिए खुद फाइल टैग करने के बजाय, एजेंट के सर्च टूल पर भरोसा करें ताकि वह जरूरी फंक्शन को ढूंढ सके।
00:04:43आपको एक ही बातचीत में सब कुछ करने की जरूरत नहीं है।
00:04:45किसी भी नए काम के लिए नई चैट शुरू करें, या तब जब एजेंट भ्रमित होने लगे या बार-बार वही गलतियां दोहराए।
00:04:52सीधे शब्दों में कहें तो, काम का एक हिस्सा पूरा होते ही नई बातचीत शुरू कर दें।
00:04:57मिसाल के तौर पर, मैं हर नए फीचर के लिए एक नई चैट शुरू करता हूँ और प्लानिंग से शुरुआत करता हूँ।
00:05:04इस तरह, सारे टास्क अलग रहते हैं और बिल्कुल वैसे ही होते हैं जैसे मुझे चाहिए।
00:05:07नई चैट शुरू करने की जरूरत सिर्फ तब नहीं होती जब आप उसी फीचर पर काम कर रहे हों या उसे डीबग कर रहे हों।
00:05:16इनके अलावा, शोर कम करने के लिए नई बातचीत शुरू करना ही बेहतर है।
00:05:21एजेंट के जवाब कितने सटीक हैं, इसी से आपको अंदाजा लग जाएगा कि कब नई चैट शुरू करनी है।
00:05:26अगर आप पुरानी चैट्स का हवाला देना चाहते हैं, तो आप सीधे उस बातचीत का जिक्र कर सकते हैं, उसे फिर से सब कुछ समझाने की जरूरत नहीं है।
00:05:35इससे एजेंट समझदारी से पुरानी हिस्ट्री में से सिर्फ वही जानकारी निकाल पाएगा जिसकी उसे जरूरत है।
00:05:43एजेंट की क्षमताओं को नियमों और स्किल्स के जरिए और भी बढ़ाया जा सकता है।
00:05:47आप अपने प्रोजेक्ट के लिए खास नियम तय करके इसके व्यवहार को बदल सकते हैं, जिनका एजेंट को हमेशा पालन करना होगा।
00:05:55Anti-Gravity में इन बदलावों को लोकल या ग्लोबल लेवल पर जोड़ना बहुत आसान है।
00:06:00कोई गाइडलाइन जोड़ने के लिए, बस उस नियम को प्रोजेक्ट स्कोप में शामिल कर दें।
00:06:03ये नियम '.agent' फोल्डर में स्टोर होते हैं, जिसमें निर्देशों के लिए मार्कडाउन फाइलें होती हैं।
00:06:09जैसे, मैंने इस प्रोजेक्ट में फ्रंट-एंड को VCAG कंप्लायंट बनाने का एक नियम जोड़ा है।
00:06:13नियम जुड़ने के बाद, Anti-Gravity एक ऐसा प्लान बनाता है जिसमें उस नियम का ध्यान रखा जाता है, ताकि पूरा पेज कंप्लायंट बने।
00:06:24आप अपनी जरूरत के हिसाब से जितने चाहें उतने नियम जोड़ सकते हैं।
00:06:29इसी तरह, Anti-Gravity में एजेंट स्किल्स भी Anthropic के ओपन स्टैंडर्ड के हिसाब से जोड़ी गई हैं, जिनमें स्क्रिप्ट्स और जरूरी नॉलेज होती है।
00:06:38ये स्किल्स तभी लोड होती हैं जब एजेंट को उनकी जरूरत लगती है, जिससे कॉन्टेक्स्ट मैनेज रहता है।
00:06:43Anti-Gravity की सभी स्किल्स '.agent' फोल्डर में ही रहती हैं।
00:06:47हर स्किल की एक खास '.md' फाइल होती है जिसमें उसका नाम, काम और इस्तेमाल करने का तरीका दिया होता है।
00:06:55अन्य रेफरेंस और स्क्रिप्ट्स उनके संबंधित फोल्डर्स में रखे जाते हैं।
00:06:59Anti-Gravity में स्किल्स का इस्तेमाल करना बहुत आसान है, बस स्किल और काम का नाम बताएं।
00:07:05मैंने Anti-Gravity से टेस्ट स्पेशलिस्ट स्किल का इस्तेमाल कर टेस्ट केसेस लिखने को कहा, और इसने गाइडलाइंस के हिसाब से पूरा प्लान तैयार कर दिया।
00:07:14इसने उन सभी लाइब्रेरीज और स्क्रिप्ट्स का इस्तेमाल किया जिनका मैंने जिक्र किया था।
00:07:21अब मॉडल्स इमेज को बेहतर तरीके से समझने लगे हैं, इसलिए हमें अपनी प्रॉम्प्ट्स में इमेज का ज्यादा इस्तेमाल करना चाहिए।
00:07:29शब्दों में डिजाइन समझाने के बजाय, आप उस हिस्से का स्क्रीनशॉट ले सकते हैं जिसे आप बनाना चाहते हैं।
00:07:35Anti-Gravity में जाकर स्क्रीनशॉट पेस्ट करें और इसे बिल्कुल वैसा ही बनाने को कहें।
00:07:41इमेज एनालिसिस की मदद से, यह इमेज को पूरी तरह समझकर उसे लागू कर सकता है।
00:07:45इमेज का इस्तेमाल मैं सबसे ज्यादा एरर डीबगिंग के लिए करता हूँ, क्योंकि UI की दिक्कतों को शब्दों के बजाय स्क्रीनशॉट से समझाना आसान है।
00:07:54तो जब भी मुझे UI में कोई दिक्कत आती है, मैं स्क्रीनशॉट लेकर Anti-Gravity को दे देता हूँ और यह उसे फिक्स कर देता है।
00:08:00बिना सोचे-समझे कोडिंग शुरू करने के बजाय, हमें AI डेवलपमेंट में भी सॉफ्टवेयर डेवलपमेंट के बेस्ट प्रैक्टिसेज का पालन करना चाहिए।
00:08:06कुछ वर्कफ़्लो एजेंटों के साथ बहुत अच्छे से काम करते हैं, जैसे टेस्ट-ड्रिवन डेवलपमेंट, जहां एजेंट पहले टेस्ट लिखता है और फिर उन्हें पास करने के लिए कोड।
00:08:15यह इसलिए काम करता है क्योंकि एजेंटों के पास एक साफ लक्ष्य होता है, उन्हें पता होता है कि सफलता का पैमाना क्या है।
00:08:26तो बैकएंड सेटअप के दौरान, मैंने कोई कोड नहीं लिखा, बस एजेंट को टेस्ट लिखने और इनपुट-आउटपुट समझाने को कहा, और साफ किया कि अभी कोड न लिखे।
00:08:40जब एजेंट ने टेस्ट केसेस लिख दिए और मैं संतुष्ट हो गया, तब मैंने उसे उन टेस्ट्स को रन करने को कहा।
00:08:45शुरुआत में ये टेस्ट फेल हो गए क्योंकि तब तक उनका कोई इम्प्लीमेंटेशन नहीं था।
00:08:49टेस्ट पूरे होने के बाद, मैंने उन्हें Git पर कमिट कर दिया ताकि रिकॉर्ड रहे कि एजेंट ने टेस्ट्स में कोई बदलाव तो नहीं किया।
00:08:55फिर, मैंने एजेंट को एंडपॉइंट के लिए कोड लिखने को कहा और सख्त निर्देश दिए कि वह टेस्ट्स में बदलाव न करे।
00:09:01हमने तब तक काम जारी रखा जब तक कि सारे टेस्ट पास नहीं हो गए।
00:09:07इस तरह, एजेंटों के पास आगे बढ़ने के लिए एक स्पष्ट दिशा होती है।
00:09:10जब आप किसी नए कोडबेस पर काम शुरू करते हैं, तो एजेंट से वैसे ही सवाल पूछें जैसे आप किसी टीममेट से पूछते।
00:09:16इससे एजेंट सर्च के जरिए कोडबेस को गहराई से समझेगा और आपके सवालों के जवाब देते हुए उसके स्ट्रक्चर को जान लेगा।
00:09:24मैं कोडबेस और रूट्स के बारे में सवाल पूछता हूँ ताकि एजेंट प्रोजेक्ट की कार्यप्रणाली को समझ सके।
00:09:30इससे जब भी मैं कोई नया फीचर देता हूँ, उसे पहले से ही प्रोजेक्ट के ढांचे का पता होता है, जिससे काम आसान हो जाता।
00:09:37Git बहुत जरूरी है क्योंकि यह न केवल वर्जन कंट्रोल है, बल्कि कोडिंग एजेंट के लिए एक नॉलेज बेस का भी काम करता है।
00:09:43हमने पिछले वीडियो में भी Git के महत्व पर जोर दिया है।
00:09:47साफ Git कमिट्स न केवल एजेंट को जानकारी देते हैं, बल्कि फीचर्स को मैनेज करने और गलती होने पर उसे सुधारने में भी मदद करते हैं।
00:09:58Git के काम को आसान बनाने के लिए, मैं Anti-Gravity में कुछ खास कमांड्स का इस्तेमाल करता हूँ जिन्हें वर्कफ़्लो कहा जाता है।
00:10:04कमिटिंग के लिए, मैं एक स्ट्रक्चर्ड फॉर्मेट पसंद करता हूँ, इसलिए मेरा वर्कफ़्लो एजेंट को उसी फॉर्मेट का पालन करने के लिए मजबूर करता है।
00:10:13कमिट करने से पहले, सिक्योरिटी और कोड रिव्यू चेक किए जाते हैं ताकि सब कुछ मेरे स्टैंडर्ड्स के मुताबिक हो।
00:10:20आप पुल रिक्वेस्ट, ब्रांचेस और अन्य कामों के लिए भी ऐसे कमांड्स बना सकते हैं, जिससे पूरा प्रोसेस सिस्टमैटिक हो जाता है।
00:10:28इन वर्कफ़्लो को शुरू करना बहुत आसान है, बस नाम लिखें और सारे स्टेप्स खुद-ब-खुद पूरे हो जाएंगे।
00:10:34आप इश्यू फिक्स करने या रिव्यू करने के लिए भी अन्य कमांड्स का इस्तेमाल कर सकते हैं।
00:10:43यह सुनने में बेसिक लग सकता है, लेकिन AI से बने कोड को रिव्यू की जरूरत हमेशा होती है, वह परफेक्ट नहीं होता।
00:10:48एक जरूरी बात यह है कि जब एजेंट काम कर रहा हो, तो उस पर नजर रखें।
00:10:51अगर आपको लगे कि वह गलत दिशा में जा रहा है, तो उसे तुरंत रोकें और सही रास्ता दिखाएं।
00:10:56काम पूरा होने के बाद, आपको खुद एजेंट की मदद से ही उसका रिव्यू करना चाहिए।
00:11:00मैं अक्सर कोड रिव्यू के लिए एक कस्टम वर्कफ़्लो का इस्तेमाल करता हूँ जो सभी बेस्ट प्रैक्टिसेज को शामिल करता है।
00:11:06यह कमियों को उनकी गंभीरता के हिसाब से दिखाता है और उन सभी चेक लिस्ट को रन करता है जो कोड की क्वालिटी सुनिश्चित करने के लिए जरूरी हैं।
00:11:15इससे कोड भरोसेमंद और हाई क्वालिटी का बनता है।
00:11:18चूंकि ज्यादातर प्रोजेक्ट्स GitHub पर मैनेज होते हैं, हम हर पुल रिक्वेस्ट पर खामियों को पकड़ने के लिए BugBots जैसे AI टूल्स का इस्तेमाल करते हैं।
00:11:28CodeRabbit और Sentry जैसे कई AI-पावर्ड टूल्स हैं जो आपके कोड को रिव्यू करने में मदद कर सकते हैं।
00:11:33यहाँ तक कि GitHub में भी अब टीम वर्कफ़्लो के लिए कोड रिव्यू फीचर्स इन-बिल्ट हैं।
00:11:38आर्किटेक्चर की समस्याओं को पहचानने के लिए, हम एजेंट से Mermaid डायग्राम बनाने को कह सकते हैं।
00:11:43इन डायग्राम्स की मदद से हम बड़ी समस्याओं को आसानी से देख और समझ सकते हैं।
00:11:47ये डायग्राम्स काफी उपयोगी होते हैं क्योंकि विजुअल्स को समझना आसान होता है और ये प्रोजेक्ट के लिए एक अच्छे डॉक्यूमेंटेशन का काम करते हैं।
00:11:54एजेंटों को एक साथ (पैरेलल में) रन करना बहुत जरूरी है क्योंकि इससे न केवल परफॉरमेंस सुधरती है, बल्कि समय की भी काफी बचत होती है।
00:12:05यह तरीका आउटपुट को काफी बेहतर बना सकता है।
00:12:07मैं अक्सर एक साथ कई एजेंटों का इस्तेमाल करता हूँ, हर एक को अलग काम सौंपता हूँ, और अलग-अलग मॉडल्स का इस्तेमाल करता हूँ क्योंकि हर मॉडल अलग काम में माहिर है।
00:12:16एजेंट स्वतंत्र रूप से काम करते हैं और जरूरत पड़ने पर ही आपको सूचित करते हैं।
00:12:22चूंकि Anti-Gravity के एजेंट एक ही वर्कस्पेस शेयर करते हैं, इसलिए मैं उन्हें अलग-अलग ब्रांचेस में काम करने देता हूँ।
00:12:28एक बार जब वे अपना काम पूरा कर लेते हैं और चेक पास हो जाते हैं, तो मैं उनके फीचर्स को मेन ब्रांच में मर्ज कर देता हूँ।
00:12:34अक्सर हमें ऐसे बग्स मिलते हैं जिन्हें फिक्स करना समझ नहीं आता।
00:12:38ऐसे मामलों में 'डीबग मोड' सबसे अच्छा समाधान है।
00:12:40सिर्फ अंदाजा लगाने के बजाय, डीबग मोड समस्या को समझने की कोशिश करता है और कोड में लॉगिंग स्टेटमेंट्स जोड़ता है, जिससे प्रोसेस काफी सिस्टमैटिक हो जाता है।
00:12:50भले ही Anti-Gravity में नेटिव डीबग मोड नहीं है, लेकिन हम एक 'डीबग मोड स्किल' के जरिए इसे लागू कर सकते हैं।
00:12:56इस स्किल में कोड की अनचाही गलतियों को सुलझाने के सारे निर्देश होते हैं।
00:13:00यह सबूतों के आधार पर काम करता है और समस्या को हल करने के लिए एक विस्तृत मल्टी-फेज प्लान देता है।
00:13:08यह खास स्क्रिप्ट्स और रेफरेंस की मदद से डीबगिंग को बहुत ज्यादा भरोसेमंद बना देता है।
00:13:14जब भी मुझे कोई बग मिलता है, मैं बस डीबग मोड का इस्तेमाल करता हूँ और एजेंट उसे खुद सुलझा लेता है, जिससे मेरा काम आसान हो जाता है।
00:13:25इसी के साथ हम इस वीडियो के अंत में पहुँच गए हैं।
00:13:27अगर आप इस चैनल को सपोर्ट करना चाहते हैं, तो आप नीचे दिए गए 'सुपर थैंक्स' बटन का इस्तेमाल कर सकते हैं।
00:13:33हमेशा की तरह, देखने के लिए धन्यवाद और आपसे अगले वीडियो में मुलाकात होगी।