Codex अब लंबे समय तक चलने वाले Agentic Harness के लिए सबसे बेहतर बन गया है

CChase AI
Computing/SoftwareVideo & Computer GamesInternet Technology

Transcript

00:00:00Codex अपने बिल्कुल नए प्रयोगात्मक Goals फीचर के साथ Claude Code को मात दे सकता है
00:00:05Codex अब लंबे समय तक चलने वाले स्वायत्त कोडिंग कार्यों को निष्पादित करने का सबसे आसान तरीका है
00:00:10बिना किसी अतिरिक्त ऑर्केस्ट्रेशन लेयर्स के; Goals एक अधिक
00:00:15परिष्कृत इंटीग्रेटेड Ralph लूप की तरह काम करता है। आप इसे एक उद्देश्य देते हैं और यह
00:00:19उस समस्या को हल करने के लिए बिना आपके हस्तक्षेप के घंटों तक काम कर सकता है
00:00:25और आज मैं आपको दिखाऊंगा कि यह कैसे काम करता है, आप इसे कैसे सेट कर सकते हैं और हम एक असली
00:00:29डेमो देखेंगे ताकि आप इसे एक्शन में देख सकें। तो आज हम Rift Salvage बनाएंगे, हमारा 2D कॉम्बैट वीडियो
00:00:35गेम जो पूरी तरह से मूल संपत्तियों का उपयोग करता है और जिसे हमने पूरी तरह से Goals के माध्यम से बनाया है।
00:00:42Goals फीचर अभी Codex के वास्तविक अंतरों में से एक है और इसका उपयोग करना बेहद सरल है।
00:00:47हम सिर्फ एक सिंगल स्लैश कमांड की बात कर रहे हैं, तो यहाँ काफी कुछ सीखने और पाने को है, इसलिए चाहे
00:00:51आप Codex डेस्कटॉप ऐप का उपयोग कर रहे हों या Codex CLI का, आपको Goals को इनेबल करना होगा क्योंकि यह एक
00:00:56प्रयोगात्मक फीचर है। अब आप Codex को ऐसा करने के लिए कह सकते हैं या आप स्वयं इसे बहुत जल्दी कर सकते हैं।
00:01:01Codex ऐप के अंदर, मैं बस सेटिंग्स में जाऊंगा और फिर मैं कॉन्फ़िगरेशन पर जाऊंगा
00:01:07यहाँ जहाँ लिखा है open config.toml, मैं उस पर क्लिक करूँगा और इसे VS Code में खोलूँगा
00:01:15और यहाँ नीचे आपको दो लाइनें जोड़नी होंगी यदि वे पहले से नहीं हैं: features और फिर goals equal true
00:01:22बस इतना ही। इसमें आपको मुश्किल से दो सेकंड लगने चाहिए। अगर यह बहुत जटिल है, तो आप Codex को बता सकते हैं
00:01:27हे, क्या तुम मेरे लिए goals इनेबल कर सकते हो? तो features goals equals true, बस। अब वास्तव में Goals का उपयोग करने के लिए
00:01:35डेस्कटॉप ऐप और CLI के अंदर, आप बस forward slash goal करेंगे। अब जो भी
00:01:40कारण हो, मुझे लगता है क्योंकि यह नया और प्रयोगात्मक है, जब आप forward slash goal करते हैं तो आपको कोई
00:01:43नोटिफिकेशन नहीं मिलेगा कि यह वास्तव में काम कर रहा है, और आप देखेंगे कि एक बार जब हम इसे उचित प्रॉम्प्ट देते हैं
00:01:48तो हमें वास्तव में एक छोटा बैज मिलेगा जिससे हमें पता चलेगा कि goal काम कर रहा है। तो अगर आप इसे इनेबल करते हैं तो सुनिश्चित करें
00:01:53कि आप इसे करने के बाद Claude Code को रीसेट करें ताकि बदलाव लागू हों। लेकिन जब आप forward slash
00:01:58goal करेंगे, तो आपको कुछ भी वैसा नहीं दिखेगा जैसा आप आम तौर पर देखते हैं जैसे कि आपने कोई skill
00:02:02इस्तेमाल की हो जहाँ आपको उचित फीडबैक मिले। लेकिन यह अच्छा है, पर
00:02:08ऐप के अंदर वास्तव में goal का डेमो देने से पहले, मुझे यह समझाने दें कि यह वास्तव में पर्दे के पीछे कैसे काम कर रहा है
00:02:13लेकिन पहले आज के प्रायोजक की ओर से एक छोटी सी बात: मैं। जैसा कि आप जानते हैं, Chase AI Plus के अंदर मेरे पास
00:02:18Claude Code मास्टरक्लास है लेकिन मैंने अभी-अभी Codex मास्टरक्लास भी जारी की है। तो अब आपके पास दो टूल हैं जो
00:02:24आपको शून्य से AI देव बनने में मदद कर सकते हैं। और यह इसे सीखने के लिए सबसे अच्छी जगह है क्योंकि मैं
00:02:29मानकर चलता हूँ कि आपके पास कोई तकनीकी ज्ञान नहीं है और हम वास्तविक उपयोग के मामलों पर ध्यान केंद्रित करते हैं। तो अगर आप इसे पाना चाहते हैं
00:02:34या यदि आप मेरे मुफ्त वेबिनार को सुनना चाहते हैं जो मैं कुछ दिनों में कर रहा हूँ, तो लिंक
00:02:40पिन किए गए कमेंट में नीचे होगा। वहां आपसे मिलने की उम्मीद है। तो जैसा कि मैंने परिचय में कहा, Codex Goals मूल रूप से
00:02:46एक अधिक परिष्कृत इंटीग्रेटेड Ralph लूप है। अब Ralph लूप क्या है, आप पूछेंगे? खैर हम उन लोगों के लिए
00:02:51एक त्वरित समीक्षा करेंगे जिन्हें याद नहीं है। इसके मूल में, एक Ralph लूप, यदि हम इसे
00:02:57Claude Code जैसी किसी चीज़ में उपयोग कर रहे थे, तो वह कोड की सिर्फ एक पंक्ति है। यह सिर्फ एक Bash लूप है। यह बिल्कुल वही है जो आप
00:03:03यहाँ देख रहे हैं और विचार यह है कि मैं कोड की इस पंक्ति को चलाता हूँ और जो होने वाला है वह यह है कि यह
00:03:09Claude Code या Codex या किसी भी AI सिस्टम को शुरू करेगा और यह एक prompt.md फ़ाइल पर नज़र डालेगा और
00:03:16यह प्रॉम्प्ट कहेगा, हे, यहाँ वह है जो हम करने की कोशिश कर रहे हैं, यहाँ बताया गया है कि मैं इसे कैसे करना चाहता हूँ, वैसे
00:03:21यहाँ वह मानदंड है जो इसे पूर्ण मानेगा। तो इस उदाहरण में हम प्रमाणीकरण फ़ाइलों पर
00:03:28कवरेज बढ़ाना चाहते हैं जिसका मूल रूप से मतलब है कि हमें अधिक परीक्षण बनाने की आवश्यकता है और हम तब रुकेंगे जब कवरेज
00:03:3375 प्रतिशत पर होगी। तो वह अंतिम लक्ष्य है और इसलिए यह जिस तरह से काम करेगा वह यह है कि आप इस लूप को शुरू करेंगे और फिर
00:03:41लूप प्रॉम्प्ट को देखता है, फिर वह उसे AI सेशन में इंजेक्ट करता है। सेशन एक
00:03:48सिंगल टर्न चलाता है। यह प्रॉम्प्ट को पढ़ता है और यह state.md फ़ाइल को भी पढ़ता है। स्टेट फ़ाइल मूल रूप से एक फ़ाइल है जिसे
00:03:56कह रही है कि ठीक है, अगर हमारे पास टास्क एक, दो और तीन हैं, तो हमने अब तक क्या किया है और क्या यह
00:04:03काम कर रहा है? मान लीजिए कि पहले कुछ टर्न में यह टास्क एक पूरा करता है और फिर अगले टर्न में यह
00:04:10स्टेट फ़ाइल पर नज़र डालने वाला है और कहेगा, हे, टास्क दो पूरा नहीं हुआ है, अंदाज़ा लगाइए कि हम इस
00:04:14सेशन में क्या करने जा रहे हैं या हम सेशन दो करेंगे। और फिर शायद यह पहले टर्न में काम नहीं करता है, यह कहता है
00:04:18हे, यहाँ बताया गया है कि मैंने आगे क्या कोशिश की, आदि आदि, जब तक कि यह सभी कार्यों को पूरा नहीं कर लेता। और इसलिए उस एजेंट के
00:04:25अपना टर्न चलाने के बाद, यह फ़ाइल को अपडेट करता है, टर्न समाप्त होता है और लूप जारी रहता है। तो आपको इस तरह का एक
00:04:30निरंतर लूप मिलता है जहाँ यह लगातार कुछ अलग फ़ाइलों की जाँच कर रहा होता है कि हमने क्या किया है
00:04:35हमें क्या करने की ज़रूरत है, अंतिम स्थिति क्या है और अंततः एक बार जब यह पूर्ण होने के मानदंड तक पहुँच जाता है
00:04:41तो यह कहता है हे हम पूरी तरह स्वायत्त रूप से तैयार हैं। यही Ralph लूप्स का विचार है। अब अगर आप चाहते हैं कि Ralph लूप्स
00:04:48और अधिक काम करें, तो इसके लिए अतिरिक्त स्कैफोल्डिंग की आवश्यकता होती है, आप जानते हैं, बिलिंग जैसी चीजें,
00:04:53आप क्या करते हैं, क्या किसी तरह का स्मार्ट टोकन उपयोग है? ज़रूरी नहीं। क्या होता है अगर यह बंद हो जाता है ठीक है?
00:04:58एजेंट क्रैश हो जाता है, आप Control C करते हैं, इसे कैसे पता चलेगा कि यह वास्तव में हो गया है? क्या वास्तव में कोई इन-बिल्ट
00:05:02थर्ड पार्टी है जो सब कुछ सत्यापित करती है? वास्तव में नहीं क्योंकि इसके मूल में फिर से, यह सिर्फ एक सिंगल
00:05:08लाइन का कोड है। अब इसकी तुलना Goals से करें। Goals बड़े पैमाने पर उसी तरह काम करता है: हम इसे कुछ करने के लिए
00:05:15कह रहे हैं, इसके पास इस बात का अंदाज़ा है कि यह इसे कैसे करने जा रहा है और यह आंतरिक फ़ाइलों को लगातार अपडेट कर रहा है कि
00:05:19यहाँ बताया गया है कि मैंने क्या किया है, यहाँ बताया गया है कि हमें अभी भी क्या करने की आवश्यकता है और यह उस अंतिम स्थिति तक पहुँचने की कोशिश कर रहा है। तो बड़ी
00:05:23तस्वीर में यह लगभग समान है। हालाँकि, कुछ अंतर हैं। सबसे पहले हमारे पास ये दो
00:05:29मार्कडाउन फ़ाइलें हैं जो अनिवार्य रूप से आपके लिए अदृश्य हैं। यह continuation और budget limit है। ये
00:05:35दो चीजें क्या कर रही हैं? खैर ये चीजें Codex को एक अलग तरीके से कार्य करने की अनुमति देती हैं यदि आप
00:05:40उपयोग की सीमाओं के करीब पहुँच रहे हैं जो महत्वपूर्ण है। तो वास्तव में एक गरिमापूर्ण
00:05:46अंत है कि आपका सिस्टम Goals लूप बनाम Ralph लूप में किसी कार्य को कैसे संभालेगा। Ralph लूप में
00:05:52जैसे ही आप अपने बजट तक पहुँचते हैं, आपका काम खत्म। Codex में ज़रूरी नहीं। यह एक अच्छा तरीका निकाल लेगा कि आपको
00:05:57ऐसी जगह पर ले आए जिस पर आप बाद में काम कर सकें। और हकीकत में ऐसा तब होता है जब Codex अपने Goals लूप या Ralph लूप में अपना
00:06:03टर्न चलाता है, चाहे आप इसे जिस तरह से भी सोचना चाहें। और जब यह टर्न के अंत
00:06:08में पहुँचता है, तो इसके पास वास्तव में चार रास्ते होते हैं। पहला, अगर इसके पास अभी भी काम बाकी है और बजट ठीक है,
00:06:13तो हे, हम बस आगे बढ़ते रहेंगे। दूसरा, यदि हम अपने टोकन कैप के करीब हैं, तो यह
00:06:19budget limit.md फ़ाइल को इंजेक्ट करेगा और यह अनिवार्य रूप से टर्न को शालीनता से समाप्त करेगा
00:06:25और आपको अंतिम रिपोर्ट देगा कि क्या किया गया है और आगे बढ़ने के लिए आपको क्या करने की आवश्यकता है यदि आप
00:06:29अपनी सीमा अपडेट करते हैं। यदि हमने प्रोजेक्ट पूरा कर लिया है, तो यह एक update goal टूल कॉल करने वाला है।
00:06:34यह आगे बढ़ेगा और अपना स्टेटस बदल देगा। यह सुनिश्चित करेगा कि सभी डिलिवरेबल्स का ऑडिट किया गया है और यदि
00:06:39सब कुछ ठीक रहा, तो हे goal complete हम कर चुके हैं। अंत में, हमारे पास गोल को रोकने,
00:06:45गोल को संपादित करने, क्रैश से निपटने के तरीके हैं। तो ऐसी स्थिति में जब हमारे लूप के दौरान कुछ गलत हो जाता है,
00:06:49तो यह एक पारंपरिक Ralph लूप की तरह नहीं है जहाँ हम बस फँस जाते हैं। तो यह Ralph लूप से थोड़ा
00:06:54अधिक परिष्कृत है, बड़ी तस्वीर में बहुत समान है, और हमें कोई अतिरिक्त
00:06:59ऑर्केस्ट्रेशन नहीं करना पड़ता है। यह पूरी बात आपको बहुत परिचित लगनी चाहिए यदि आपने कभी
00:07:05GSD या GSD Superpowers जैसी किसी चीज़ के साथ काम किया है। ये सभी टूल्स ऑर्केस्ट्रेशन लेयर्स हैं जो Claude Code के ऊपर बैठते हैं
00:07:11अनिवार्य रूप से वह करने के लिए जो हम Codex के अंदर Goals के साथ एक सिंगल स्लैश कमांड के साथ कर रहे हैं। और क्योंकि यह
00:07:18सचमुच सिर्फ एक सिंगल स्लैश कमांड है, यह इसे निष्पादित करना बेहद आसान बनाता है। आपको
00:07:24GSD की सभी जटिलताओं पर 40 मिनट का डेमो देखने की ज़रूरत नहीं है। आप बस forward slash goal करते हैं और Codex आगे बढ़ता है
00:07:30और जीतता है। और इसी को ध्यान में रखते हुए, आइए वास्तव में इसका परीक्षण करें। तो सबसे पहले हम
00:07:35इसे प्लानिंग मोड में डालेंगे क्योंकि हम प्लानिंग मोड से Goals पर बहुत आसानी से जा सकते हैं
00:07:39और हम इससे अपने लिए मूल रूप से एक टॉप-डाउन आर्केड सर्वाइवल गेम बनवाएंगे। और हम
00:07:44इससे इसकी अपनी सभी संपत्तियां बनवाएंगे। Claude Code के मुकाबले Codex की अच्छी बात यह है कि
00:07:49क्योंकि यह एक OpenAI उत्पाद है, हमारे पास GPT इमेजेस 2 तक भी पहुँच है। तो यह इस गेम के लिए अपनी सभी
00:07:56संपत्तियां खुद बनाने जा रहा है। मुझे तुम्हारा ड्रोन स्प्राइट चाहिए, मुझे तीन दुश्मन चाहिए, मुझे एक बॉस क्रिएचर चाहिए, एनर्जी कोर,
00:08:01हैज़र्ड माइन, बैकग्राउंड, UI के लिए बैज, फ्लेवर एसेट्स। तो मैं इससे काफी कुछ बनवाने वाला हूँ।
00:08:07ठीक है, तो प्रॉम्प्ट काफी परिष्कृत है क्योंकि यह लंबे, लंबे समय तक चल सकता है। जैसे मुझे आपको पहले ही स्क्रीनशॉट
00:08:15दिखा देना चाहिए था, वह बंदा जो कह रहा था 'मैं इसे सीधे 50 घंटों तक चला रहा हूँ'। मेरा मतलब है, कौन जानता है कि क्या 50 घंटे
00:08:18लगातार चलाना वास्तव में इसे करने का सबसे अच्छा तरीका है, लेकिन विचार यह है कि हमारे पास एक धुंधला विचार है, हम प्लान मोड में जाते हैं,
00:08:23हमें कुछ बहुत ही सटीक मिलता है। और बहुत महत्वपूर्ण बात यह है कि इस तरह की चीज़ के साथ,
00:08:31आपको अंतिम परिणाम के बारे में बहुत विशिष्ट होने की आवश्यकता है। क्योंकि यदि हमारे पास बहुत विशिष्ट
00:08:36अंतिम परिणाम नहीं है, हम चीज़ों के एक बहुत ही मापने योग्य सेट के लिए कोशिश नहीं कर रहे हैं जिसे इसे पूरा करना ही होगा
00:08:43ताकि यह लूप पूरा हो सके, तो आपको ऐसा परिणाम मिलने वाला है जो औसत दर्जे का है। यह शायद
00:08:50अधूरा हो। इसलिए मैं दृढ़ता से सुझाव देता हूँ कि आप प्लान मोड से गुजरें और वास्तव में योजना को विस्तार से
00:08:55तैयार करने के लिए समय निकालें, न कि सिर्फ यह कहें कि 'slash goal मेरे लिए एक SaaS उत्पाद बनाओ जो एक अरब डॉलर कमाए'। तो यह है
00:09:02हमारे गेम का प्लान। और जब वेरिफिकेशन की बात आती है, तो यह वही चीज़ है जिसे यह
00:09:07देखने जा रहा है। यही वह वास्तव में टेस्ट करने वाला है इससे पहले कि वह कहे कि यह पूरा हो गया है। ज़ाहिर है कि इसे
00:09:12npm run build चलाना होगा और सभी त्रुटियों को ठीक करना होगा, देव सर्वर शुरू करना होगा और स्थानीय URL प्रदान करना होगा,
00:09:17एक स्वचालित Playwright वेरिफिकेशन स्क्रिप्ट जोड़ें और चलाएं जो ऐप खोलती है और पुष्टि करती है कि सब कुछ लोड हो रहा है,
00:09:24जाँचती है कि कैनवास खाली नहीं है, कीबोर्ड की गतिविधियों को सिम्युलेट करती है, कलेक्टिबल इवेंट्स को सिम्युलेट करती है, डैमेज को फोर्स करती है,
00:09:29हेल्थ परिवर्तनों की पुष्टि करती है, बॉस विन स्टेट, UI चालू, और भी बहुत कुछ। तो यह वही है जिसे आप वास्तव में
00:09:34देखना चाहते हैं। आप जानते हैं, अगर आप वेरिफिकेशन को देखते हैं और कहते हैं कि 'हे, अगर वह सब
00:09:39पूरा हो जाता है, तो मैं खुश रहूँगा', तो आप आगे बढ़ने के लिए तैयार हैं। अब जब यह कहता है कि योजना को लागू करें,
00:09:44तो आप जाना चाहेंगे... नहीं, मैं आपको बताऊंगा कि क्या करना है। आप forward slash goal कर सकते हैं,
00:09:49इस योजना को लागू करने के लिए goal का उपयोग करें, और हम सबमिट करने जा रहे हैं। और यहाँ ऊपर आप क्या देखते हैं? आपके पास यह
00:09:54छोटा बैज है जो कहता है goal। तो अब मुझे पता है कि हम goal कर रहे हैं और यह यहाँ भी लिखा है।
00:10:02तो जैसा कि मैंने आपको पहले बताया था, जब आप forward slash goal करते हैं तो आपको कोई कमांड नहीं मिलेगी लेकिन यह
00:10:09काम कर रहा है। मुझे लगता है कि यह प्रयोगात्मक फीचर होने के कारण सिर्फ एक UI बग है। तो यह कहता है कि यह
00:10:12अभी भी प्लान मोड में है। तो हम उस गोल को कैंसिल करेंगे। इस योजना को लागू करने के लिए goal का उपयोग करें।
00:10:17अभी भी थोड़ा अपरिष्कृत है, लेकिन देखते हैं कि यह वास्तव में हमारे लिए क्या करता है। विचार यह है कि अब मैं पूरी तरह से हैंड्स-ऑफ हूँ।
00:10:28आप जानते हैं, यह अपना छोटा Ralph लूप चलाएगा, अपना छोटा goal काम करेगा, और अंत में हमारे
00:10:34पास एक अंतिम उत्पाद होगा। तो यह लगभग 12 मिनट से काम कर रहा है और आप देख सकते हैं कि यह
00:10:39पहले से ही इमेज जेन 2 मॉडल का उपयोग करके सभी अलग-अलग संपत्तियां बनाने की प्रक्रिया में है
00:10:43जो काफी बढ़िया है। और फिर से, दूसरी अच्छी बात यह है कि जब आप डेस्कटॉप ऐप का उपयोग कर रहे होते हैं बनाम
00:10:49सिर्फ कच्चे टर्मिनल में काम करने के, यह सब आपको इन-लाइन दिखाया जाता है जो कि अच्छा है।
00:10:54मैं निजी तौर पर Codex डेस्कटॉप ऐप से बहुत प्रभावित हुआ हूँ। यह कहने के लिए नहीं कि मैं अभी भी Claude
00:11:00Code को पसंद नहीं करता, मुझे लगता है कि मैं इन दोनों टूल्स का परस्पर उपयोग करता हूँ। आप मेरा पिछला वीडियो देख सकते हैं
00:11:06उस पर मेरी पूरी राय के लिए जहाँ मुझे लगता है कि यह विचार कि हमें इन दो उपकरणों के बीच चयन करने की आवश्यकता है, थोड़ा बेवकूफी भरा है।
00:11:11जैसे हम दोनों का उपयोग क्यों नहीं कर रहे हैं और अक्सर दोनों का एक साथ? लेकिन Claude Code के साथ मैं
00:11:15पूरी तरह से टर्मिनल प्रेमी हूँ लेकिन Codex के साथ मैंने वास्तव में डेस्कटॉप ऐप का आनंद लिया है, और उसका एक हिस्सा
00:11:20सिर्फ यह भी हो सकता है कि हमेशा टर्मिनल में रहने के बजाय कभी-कभी यह एक
00:11:26अच्छा बदलाव है। तो अब तक मुझे यह वाकई पसंद आया है। तो लगभग 30 मिनट के बाद, इसने कहा कि यह पूरा हो गया है और वास्तव में इसने
00:11:32जितनी मैंने उम्मीद की थी उससे कहीं तेज़ी से इसे खत्म कर दिया। तो आइए देखते हैं कि इसने पहले प्रयास में कैसा किया और क्योंकि
00:11:38इसने इसे इतनी जल्दी किया, मैं शायद अंत में इसे कुछ और करने के लिए कहूँगा। तो यह कहता है कि इसने
00:11:44Rift Salvage लागू किया है, स्थानीय देव सर्वर यहाँ चल रहा है। यह कीबोर्ड टच कंट्रोल, दुश्मन स्पॉनिंग,
00:11:49माइन, स्कोरिंग, शील्ड पावर अप्स, बॉस फेज, विन-लूज़, पॉज़ और रीस्टार्ट के साथ एक कैनवास गेम है। अल्फा कटआउट के साथ 11 इमेज जेन
00:11:56बिटमैप एसेट्स, ऑटोमेटेड Playwright वेरिफ़ायर और फिर यह हमें वह सब कुछ दिखाता है जो उसने बनाया है।
00:12:03जो काफी कूल है। तो चलिए देखते हैं कि क्या यह काम करता है और इसे थोड़ा और आगे बढ़ाने के लिए हम क्या जोड़ सकते हैं।
00:12:10आइए वास्तव में इसे असली ब्राउज़र में करें। ठीक है, तो यहाँ एक लोडिंग स्क्रीन है
00:12:17और कॉन्ट्रास्ट थोड़ा कम है, देखना थोड़ा मुश्किल है, शायद आपके लिए इसे देखना मुश्किल हो, लेकिन
00:12:27मेरे पास मेरा छोटा स्पेसशिप है। तो वह एक माइन है, मुझे लगता है कि मुझे इन चीजों को पकड़ना है
00:12:32जबकि यह उन दुश्मनों को स्पॉन करता है जो मेरा पीछा करते हैं। तो आप जानते हैं, यह काम करता है, यह काफी अच्छा लग रहा है। मुझे लगता है कि हम
00:12:39शायद इसके ग्राफिक्स पर थोड़ा काम कर सकते हैं लेकिन यह बहुत बढ़िया है कि यहाँ सब कुछ बनाया गया है
00:12:49यूनिक इमेजेस के रूप में। मुझे लगता है कि हम जो कर सकते हैं वह यह है कि हम... पहले तो मैं यह देखना चाहता हूँ कि
00:12:56बॉस की लड़ाई कैसी दिखती है, क्या हम उसे थोड़ा तेज़ कर सकते हैं और किसी तरह का
00:13:00शूटिंग सिस्टम भी जोड़ सकते हैं, या तो लेज़र के साथ या ऐसा ही कुछ कूल। तो चलिए वास्तव में
00:13:04वही करते हैं, इससे पहले कि हम यहाँ और देर बैठें, आइए इसे ऐसा करने के लिए कहें। तो मैं इसे प्ले मोड में डालूँगा
00:13:11और देखूँगा कि क्या हम इसे थोड़ा और मेहनत करवा सकते हैं। ठीक है, तो मुझे लगता है कि वह पहला प्रयास काफी अच्छा था,
00:13:15सब कुछ काम कर रहा है लेकिन मैं इसे थोड़ा और जटिल बनाना चाहूँगा। क्या हम किसी तरह का
00:13:19कॉम्बैट सिस्टम जोड़ सकते हैं, चाहे वह अलग-अलग दुश्मनों पर लेज़र से शूटिंग करना हो और वे
00:13:24वापस हम पर हमला करें? क्या बॉस का फेज थोड़ा जल्दी आ सकता है या उसमें किसी तरह का
00:13:31बटन शामिल हो सकता है जिसे मैं दबा सकूँ ताकि बॉस का फेज शुरू हो जाए? क्या हम कॉन्ट्रास्ट को भी थोड़ा बदल
00:13:37सकते हैं? क्योंकि अभी सब कुछ बैकग्राउंड में घुल मिल जाता है और अगर आपके पास इसे थोड़ा और जटिल
00:13:42बनाने और खुद को अपनी सीमाओं तक धकेलने के लिए कोई अन्य विचार हैं,
00:13:49तो मुझे वे विचार देखने दें। तो यह वह प्लान है जो इसके साथ आया है। अब एक चीज़ जो आप जानना चाहते हैं जब आप
00:13:53Goals सिस्टम का उपयोग कर रहे हैं, वह यह है कि प्रत्येक goal रन उस थ्रेड या सेशन से जुड़ा होता है जिसका आप उस
00:13:58समय उपयोग कर रहे हैं। हम एक ही चैट में रहे हैं जिसका अर्थ है कि हम एक ही goal थ्रेड में हैं। यदि मैं फिर से
00:14:07goals करना चाहता हूँ, मैं उसी प्रोजेक्ट पर दूसरा goals रन करना चाहता हूँ, तो हम ऐसा कर सकते हैं लेकिन हमें इसे
00:14:12दूसरे थ्रेड या दूसरी चैट में करना होगा, जैसे कोई दूसरा टर्मिनल खोलना। तो मैं बस इस
00:14:18प्लान को कॉपी करने जा रहा हूँ, मैं एक और चैट खोलूँगा और हम slash goal करेंगे और हम
00:14:24इसे वहां पेस्ट कर देंगे। तो 15 मिनट के बाद हमने दूसरा goal पास पूरा कर लिया। तो इसने कॉम्बैट
00:14:33अपग्रेड लागू कर दिया, तो देखते हैं कि यह गेम अब कैसा दिखता है। तो यहाँ फिर से लोडिंग स्क्रीन है, जो पहली बार देखी गई स्क्रीन
00:14:40के बहुत समान है सिवाय इसके कि इसने यहाँ ऊपर कुछ विजेट्स जोड़ दिए हैं। तो अब हमारे पास टारगेट
00:14:44कॉम्बो के साथ-साथ बॉस सिग्नल भी है। अब अगर हम इसे तुरंत लॉन्च करते हैं, तो मैं अपनी गन
00:14:50चला पा रहा हूँ, दुश्मन वापस गोली चलाने में सक्षम हैं और उनके पास हिट पॉइंट हैं। मैं
00:14:56बॉस सिग्नल भी दबा सकता हूँ। तो वह रहा बॉस... काफी शानदार लग रहा है सच में। मुझे लगता है कि इस
00:15:01गेम के बारे में और जो इसने किया, उसके बारे में सबसे अच्छी बात सिर्फ सभी अनूठी संपत्तियां थीं, है न? यह तथ्य कि सब कुछ एक
00:15:09ओरिजिनल एसेट है और इसने यह सब इमेज जेन 2 का उपयोग करके किया जो मुझे लगा कि काफी
00:15:13बढ़िया था। और मैं जानता हूँ कि ज़ाहिर तौर पर इसमें दोनों रनों के बीच केवल 45 मिनट लगे और हमने
00:15:19कुछ लोगों को उनके स्क्रीनशॉट से तीन दिनों तक रन करते देखा है, लेकिन मुझे लगता है कि इसका
00:15:24सबसे अच्छा हिस्सा यह है कि उन लक्ष्यों को निष्पादित करना कितना सरल है और आप जानते हैं, आप बस इसे एक लक्ष्य देते हैं
00:15:30और यह पूरी तरह जुट जाएगा, यह मानते हुए कि आपके पास कुछ स्पष्टता है। क्या हम जीते? मुझे नहीं पता कि हम
00:15:36मरे या नहीं, लेकिन जैसा कि मैं कह रहा था, इस बारे में और सामान्य रूप से goals के बारे में अच्छी बात यह विचार है कि
00:15:43यदि आपके पास एक स्पष्ट मार्गदर्शक लक्ष्य है और आपके पास सफलता के स्पष्ट मानदंड हैं,
00:15:48तो आप इससे बहुत कुछ हासिल कर सकते हैं और यह हमेशा के लिए चल सकता है। तो अपना खुद का
00:15:54Ralph लूप और अपनी खुद की स्कैफोल्डिंग सेट करने या ऑर्केस्ट्रेशन लेयर के रूप में बाहर किसी चीज़
00:15:59जैसे GSD या Superpowers का उपयोग करने के बजाय, यह आपके लिए इन-बिल्ट है। और जैसा कि हमने यहाँ किया है,
00:16:05आप बहुत सी अच्छी चीज़ें जोड़ सकते हैं जिन्हें लागू करना कठिन है लेकिन आप Claude Code के अंदर कर सकते हैं जैसे
00:16:10अगर हम इसके लिए Claude Code का उपयोग करते तो हम निश्चित रूप से यह कर सकते थे। हमें बस
00:16:15उस इमेज जनरेशन को हमारे लिए करने के लिए Higgsfield CLI या Higgsfield MCP जैसा कुछ लागू करना पड़ता
00:16:18बजाय इसके कि यह एक एकीकृत समग्र प्रणाली हो। तो मुझे आशा है कि आप
00:16:24इस वीडियो से कुछ प्राप्त करने में सक्षम थे और मैं आपको Codex देखने का दृढ़ता से सुझाव देता हूँ। मुझे वास्तव में
00:16:31डेस्कटॉप ऐप बहुत पसंद आया है जैसा कि मैं पहले बात कर रहा था। मुझे लगता है कि यह चीज़ वास्तव में बहुत बढ़िया है और फिर से
00:16:35हम इसे Claude Code के साथ मिलकर भी कर सकते थे। हम Claude Code में प्लान बनवा सकते थे
00:16:40और फिर उसे goals के लिए Codex में डाल सकते थे। Claude Code से उस काम को देखवा सकते थे जो उसने किया
00:16:44और इस तरह आगे-पीछे कर सकते थे जो मुझे लगता है कि आपको सबसे अधिक वैल्यू देता है। यह वैसा ही है
00:16:49जैसे आप जानते हैं, पूरी चीज़ अपने हिस्सों के योग से बड़ी होती है। तो हमेशा की तरह,
00:16:53मुझे बताएं कि आपने क्या सोचा। Chase AI Plus को ज़रूर देखें, उसका लिंक नीचे
00:17:02पिन किए गए कमेंट में है। कुछ ही दिनों में एक वेबिनार भी कर रहा हूँ, उसका लिंक भी वहीं होगा। तो वहां आपसे मिलने की उम्मीद है।
00:17:07और उसके अलावा, मैं आपसे फिर मिलूँगा।
00:17:12विस्तार में देखने के लिए धन्यवाद।

Key Takeaway

Codex का नया 'Goals' फीचर Ralph लूप आर्किटेक्चर और GPT Images 2 एकीकरण का उपयोग करके बिना किसी बाहरी ऑर्केस्ट्रेशन के पूरी तरह स्वायत्त कोडिंग और एसेट जनरेशन को सक्षम बनाता है।

Highlights

  • Codex Goals एक प्रयोगात्मक फीचर है जिसे config.toml फ़ाइल में features.goals = true जोड़कर सक्रिय किया जा सकता है।

  • यह सिस्टम Ralph लूप का एक उन्नत संस्करण है जो टोकन सीमा तक पहुँचने पर budget_limit.md फ़ाइल के माध्यम से कार्य को शालीनता से समाप्त करता है।

  • Codex में GPT Images 2 का सीधा एकीकरण है जो विकास के दौरान स्प्राइट्स, बैकग्राउंड और UI संपत्तियों को स्वचालित रूप से उत्पन्न करता है।

  • एक सिंगल /goal कमांड का उपयोग करके बिना किसी मानवीय हस्तक्षेप के घंटों तक चलने वाले स्वायत्त कोडिंग कार्यों को निष्पादित किया जा सकता है।

  • प्रायोगिक परीक्षण में Codex ने 45 मिनट के भीतर एक पूरी तरह कार्यात्मक 2D आर्केड गेम और उसका कॉम्बैट सिस्टम तैयार किया।

Timeline

Codex Goals और कॉन्फ़िगरेशन सेटअप

  • Goals फीचर बिना किसी अतिरिक्त ऑर्केस्ट्रेशन लेयर के घंटों तक चलने वाले कार्यों को स्वायत्तता से पूरा करता है।
  • सक्रिय करने के लिए config.toml फ़ाइल में 'features' के नीचे 'goals = true' लिखना आवश्यक है।

Codex Goals एक एकीकृत Ralph लूप के रूप में कार्य करता है जहाँ उपयोगकर्ता केवल एक उद्देश्य निर्धारित करता है और एआई हस्तक्षेप के बिना समाधान की दिशा में काम करता है। इसे Codex डेस्कटॉप ऐप या CLI दोनों में कॉन्फ़िगरेशन फ़ाइल को संपादित करके या एआई को सीधे कमांड देकर सक्रिय किया जा सकता है।

Ralph लूप बनाम Codex Goals की कार्यप्रणाली

  • पारंपरिक Ralph लूप एक Bash लूप है जो निरंतर prompt.md और state.md फ़ाइलों की जाँच और अपडेट करता है।
  • Codex Goals में अदृश्य 'continuation' और 'budget limit' फ़ाइलें होती हैं जो बजट समाप्त होने पर कार्य को सुरक्षित रूप से रोकती हैं।

Ralph लूप कार्य पूरा होने तक एआई सेशन को बार-बार चलाता है लेकिन इसमें बजट प्रबंधन और क्रैश रिकवरी की कमी होती है। इसके विपरीत Codex Goals एक परिष्कृत प्रक्रिया का पालन करता है जिसमें टोकन सीमा के करीब पहुँचने पर रिपोर्ट तैयार करना और प्रोजेक्ट ऑडिट के बाद ही स्टेटस बदलना शामिल है। यह GSD जैसे बाहरी ऑर्केस्ट्रेशन टूल्स की आवश्यकता को समाप्त कर देता है।

Rift Salvage गेम का निर्माण और एसेट जनरेशन

  • Codex अपनी इमेज जनरेशन क्षमताओं का उपयोग करके गेम के लिए ड्रोन स्प्राइट्स, दुश्मन और UI एसेट्स खुद बनाता है।
  • सफलता के लिए विशिष्ट मापन योग्य मानदंड और सत्यापन स्क्रिप्ट (Playwright) प्रदान करना अनिवार्य है।

डेमो के दौरान Codex ने 30 मिनट के भीतर एक सर्वाइवल गेम विकसित किया। इसमें GPT Images 2 मॉडल का उपयोग करके बैकग्राउंड और विभिन्न पात्रों की छवियां बनाई गईं। विकास प्रक्रिया में त्रुटि सुधार के लिए स्वचालित 'npm run build' और प्लेराइट स्क्रिप्ट का उपयोग किया गया ताकि यह सुनिश्चित हो सके कि कैनवास खाली नहीं है और नियंत्रण काम कर रहे हैं।

कॉम्बैट सिस्टम अपग्रेड और अंतिम परिणाम

  • प्रत्येक नया गोल रन एक अलग थ्रेड या चैट सेशन से जुड़ा होना चाहिए ताकि संदर्भ स्पष्ट रहे।
  • दूसरे 15 मिनट के रन में शूटिंग सिस्टम, बॉस सिग्नल और बेहतर कंट्रास्ट जैसे जटिल फीचर्स जोड़े गए।

गेम के दूसरे संस्करण में लेज़र शूटिंग और हिट पॉइंट्स के साथ एक सक्रिय कॉम्बैट सिस्टम जोड़ा गया। Codex ने स्वतंत्र रूप से बॉस फेज को सक्रिय करने के लिए विजेट्स और बटन भी बनाए। पूरी प्रक्रिया यह दर्शाती है कि स्पष्ट मार्गदर्शन और सफलता के मानदंडों के साथ Codex और Claude Code जैसे उपकरणों का एक साथ उपयोग अधिकतम मूल्य प्रदान करता है।

Community Posts

View all posts