भविष्य के लिए कोडिंग पैनल

हिन्दीالعربية Deutsch English Español Français Bahasa Indonesia 日本語 한국어 Português Русский 中文

Computing/SoftwareManagementInternet Technology

Transcript

00:00:00(उत्साहवर्धक संगीत) - एआई कोडिंग पैनल में आपका स्वागत है।

00:00:04उस मेमो को पढ़ने के लिए धन्यवाद कि आपको सभी काले कपड़े पहनने हैं।

00:00:07(हँसी) ठीक है, तो मैं कुछ परिचय देना चाहता हूँ।

00:00:12मैं आप सभी को अलग-अलग तरीकों से जानता हूँ,

00:00:15लेकिन शायद दर्शक नहीं।

00:00:17मतन, आप पहले क्यों नहीं बताते?

00:00:19एआई कोडिंग की दुनिया में फैक्टरी की स्थिति क्या है?

00:00:26- हाँ,

00:00:26तो फैक्टरी में हमारा मिशन सॉफ्टवेयर इंजीनियरिंग में स्वायत्तता लाना है।

00:00:32और इसका मतलब अधिक ठोस रूप से,

00:00:34हमने ड्रॉइड्स नामक एंड-टू-एंड सॉफ्टवेयर विकास एजेंट बनाए हैं।

00:00:38ये केवल कोडिंग पर ही ध्यान नहीं देते,

00:00:40बल्कि पूरे सॉफ्टवेयर विकास चक्र पर ध्यान देते हैं।

00:00:43जैसे दस्तावेज़,

00:00:45परीक्षण,

00:00:46समीक्षा - सभी कठिन काम ताकि आप कोडिंग जैसे मजेदार काम कर सकें।

00:00:52और जो कोडिंग के काम आप नहीं करना चाहते,

00:00:54उन्हें भी ड्रॉइड्स कर सकते हैं।

00:00:56तो आप ड्रॉइड्स बनाते हैं।

00:00:58आप ड्रॉइड्स बनाते हैं।

00:00:59और ओपनएआई को ज्यादा परिचय की जरूरत नहीं है,

00:01:02लेकिन कोडेक्स टीम पर आपकी भूमिका - मैंने आपको कोडेक्स वीडियो में देखा।

00:01:08इसी से मुझे पता चल गया कि आप इस पर काम कर रहे हैं।

00:01:10लेकिन आजकल कोडेक्स के बारे में आप कैसे सोचते हैं क्योंकि यह काफी विस्तृत हो गया है?

00:01:14- हाँ,

00:01:15तो इस साल की शुरुआत में हमने अपना पहला कोडिंग एजेंट लॉन्च किया।

00:01:19मैंने कोडेक्स सीएलआई पर काम किया,

00:01:22अपने तर्क मॉडल की शक्ति लोगों के कंप्यूटर तक लाया।

00:01:26फिर हमने कोडेक्स क्लाउड रिलीज़ किया जहाँ आप उन कार्यों को क्लाउड में वितरित कर सकते थे।

00:01:31और पिछले कुछ महीनों में हम इन अनुभवों को एकीकृत कर रहे हैं।

00:01:34ताकि वे जितना संभव हो सके निरंतर काम करें।

00:01:36तो हमारा अधिकांश ध्यान इस बात पर है कि हम मूलभूत चीजें कितनी उपयोगी बना सकते हैं।

00:01:41हमने अभी-अभी डेव डे कोडेक्स एसडीके रिलीज़ किया है।

00:01:43तो मुझे लगता है कि मुख्य दिशाओं में से एक यह है कि कोडिंग एजेंटों का उपयोग केवल कोडिंग के लिए नहीं,

00:01:50बल्कि सामान्य कार्यों के लिए भी हो।

00:01:52और इसलिए चाहे वह ट्राई टू बी एजेंट हो,

00:01:54जिस पर मैंने इस साल की शुरुआत में काम किया था जो कार्यों को पूरा करने के लिए पृष्ठभूमि में कोड निष्पादित करता है,

00:02:00लेकिन हमारे डेवलपर्स को केवल तर्क मॉडल के शीर्ष पर नहीं,

00:02:03बल्कि सैंडबॉक्सिंग जैसी अन्य चीजों पर भी निर्माण करने के लिए सक्षम बनाना शुरू कर रहे हैं।

00:02:07- शानदार।

00:02:09वीजेरो?

00:02:10- हाँ,

00:02:10वीजेरो का लक्ष्य डेवलपर्स को प्रिव्यू-संचालित एजेंटिक प्रोग्रामिंग करने के लिए सक्षम करना है।

00:02:16तो आजकल जब आप वेब ऐप्स बनाते हैं,

00:02:18तो शायद आपके पास एक एजेंट खुला होता है,

00:02:21आईडीई खुला होता है,

00:02:22कोड,

00:02:22और फिर जो आप बना रहे हैं उसका प्रिव्यू।

00:02:25आमतौर पर आप डेव सर्वर चला रहे होते हैं।

00:02:26वीजेरो के साथ,

00:02:27हमारा लक्ष्य यह है कि आप सिर्फ एक एजेंट चला सकें और सीधे अपने चलते हुए ऐप के खिलाफ प्रॉम्प्ट कर सकें।

00:02:32और यही है कि हम भविष्य का डेवलपर अनुभव कैसे होगा सोचते हैं।

00:02:35- ठीक है, शानदार।

00:02:36और सभी के पास अपने कोडिंग एजेंट्स तक पहुँचने के विभिन्न तरीके हैं।

00:02:40तो मुझे लगता है कि हमें जो चीजें शुरू करनी चाहिए उनमें से एक यह है कि स्थानीय बनाम क्लाउड कितना महत्वपूर्ण है?

00:02:45आप स्थानीय से क्लाउड शुरू करते हैं,

00:02:47आप क्लाउड से स्थानीय शुरू करते हैं,

00:02:48आप अभी के लिए केवल क्लाउड हैं।

00:02:50विभाजन क्या है?

00:02:52क्या सब कुछ अंततः एक साथ मिल जाएगा?

00:02:55- हाँ, तो शायद मैं वहाँ से शुरू कर सकता हूँ।

00:02:58तो मुझे लगता है कि दिन के अंत में,

00:03:00इन एजेंटों का मतलब यह है कि वे जितना संभव हो सके सहायक हों और उनका आकार एक इंसान जैसा हो जिसके साथ आप काम करते हैं।

00:03:08और आपके पास स्थानीय मनुष्य और दूरस्थ मनुष्य नहीं हैं जो किसी तरह इस तरह हों कि यह केवल इस वातावरण में काम करता है,

00:03:14वह केवल उस वातावरण में काम करता है।

00:03:16सामान्यतः,

00:03:16मनुष्य सहायक हो सकते हैं चाहे आप उनके साथ मीटिंग में हों और कोई विचार आए या आप कंप्यूटर पर एक-दूसरे के साथ बैठे हों।

00:03:24तो मुझे लगता है कि इन्हें अंतिम रूप से एक जैसा होना चाहिए,

00:03:29लेकिन मुझे लगता है कि अल्पावधि में,

00:03:31दूरस्थ आमतौर पर अधिक उपयोगी है छोटे कार्यों के लिए जिन्हें आप विश्वास के साथ सौंप सकते हैं।

00:03:39जबकि स्थानीय तब है जब आप एजेंट के करीब होना चाहते हैं,

00:03:43यह शायद कोई बड़ा कार्य या कोई जटिल कार्य है जिसे आप सक्रिय रूप से निगरानी करना चाहते हैं।

00:03:49और आप इसे स्थानीय रखना चाहते हैं ताकि अगर कुछ गलत हो,

00:03:51तो आपको उस शाखा को वापस खींचने की आवश्यकता न हो और फिर उस पर काम करना शुरू करें,

00:03:55लेकिन इसके बजाय आप सही वहाँ मार्गदर्शन देने के लिए हों।

00:03:57- हाँ, शायद मैं थोड़ा लालची हूँ, लेकिन मैं दोनों चाहता हूँ।

00:04:00और मुझे लगता है कि एक विकल्प होने से,

00:04:03मतन के बिंदु की ओर,

00:04:04मैं यह सोचना पसंद करता हूँ कि सहयोग के मुख्य रूप क्या हैं जो मैं अपने सहकर्मियों के साथ अभ्यस्त हूँ और उपभोग करता हूँ।

00:04:11अक्सर यह व्हाइटबोर्डिंग सेशन जैसी किसी चीज़ से शुरू होता है और शायद हम कमरे में कुछ पर ध्यान दे रहे हैं।

00:04:17जब हम बना रहे थे,

00:04:18मुझे लगता है कि एक अच्छा उदाहरण agents.md था,

00:04:21जो विभिन्न कोडिंग एजेंटों में सामान्य होने के लिए हमारी कस्टम निर्देश है।

00:04:26जिस तरह से यह शुरू हुआ वह रोमेन और मैं केवल एक कमरे में इस विचार पर आ रहे थे।

00:04:31फिर हमने बस व्हाइटबोर्ड करना शुरू किया और फिर एक तस्वीर ली और फिर इसे कोडेक्स सीएलआई में स्थानीय रूप से शुरू किया,

00:04:37बस Next.js ऐप पर एक कार्यशाला की तरह जिस पर हम काम कर सकते थे,

00:04:40दोपहर का खाना खाया,

00:04:41वापस आया।

00:04:41इसमें मुख्य संरचना की एक अच्छी मात्रा थी।

00:04:44और फिर वहाँ से, हम थोड़ा और करीब से पुनरावृत्ति कर सके।

00:04:46तो उस तरह की पेयरिंग और ब्रेनस्टॉर्मिंग शैली का अनुभव होना।

00:04:49और फिर मुझे लगता है कि उस दूसरे बिंदु पर कि आप किस तरह के कार्यों को सौंपते हैं,

00:04:54मुझे लगता है कि ऐतिहासिक रूप से छोटे,

00:04:56स्पष्ट रूप से सीमित कार्य जहाँ आप बहुत स्पष्ट हैं कि आउटपुट क्या है,

00:05:00सही विकल्प है अगर आप फायर और भूल रहे हैं।

00:05:02लेकिन मुझे लगता है कि हम जो देख रहे हैं वह यह है कि हमने लगभग दो महीने पहले जीबीडी5 कोडेक्स लॉन्च किया है।

00:05:08और मुझे लगता है कि मुख्य अंतर यह है कि यह वास्तव में ये लंबे समय तक चलने वाले,

00:05:11अधिक जटिल,

00:05:12अधिक अस्पष्ट कार्य कर सकता है,

00:05:13जब तक आप स्पष्ट हैं कि आप अंत तक क्या चाहते हैं।

00:05:16तो यह घंटों तक काम कर सकता है।

00:05:18मुझे लगता है कि जैसे-जैसे मॉडल की क्षमता बढ़ेगी यह बदलाव अधिक उपयोग के मामलों को सक्षम करेगा।

00:05:24- हाँ।

00:05:24हाँ, मुझे लगता है कि एजेंट को काम करने के लिए तीन भाग हैं।

00:05:27वास्तविक एजेंट लूप,

00:05:28उपकरण कॉल जो यह करता है,

00:05:30और फिर संसाधन जिस पर उपकरण कॉल को कार्य करना चाहिए।

00:05:34चाहे आप क्लाउड या स्थानीय को पहले चुनें यह इस बात पर आधारित है कि वे संसाधन कहाँ हैं,

00:05:37है ना?

00:05:37अगर आप किसी स्थानीय फ़ाइल सिस्टम पर काम करने की कोशिश कर रहे हैं,

00:05:39तो वे संसाधन हैं जिन्हें आपको एक्सेस करना चाहिए।

00:05:41यह बिल्कुल समझदारी है कि आपका एजेंट लूप स्थानीय रूप से चलना चाहिए,

00:05:44है ना?

00:05:44अगर आप ऐसे संसाधनों को एक्सेस कर रहे हैं जो आमतौर पर क्लाउड में मौजूद हैं आप गिटहब से सीधे किसी तीसरे पक्ष के रिपो से खींच रहे हैं,

00:05:51तो आपके एजेंट को क्लाउड में शुरू करना समझदारी है,

00:05:53है ना?

00:05:54अंततः हालांकि, ये संसाधन दोनों जगह मौजूद हैं, है ना?

00:05:57हर डेवलपर अपेक्षा करता है कि एजेंट स्थानीय फ़ाइल सिस्टम पर और साथ ही गिटहब पर होस्ट किए गए एक खुले पीआर पर काम कर सकता है।

00:06:04और इसलिए यह वास्तव में महत्वपूर्ण नहीं है कि आप कहाँ से शुरू करते हैं,

00:06:08मुझे लगता है कि सभी एक ही जगह पर आ रहे हैं,

00:06:10यानी आपका एजेंट लूप कहीं भी चल सकता है,

00:06:12आपके उपकरण कॉल क्लाउड से स्थानीय या स्थानीय बैकअप से क्लाउड में स्ट्रीम किए जा सकते हैं।

00:06:16और फिर यह सब इस बात पर निर्भर करता है कि आप वास्तव में कहाँ के संसाधनों पर कार्य करना चाहते हैं।

00:06:20- हाँ, शानदार।

00:06:22ठीक है,

00:06:22तो हम मंच के पीछे चैट कर रहे थे और हम तीखे सवालों के लिए आसपास देख रहे थे।

00:06:27तो मुझे यह वाला वास्तव में पसंद आया और मुझे लगता है यह बहुत समसामयिक है।

00:06:31क्या आप लोग कचरा उत्पादन करते हैं एक पेशे के रूप में?

00:06:33क्या हम संभवतः एक हाइप बबल में होने का खतरा है

00:06:40जहाँ हम विश्वास करते हैं कि यह एजीआई का एक टिकाऊ रास्ता है?

00:06:44- मेरा मतलब है,

00:06:45मुझे लगता है कि शुरुआत के लिए,

00:06:47आप कह सकते हैं कि एक आदमी का कचरा दूसरे आदमी का खजाना है,

00:06:50जो कुछ हद तक सच हो सकता है।

00:06:52जैसे,

00:06:52आप जानते हैं,

00:06:53अगर उदाहरण के लिए,

00:06:55आपके पास एक रिपो था जिसमें कोई दस्तावेज़ीकरण बिल्कुल नहीं था।

00:07:00आप जानते हैं,

00:07:01कई उपकरण का उपयोग कर सकते हैं जिन्हें हम इस रिपो के लिए दस्तावेज़ीकरण उत्पन्न करने के बारे में बात कर रहे हैं।

00:07:08अब, क्या यह दस्तावेज़ीकरण का सबसे बेहतरीन टुकड़ा होगा?

00:07:13नहीं, लेकिन क्या यह कुछ मूल्य प्रदान कर रहा है?

00:07:16हाँ,

00:07:16मेरे विचार में,

00:07:17क्योंकि बिना दस्तावेज़ के कुछ बेहद पुराने लीगेसी कोडबेस के माध्यम से सीफ करना बहुत कठिन है बजाय कुछ कम मानदंड वाले दस्तावेज़ देखने के।

00:07:26और इसलिए मुझे लगता है कि बड़ी चीज़ यह है कि यह समझना है कि आप इन उपकरणों को कहाँ लाभ के लिए उपयोग कर सकते हैं और जिस हद तक यह कचरा है,

00:07:33मुझे लगता है कि यह काफी हद तक इस बात पर निर्भर करता है कि आप कितना मार्गदर्शन प्रदान करते हैं।

00:07:38तो अगर आप बस यह कहते हैं कि,

00:07:40मुझे एक ऐप बनाओ जो यह करे,

00:07:41तो आप शायद कुछ सामान्य कचरा ऐप पाने वाले हैं - यह बैंगनी है।

00:07:44- हाँ, नीला, बैंगनी जैसे फीका, हाँ।

00:07:48जबकि अगर इसके बजाय आप बहुत सुव्यवस्थित हैं कि आप सटीक रूप से क्या चाहते हैं,

00:07:52आपने उपकरण प्रदान किए हैं वास्तव में परीक्षण चलाने के लिए आप जो क्षमताएँ चाहते हैं उनकी पुष्टि करने के लिए।

00:07:58मुझे लगता है कि यह इसे बहुत अधिक संरचित बनाता है इसी हद तक कि अगर आप जानते हैं,

00:08:02अपनी टीम पर कुछ जूनियर इंजीनियर को किराए पर लिया गया था और आप बस कहते हैं,

00:08:07अरे,

00:08:07यह करो।

00:08:08जैसे वे शायद कुछ औसत परिणाम दे रहे हैं क्योंकि उनके पास कोई और विनिर्देश नहीं हैं।

00:08:14और यह काफी अस्पष्ट है कि आप वास्तव में क्या किया जाना चाहते हैं।

00:08:19- मुझे लगता है कि वहाँ मुख्य शब्द लाभ है, है ना?

00:08:21जैसे एआई कोडिंग एजेंट आपको क्या करने देते हैं यह है कि आप अपने आप से 10 गुना अधिक कर सकते हैं,

00:08:26काफी अच्छे आधार के साथ,

00:08:27है ना?

00:08:27तो अगर आप कौशल स्तर को एजेंट कितना उपयोगी है या यह कितना संभव है,

00:08:30आप जानते हैं,

00:08:31यह वास्तव में कितना उपयोगी है गैर-कचरा उत्पन्न करने में,

00:08:34संभवतः एक बहुत कम आधार है अगर आपके पास कोई कौशल नहीं है।

00:08:36आपके पास अभी भी एक बहुत अच्छा आधार है, है ना?

00:08:38एजेंट बॉक्स के बाहर काफी अच्छे हैं।

00:08:39अगर आप विकास के बारे में कुछ नहीं जानते,

00:08:42तो एजेंट आपसे कहीं अधिक करेगा।

00:08:44लेकिन जैसे-जैसे आप उच्च और उच्च कौशल स्तर तक पहुँचते हैं,

00:08:46वरिष्ठ और प्रिंसिपल और विशिष्ट इंजीनियर वास्तव में एजेंट का अलग तरीके से उपयोग करते हैं।

00:08:50वे इसे उन चीजों को बेहतर बनाने के लिए उपयोग कर रहे हैं जो वे पहले से ही कर सकते थे।

00:08:53आप जानते हैं,

00:08:54एक प्रिंसिपल इंजीनियर मैनुअली एक दिन में 5,

00:08:55000 पंक्तियों का कोड लिख सकते हैं।

00:08:57एजेंट के साथ,

00:08:58वे एक दिन में 50,

00:08:58000 पंक्तियों का कोड लिख सकते हैं।

00:09:00और यह वास्तव में इनपुट की गुणवत्ता और ज्ञान के स्तर पर संचालित होता है जो आप वहाँ डालते हैं।

00:09:04तो मुझे लगता है कि हम धीरे-धीरे समय के साथ आधार बढ़ा रहे हैं बेहतर एजेंट बनाकर।

00:09:11लेकिन मुझे लगता है कि यह लाभ का एक रूप है।

00:09:14यह आपको वह चीजें तेजी से करने का एक तरीका है जो आप पहले से ही कर सकते हैं।

00:09:18और जिन लोगों के पास कौशल नहीं है,

00:09:20आप जानते हैं,

00:09:21तब आप वास्तव में इसे ऊँचा कर सकते हैं।

00:09:23- बिल्कुल,

00:09:24और इन दोनों बिंदुओं पर जोड़ने के लिए,

00:09:26मुझे लगता है कि वे कला के उपकरण और प्रवर्धक हैं।

00:09:29अगर आपके पास है, तो आप इसमें अधिक कर सकते हैं।

00:09:31अगर आपके पास नहीं है,

00:09:32तो यह बस कठिन है,

00:09:33लेकिन यह आधार को बढ़ाता है।

00:09:34मुझे लगता है कि इसे कहना वास्तव में लायक है।

00:09:36मुझे लगता है कि जो लोग बस अपना पहला प्रोटोटाइप बनाने की कोशिश कर रहे हैं,

00:09:39वह एक विचार को पुनरावृत्त करने की कोशिश कर रहे हैं जो उदाहरण पहले उल्लेख कर रहा था।

00:09:44यह यह नहीं है कि मैं एक ऐसा फ्रंट एंड नहीं बना सकता जो कंटेंट-संचालित साइट जैसा हो,

00:09:49लेकिन मेरे पास समय नहीं था।

00:09:51और यह अधिक मजेदार था बस व्हाइटबोर्ड पर ड्रा करना,

00:09:53बात करना,

00:09:54बातचीत करना,

00:09:55और फिर इसे एजेंट को किक करना।

00:09:57लेकिन मुझे लगता है कि इसका एक दिलचस्प उदाहरण यह था जब हम कोडेक्स के बहुत पहले पुनरावृत्ति बना रहे थे और एक साल से अधिक पहले।

00:10:03और हम दो अलग-अलग आर्किटाइप के सामने डाल रहे थे,

00:10:06लोग जो बहुत सारे उत्पाद इंजीनियरिंग करते थे जहाँ वह स्थानीय,

00:10:11आंतरिक लूप शैली उपकरण का उपयोग करने के आदी थे जहाँ वह बस चैट करने और शायद पुनरावृत्त करने के लिए अभ्यस्त थे।

00:10:19और फिर एक पूरी तरह से अलग विधा जब हम तर्क टीमों पर लोगों से बात करते थे जहाँ वह कार्य को परिभाषित करने में शायद पाँच मिनट बैठते थे और एजेंट को जाने के लिए एक निबंध लंबाई,

00:10:30शब्द समस्या होती थी,

00:10:31और फिर यह एक घंटे के लिए काम करता था।

00:10:33और यह प्रभावी रूप से 01 या पहले के संस्करण था।

00:10:37और मुझे लगता है कि दिलचस्प हिस्सा सिर्फ यह था कि लोग कार्य को एजेंट को देने का तरीका उनकी समझ के आधार पर पूरी तरह से अलग था कि उन्हें क्या चाहिए।

00:10:48और इसलिए मुझे लगता है कि वास्तव में विशिष्टता पर निंदक होना,

00:10:51आप जो चाहते हैं वह आउटपुट होगा इस बारे में बहुत स्पष्ट होना।

00:10:55और मुझे लगता है कि एक व्यापक आइटम है जो हमारे दोनों के लिए एक जिम्मेदारी है एजेंट के बिल्डर और मॉडल प्रशिक्षण लोग वास्तव में उस आधार को बढ़ाने के लिए और यह सुनिश्चित करने के लिए कि उच्च कारीगरी वाले,

00:11:07उच्च स्वाद वाले लोग अपनी तरह से इसका प्रयोग करने में सक्षम हों।

00:11:11- मुझे लगता है कि वास्तव में आपने जो कुछ कहा है वह इस विचार को दिमाग में लाया है कि हमने नोटिस करना शुरू किया है।

00:11:16तो हमारा लक्ष्य दर्शक एंटरप्राइज है।

00:11:19और कुछ ऐसा जो हमने बार-बार देखा है कि एजेंट-नेटिव विकास के अनुकूल में एक बहुत ही दिलचस्प द्विसदस्यीयता है।

00:11:28और विशेष रूप से,

00:11:29सामान्यतः करियर के शुरुआत में डेवलपर एजेंट-नेटिव तरीके से बनाना शुरू करने के लिए अधिक खुले दिमाग वाले हैं,

00:11:35लेकिन उनके पास इंजीनियरिंग टीमों का प्रबंधन करने का अनुभव नहीं है।

00:11:39तो वह शायद सौंपने से परिचित नहीं हैं इस तरीके से जो बहुत अच्छा काम करता है।

00:11:44इस बीच,

00:11:44अधिक अनुभवी इंजीनियरों के पास सौंपने का बहुत अनुभव है।

00:11:47वह जानते हैं कि,

00:11:48अरे,

00:11:49अगर मैं इन सटीक चीजों को निर्दिष्ट नहीं करता,

00:11:50तो यह नहीं होगा।

00:11:51और इसलिए वह वास्तव में उस पैराग्राफ को लिखने में अच्छे हैं,

00:11:54लेकिन वह काफी हठीले हैं और वह वास्तव में अपने निर्माण के तरीके को बदलना नहीं चाहते हैं और आप उन्हें अपने ठंडे मृत हाथों से इमैक्स निकालते हैं।

00:12:03तो वहाँ एक दिलचस्प संतुलन है।

00:12:05- तो आप ऐसा कहना मजेदार है।

00:12:06इसी तरह की चीज जो हमने एंटरप्राइज में देखी है वरिष्ठ इंजीनियर,

00:12:10ऊँचे पद के लोग टिकट लिखेंगे।

00:12:12तो वह वास्तव में जो किए जाने की आवश्यकता है उसके सभी विनिर्देशन को लिखने का काम करेंगे।

00:12:16वह इसे वास्तव में काम करने के लिए एक जूनियर इंजीनियर को सौंप देंगे।

00:12:18जूनियर इंजीनियर उस बेहद अच्छी तरह से लिखे गए टिकट को लेता है और इसे एजेंट को देता है,

00:12:21है ना?

00:12:21तो आप बस इस विचार को मध्यस्थता कर रहे हैं कि जूनियर इंजीनियर एजेंट का काम करेगा क्योंकि वह ऐसा करने में अधिक सहज है।

00:12:28लेकिन वरिष्ठ इंजीनियर वह व्यक्ति है जो वास्तव में विनिर्देशन लिखने में वास्तव में अच्छा है,

00:12:32आर्किटेक्चरल निर्णयों को समझने में बहुत अच्छा है जो हमें करना चाहिए और इसे कुछ तरह के टिकट में डालना।

00:12:37- हाँ,

00:12:38जिन लोगों को नहीं पता,

00:12:39मतन और फैक्टरी सामान्य रूप से एजेंट-नेटिव विकास के युग के बारे में लिख और वकालत कर रहे हैं।

00:12:44तो आप उनकी वेबसाइट पर अधिक पढ़ सकते हैं।

00:12:45मुझे लगता है कि एक चीज़,

00:12:47वैसे,

00:12:48मैं शायद एक शब्दावली बात करना चाहता हूँ,

00:12:50जो यह है कि आपके लिए आधार बढ़ाना एक अच्छी बात है।

00:12:54मुझे लगता है कि वास्तव में अन्य लोग कहते हैं कि आधार कम करना भी एक ही बात को मतलब दे सकता है।

00:12:57मूल रूप से बस कौशल स्तर और जैसे वे क्या कर सकते हैं और बस लोगों को अधिक संसाधन देने की तरह।

00:13:05मुझे लगता है कि अन्य चीज़ है जैसे,

00:13:08बहुत सारे लोग मॉडल लेयर के बारे में सोच रहे हैं,

00:13:13है ना?

00:13:13स्पष्ट रूप से आप लोग अपने स्वयं के मॉडल का मालिक हैं,

00:13:17आप दोनों नहीं।

00:13:18और मुझे लगता है कि अभी मूल्य के बारे में एक गर्म विषय है।

00:13:22एयरबीएनबी,

00:13:23ब्रायन चेस्की ने कहा है कि सबसे अधिक मूल्य पर निर्भर होना स्पष्ट रूप से था।

00:13:28खुले मॉडल आपके लिए कितने महत्वपूर्ण हैं और आप,

00:13:30जो आप कर सकते हैं उसके लिए टिप्पणी कर सकते हैं,

00:13:33लेकिन आप दोनों के लिए रणनीति के रूप में खुले मॉडल कितने महत्वपूर्ण हैं?

00:13:37- मैं पहले आपसे सुनने के लिए उत्सुक होंगा।

00:13:38- हाँ।

00:13:38खुले मॉडल से प्यार करता हूँ।

00:13:42मुझे लगता है कि महत्वपूर्ण चीजों में से एक है,

00:13:44तो बस मॉडल के बारे में बात करने में सक्षम होना,

00:13:47मुझे लगता है कि खुलापन वास्तव में एक टिकाऊ विकास चक्र के लिए महत्वपूर्ण है जहाँ कोडेक्स सीएलआई के साथ,

00:13:53हमने इसे शुरुआत से ही खुला स्रोत किया और भाग प्राथमिकता यह समझना था कि एक खुला मॉडल आने वाला था।

00:13:58हम यह सुनिश्चित करना चाहते थे कि हम अपने तर्क मॉडल का उपयोग करने का सर्वोत्तम तरीके से दस्तावेज़ कर सकें।

00:14:03हमने बहुत सारी किस्म की भ्रम देखी कि किस तरह के उपकरण इसे दें,

00:14:06वातावरण क्या होना चाहिए,

00:14:07संसाधन।

00:14:08और इसलिए हम यह सुनिश्चित करना चाहते थे कि यह जितना संभव हो सके स्पष्ट हो और फिर यह भी सुनिश्चित करें कि यह खुले मॉडल के साथ अच्छी तरह से काम करे।

00:14:12तो मुझे लगता है कि निश्चित रूप से बहुत सारे उपयोग के मामले हैं,

00:14:16विशेष रूप से जब आप किस्म के एम्बेडेड उपयोग के मामलों में पाते हैं या जहाँ के मामले में आप नहीं चाहते कि डेटा परिमाण छोड़ दे।

00:14:23बहुत सारे वास्तव में अच्छे कारण हैं कि आप यह करना चाहेंगे।

00:14:26और फिर मुझे लगता है कि किस्म के क्लाउड-होस्टेड मॉडल का लाभ,

00:14:29और यही है कि हम बहुत सारे खुले मॉडल के साथ देखते हैं।

00:14:33वह अंत में हो सकता है,

00:14:34वह डिवाइस पर नहीं चलते हैं,

00:14:35लेकिन वह वास्तव में क्लाउड-होस्टेड हैं वैसे भी,

00:14:38शायद दक्षता के लिए,

00:14:39शायद लागत के लिए,

00:14:40अभी भी बहुत सारे मूल्य में केवल शुद्ध बुद्धिमत्ता में आप बहुत बड़े मॉडल का उपयोग करने से प्राप्त करते हैं।

00:14:46और यही है कि हम देख रहे हैं कि लोग वास्तव में ओ3 से जीबीडी5 से जीबीडी5 कोडेक्स में गुरुत्वाकर्षण कर रहे हैं।

00:14:52अभी भी उसमें बहुत सारे मूल्य हैं।

00:14:53अब हम देखते हैं कि वह ओवरहैंग अभी भी किस्म की आता है,

00:14:57यह अपने आप को हल करता है जहाँ हर कुछ महीने में एक नया,

00:15:01बहुत छोटा,

00:15:01बहुत,

00:15:02बहुत प्रभावशाली मॉडल है।

00:15:04और मुझे लगता है कि यह जादू है अगर हम बस इस साल की शुरुआत पर विचार करते हैं,

00:15:07हमारे पास ओ3 मिनी था किस्म के सीमांत के रूप में और जहाँ हम अभी हैं।

00:15:10और तो,

00:15:11हाँ,

00:15:11मुझे लगता है कि खुले मॉडल में टन मूल्य है,

00:15:14लेकिन अभी भी,

00:15:14मुझे लगता है कि व्यक्तिगत रूप से,

00:15:16उपयोग के दृष्टिकोण से,

00:15:17किस्म के क्लाउड-होस्टेड वाले का उपयोग करने में अधिक मूल्य है।

00:15:21- हाँ, मैं बस एक बिट में हस्तक्षेप करूँगा।

00:15:23फोर्ड वास्तव में गोपनीयता,

00:15:25सुरक्षा,

00:15:25एजेंट मजबूती की परवाह करता है।

00:15:27और तो अगर आप उसे चलाते हैं, उससे और अधिक बात करें।

00:15:30लेकिन आप दोनों के लिए,

00:15:32शायद आप खुले मॉडल टोकन प्रतिशत का एक बेलपार्क से शुरू करना चाहते हैं जो आपके संबंधित ऐप्स में उत्पन्न होता है?

00:15:39और यह ऊपर या नीचे जाने वाला है?

00:15:42- तो मैं अनुमान लगाता हूँ,

00:15:43तो शायद शुरू करने के लिए,

00:15:44'क्योंकि मुझे लगता है कि आपने जो कहा है वह वास्तव में दिलचस्प है।

00:15:47तो कुछ हफ्ते पहले,

00:15:48जब हमने अपना फैक्टरी सीएलआई उपकरण रिलीज़ किया,

00:15:50लोग वास्तव में इसमें रुचि रखते थे क्योंकि हमने इसके साथ अपना स्कोर भी रिलीज़ किया इस बेंचमार्क को टर्मिनल बेंच कहा।

00:15:57और पहली माँगों में से एक थी,

00:15:58क्या आप लोग खुले स्रोत मॉडल को परीक्षण में डाल सकते हैं?

00:16:02'क्योंकि हमारा ड्रॉइड एजेंट पूरी तरह से मॉडल अज्ञेयवादी है।

00:16:04तो तुरंत लोग खुले स्रोत मॉडल में थे और हमें दिखाते हैं कि यह कैसे करता है।

00:16:09और मुझे लगता है कि विशेष रूप से आश्चर्यजनक था खुले स्रोत मॉडल,

00:16:13और विशेष रूप से जीएलएम,

00:16:15वास्तव में,

00:16:15वास्तव में अच्छे थे।

00:16:17वह वास्तव में स्पष्ट रूप से सीमांत मॉडल की तुलना में कम प्रदर्शन करते थे,

00:16:22लेकिन एक विशाल मार्जिन द्वारा नहीं।

00:16:24मुझे लगता है,

00:16:25तो एक बात जो ध्यान देने योग्य था कि जब हमने खुले स्रोत मॉडल को बेंचमार्क किया,

00:16:30तो शीर्ष सात में से एक संयुक्त राज्य अमेरिका द्वारा आपकी पत्नी द्वारा बनाया गया था,

00:16:35जो मुझे लगता है कि एक शर्म की बात है।

00:16:37जैसे तथ्य यह है कि अब तक सीमांत मॉडल,

00:16:40यह संयुक्त राज्य अमेरिका भर में है।

00:16:43लेकिन फिर जब यह खुले स्रोत आता है,

00:16:45हम वास्तव में गेंद को गिरा रहे हैं।

00:16:47तो मुझे लगता है कि यह एक चीज़ है जो ध्यान देने योग्य है और मुझे लगता है कि कुछ ऐसा है जो,

00:16:51कम से कम जब मैंने इसे देखा,

00:16:52मुझे वास्तव में लगता है कि वहाँ एक कॉल टू आर्म्स होना चाहिए इसे बदलने के मामले में।

00:16:56क्योंकि मुझे लगता है कि जवाब देने के लिए,

00:16:58हमने जो पाया वह यह है कि जब हमने खुले स्रोत मॉडल के लिए समर्थन रिलीज़ किया,

00:17:03तो लोगों का प्रतिशत जो खुले स्रोत मॉडल का उपयोग कर रहे हैं नाटकीय रूप से बढ़ गया है।

00:17:08आंशिक रूप से लागत के कारण और यह कि,

00:17:10आप जानते हैं,

00:17:10यह आपको अनुमति देता है जैसे,

00:17:12चलिए उस दस्तावेज़ीकरण उदाहरण में,

00:17:14शायद आप दस्तावेज़ उत्पन्न करना चाहते हैं,

00:17:16लेकिन आप नहीं चाहते कि यह सुपर उच्च तर्क पर हो,

00:17:18अधिकतम की तरह,

00:17:19आपको एक हजार डॉलर की खर्च आए,

00:17:20लेकिन आप बस कुछ प्रारंभिक पहली पास प्राप्त करना चाहते हैं।

00:17:24और साथ ही लोग थोड़ी अधिक नियंत्रण होना पसंद करते हैं।

00:17:28और मुझे लगता है कि वह इन खुले स्रोत मॉडल के साथ बहुत अधिक नियंत्रण प्राप्त करते हैं,

00:17:34दोनों नियंत्रण और लागत और केवल किस्म की देखभाल जो वास्तव में वहाँ हो रही है।

00:17:39तो मुझे लगता है कि माँग एक बिंदु तक बढ़ गई है जहाँ मैंने एक साल पहले की उम्मीद नहीं की थी।

00:17:43मुझे लगता है कि एक साल पहले,

00:17:45मैं खुले स्रोत मॉडल की तुलना में कम आशावादी था अब मैं हूँ,

00:17:48खुले-वजन,

00:17:49लेकिन हाँ।

00:17:49- हाँ,

00:17:50मुझे लगता है कि हम अपनी समग्र एजेंट पाइपलाइन में खुले स्रोत और बंद स्रोत दोनों मॉडल का उपयोग करते हैं।

00:17:55और मुझे लगता है कि हम उनके बारे में सोचते हैं कि एक एलएलएम कॉल के लिए दो अलग-अलग उपयोग के मामले हैं।

00:17:58एक यह है कि आप राज्य-के-कला तर्क चाहते हैं।

00:18:01यह एक बहुत ही खुला प्रश्न है।

00:18:02आप वास्तव में नहीं जानते कि जवाब क्या है।

00:18:04लक्ष्य यह है कि,

00:18:05लक्ष्य फ़ंक्शन बहुत अच्छी तरह से परिभाषित नहीं है।

00:18:07उन मामलों में,

00:18:08बंद स्रोत मॉडल अभी भी तर्क और बुद्धि के मामले में राज्य-के-कला हैं।

00:18:13हम उन प्रकार के उपयोग के मामलों के लिए लगभग एक्सक्लूसिवली बंद स्रोत मॉडल का उपयोग करते हैं।

00:18:16एक दूसरा उपयोग का मामला है जहाँ हमारे पास एक अधिक विशिष्ट कार्य है एक बहुत स्पष्ट लक्ष्य फ़ंक्शन के साथ।

00:18:22उन मामलों में,

00:18:23हम लगभग हमेशा एक खुले स्रोत मॉडल को फाइन ट्यून करने की कोशिश करते हैं।

00:18:26हम ठीक है कि तर्क क्षमता में 20% कट हिट ले सकते हैं ताकि हम वास्तव में एक बहुत ही विशिष्ट उपयोग के मामले को फाइन ट्यून कर सकें।

00:18:35और मुझे लगता है कि हमने पाया कि ओपन सोर्स मॉडल बेहद तेजी से आगे बढ़ रहे हैं।

00:18:39डेढ़ साल पहले,

00:18:40हमारे लिए ओपन सोर्स मॉडल को v0 के पाइपलाइन का हिस्सा बनाना असंभव था।

00:18:45आज,

00:18:45पाइपलाइन का हर एक हिस्सा,

00:18:47हम सोचते हैं,

00:18:47क्या हम इसमें ओपन सोर्स मॉडल ला सकते हैं?

00:18:49क्या हम अपने बंद सोर्स अत्याधुनिक मॉडल को ओपन सोर्स मॉडल के फाइन-ट्यून से बदल सकते हैं?

00:18:57और हमने Quen, QEMI-K2 जैसे मॉडल के साथ बहुत सफलता देखी है।

00:19:02हाँ,

00:19:03मैं इसे सबसे बड़ी बदलाव के रूप में हाइलाइट करूँ,

00:19:06जो मैंने सभी में देखा है। साल की शुरुआत में,

00:19:09मैंने BrainTrust के Ankur के साथ एक पॉडकास्ट किया था,

00:19:12और उन्होंने कहा कि ओपन सोर्स मॉडल का उपयोग लगभग 5% है और घट रहा है।

00:19:17और अब मुझे लगता है कि यह सब के लिए 10 से 20% रेंज में जाएगा।

00:19:22मुझे लगता है यह दिलचस्प है कि बंद सोर्स मॉडल भी अपने छोटे क्लास मॉडल में अधिक निवेश कर रहे हैं।

00:19:29Haikus,

00:19:29GPT-5 Minis,

00:19:30Gemini Flashes जैसे मॉडल,

00:19:32जो मुझे लगता है कि यह मॉडल क्लास ओपन सोर्स के साथ सबसे ज्यादा प्रतिस्पर्धा करता है।

00:19:38यह छोटे मॉडल क्लास की ओपन सोर्स मॉडल के फाइन-ट्यून के खिलाफ प्रतिस्पर्धा है।

00:19:42और मुझे लगता है कि कुछ उपयोग के मामले ऐसे हैं जहाँ यह एक फ्रंटियर मॉडल का उपयोग करना अनावश्यक होगा,

00:19:48और अगर यह अनावश्यक है,

00:19:49तो आप स्पष्ट रूप से कुछ तेज और सस्ता का उपयोग करने के लिए प्रेरित होंगे।

00:19:53और मुझे लगता है कि इस प्रतिशत उपयोग में इस डेल्टा का हिस्सा यह है कि जब ओपन मॉडल इस सीमा को पार करते हैं कि अधिकांश कार्यों के लिए यह वास्तव में पर्याप्त है,

00:20:04और फिर कुछ विशिष्ट कार्यों के लिए आपको अतिरिक्त शक्ति की आवश्यकता होती है।

00:20:10मुझे लगता है कि हम इन कुछ ओपन मॉडल के साथ वास्तव में वहाँ पहुँच रहे हैं,

00:20:13इसलिए मुझे संदेह है कि हम आगे अधिक उपयोग देखेंगे।

00:20:16हाँ, बहुत अच्छा, यह बहुत प्रोत्साहजनक है।

00:20:18तो हमारे पास समापन प्रश्न के लिए तैयारी के लिए कुछ समय है,

00:20:21जो यह है: आपके एजेंट आज क्या नहीं कर सकते हैं जो आप चाहते हैं कि वह कर सकें,

00:20:26जो वह अगले साल शायद कर सकें?

00:20:27क्या मैं पहले जा रहा हूँ?

00:20:31ठीक है।

00:20:32हाँ,

00:20:32मुझे लगता है कि पिछले साल,

00:20:3401 से एक संदर्भ बिंदु के रूप में शुरुआत करते हुए,

00:20:38एक साल पहले या 01 प्रिव्यू,

00:20:40जो हमने देखा है तब से,

00:20:42जब मैं उस मॉडल के शुरुआती चेकपॉइंट का उपयोग कर रहा था,

00:20:46यह 4.0 के सापेक्ष बहुत अच्छा था,

00:20:49लेकिन अभी भी बहुत कुछ अधूरा था।

00:20:51मैं इसे नहीं रखता,

00:20:53मैं उस समय सुरक्षा दल पर था,

00:20:55और बहुत सारे काम और कार्य थे जो मैं उस मॉडल को सौंप नहीं सकता था।

00:21:00और आज की तुलना में,

00:21:01जहाँ मैं एक काफी अच्छी तरह से परिभाषित कार्य ले सकता हूँ,

00:21:05जैसे शायद यह दो वाक्य हैं,

00:21:06कुछ बुलेट पॉइंट्स आपके अनुसार,

00:21:08ये वह नुकसान हैं जिनमें मुझे लगता है कि आप फँस जाएंगे,

00:21:11और फिर 30 मिनट बाद,

00:21:12एक घंटे बाद,

00:21:13यह हो गया।

00:21:14हमने ऐसे मामले देखे हैं जहाँ यह कई घंटों तक चल रहा है,

00:21:17शायद सात से आठ घंटे तक,

00:21:18प्रभावी रूप से एक पूरा कार्य दिवस जो मैं अपने दिन का अधिकांश समय बैठकों में व्यतीत करता हूँ,

00:21:24और इसलिए उस ठोस समय के साथ जरूरी नहीं है।

00:21:26लेकिन यह केवल इंजीनियरिंग का आधा हिस्सा है।

00:21:30इसका एक हिस्सा कोडिंग है,

00:21:31एक हिस्सा आर्किटेक्चरिंग और समस्या निवारण और डिबगिंग है।

00:21:34समस्या का दूसरा आधा दस्तावेज लिखना है,

00:21:36सिस्टम को समझना,

00:21:37लोगों को समझाना।

00:21:39और इसलिए मुझे लगता है कि हम इस सुपर सहयोगी को देखना शुरू करेंगे जहाँ हम जो लाना चाहते हैं,

00:21:45चाहे वह कोडेक्स में हो या कोडेक्स मॉडल के माध्यम से ये अन्य इंटरफेस,

00:21:50आदर्श सहयोगी है जिसके साथ आप काम करना चाहते हैं।

00:21:53वह व्यक्ति जिसके पास आप पहले जाते हैं,

00:21:55वह पसंदीदा सहकर्मी जिसके साथ आप विचारों पर काम करना चाहते हैं,

00:21:59यह वास्तव में वह है जो हम कम से कम कोडेक्स के साथ देखना चाहते हैं।

00:22:02मुझे लगता है कि हमारे लिए,

00:22:04हमने दो अलग-अलग मोर्चों पर बहुत तेजी से प्रगति देखी है।

00:22:07पहला यह है कि एक एजेंट कितने कदम उठाने की अनुचित रूप से अपेक्षा कर सकता है और उचित आउटपुट प्राप्त कर सकता है?

00:22:14पिछले साल, शायद एक, अधिकतम तीन, है ना?

00:22:17अगर आप 90% सफलता के साथ विश्वसनीय आउटपुट चाहते हैं,

00:22:19तो आप शायद एक से तीन एजेंट कदम चला रहे हैं।

00:22:22आज,

00:22:22अधिकांश उपकरण पाँच से 20 चलाते हैं बिना वास्तव में अच्छी विश्वसनीयता दरों के,

00:22:2890% सफलता के साथ।

00:22:29मुझे लगता है कि अगले साल,

00:22:30हम उस तरह जोड़ने जा रहे हैं 100 प्लस,

00:22:32200 प्लस,

00:22:32आइए एक बार में टन स्टेप चलाएं,

00:22:34कई घंटों के लिए लंबे समय तक चलने वाले कार्य हों और आत्मविश्वासी रहें कि आपको अंत में एक आउटपुट मिलेगा जो उपयोगी होगा।

00:22:40दूसरा यह है कि कौन सी संसाधन का उपभोग किया जा सकता है।

00:22:42एक साल पहले,

00:22:43यह जो कुछ भी आप प्रॉम्प्ट फॉर्म में डाल रहे थे,

00:22:45मोटे तौर पर वही था।

00:22:47आज,

00:22:47आप अब MCP के माध्यम से बाहरी कनेक्शन कॉन्फ़िगर कर सकते हैं या सीधे अपने एप्लिकेशन में API कॉल कर सकते हैं।

00:22:55आप कर सकते हैं,

00:22:56अगर आप जानकारी रखते हैं,

00:22:57आपके पास चीजों को कॉन्फ़िगर करने की क्षमता है।

00:22:58और मुझे लगता है कि एक साल से अब, वे बस होंगे।

00:23:00यह बस काम करेगा।

00:23:02लक्ष्य यह है कि आपको यह नहीं पता होना चाहिए कि आपको एजेंट को कौन से संदर्भ स्रोत देने हैं।

00:23:06एजेंट वास्तव में जाएगा और उन संदर्भ स्रोतों को सक्रिय रूप से खोजेगा।

00:23:09हम पहले से ही आज इसे देखना शुरू कर रहे हैं,

00:23:11लेकिन मैं अभी भी इस बात के लिए वास्तव में आत्मविश्वासी नहीं हूँ कि यह आज बहुत विश्वसनीय और उपयोगी है।

00:23:16मुझे लगता है कि अगले साल तक, वह डिफ़ॉल्ट मोड होगा।

00:23:18हाँ, मैं इससे सहमत हूँ।

00:23:19मुझे लगता है कि एजेंट आज बुनियादी रूप से सबकुछ कर सकते हैं,

00:23:22लेकिन वह डिग्री जिस तक वे विश्वसनीय और सक्रिय रूप से ऐसा करते हैं,

00:23:26मुझे लगता है कि वह स्लाइडर है जो बदलने वाली है।

00:23:29लेकिन वह स्लाइडर भी उपयोगकर्ता पर निर्भर है।

00:23:31जैसे,

00:23:32अगर आप एक उपयोगकर्ता हैं जो वास्तव में अपना व्यवहार नहीं बदल रहे हैं और एजेंट से मिल रहे हैं,

00:23:36तो आप कम विश्वसनीयता और सक्रियता प्राप्त कर सकते हैं।

00:23:38जबकि अगर आप अपने हार्नेस को सही तरीके से सेट करते हैं या अपने वातावरण को सही तरीके से सेट करते हैं,

00:23:42तो यह विश्वसनीय रूप से अधिक ऐसा करने में सक्षम होगा और अधिक सक्रिय रूप से।

00:23:45हाँ, शानदार।

00:23:46खैर, हमारा समय खत्म हो गया।

00:23:48मेरा योगदान कंप्यूटर विजन है।

00:23:49सभी को Atlas आजमाएं।

00:23:51सभी को अधिक कंप्यूटर विजन उपयोग के मामलों को आजमाने के लिए,

00:23:53लेकिन आपके समय के लिए बहुत-बहुत धन्यवाद।

00:23:55धन्यवाद।

00:23:56(श्रोताओं की तालियों की गूँज) (जीवंत संगीत)

Key Takeaway

एआई कोडिंग एजेंट सॉफ्टवेयर विकास को बदल रहे हैं, लेकिन उनकी प्रभावशीलता डेवलपर के कौशल स्तर, स्पष्ट निर्देश और उपयुक्त वातावरण सेटअप पर निर्भर करती है।

Highlights

एआई कोडिंग एजेंट पूरे सॉफ्टवेयर विकास चक्र को स्वचालित कर सकते हैं - केवल कोडिंग नहीं बल्कि दस्तावेज़ीकरण, परीक्षण और समीक्षा भी
स्थानीय और क्लाउड दोनों पर एजेंट चलाने की क्षमता उपलब्ध है, जो संसाधनों के स्थान और कार्य की जटिलता पर निर्भर करता है
खुले स्रोत मॉडल तेजी से विकसित हो रहे हैं और अब उनका उपयोग 10-20% पर पहुंच गया है, जो एक साल पहले 5% से कम था
एजेंट उन्नत विशिष्टता और स्पष्ट मार्गदर्शन के साथ बेहतर परिणाम देते हैं - अस्पष्ट निर्देश का अर्थ कम गुणवत्ता का आउटपुट होना है
विभिन्न कौशल स्तर के पेशेदारों के लिए एजेंट अलग तरीके से काम करते हैं - जूनियर इंजीनियर अधिक मौलिक कार्य करते हैं जबकि वरिष्ठ इंजीनियर अपनी क्षमता 10 गुना बढ़ा सकते हैं
वीजेरो जैसे उपकरण प्रिव्यू-संचालित विकास को सक्षम करते हैं जहां डेवलपर सीधे चलती ऐप्स के विरुद्ध एजेंट से बात कर सकते हैं
एजेंट अगले साल 100+ चरणों तक कई घंटों के लिए काम कर सकेंगे और स्वचालित रूप से आवश्यक संदर्भ स्रोत खोज सकेंगे

Timeline

एआई कोडिंग एजेंट का परिचय और फैक्टरी का मिशन

यह खंड एआई कोडिंग पैनल की शुरुआत करता है और फैक्टरी के मिशन को समझाता है। फैक्टरी का प्राथमिक उद्देश्य सॉफ्टवेयर इंजीनियरिंग में स्वायत्तता लाना है, जिसके लिए उन्होंने ड्रॉइड्स नामक एंड-टू-एंड सॉफ्टवेयर विकास एजेंट बनाए हैं। ये एजेंट केवल कोडिंग पर ही ध्यान नहीं देते, बल्कि दस्तावेज़, परीक्षण और समीक्षा जैसे पूरे विकास चक्र को संभालते हैं। इसका मतलब है कि डेवलपर्स मजेदार कोडिंग कार्यों पर ध्यान केंद्रित कर सकते हैं जबकि एजेंट कठिन प्रशासनिक काम करते हैं।

कोडेक्स का विकास और विभिन्न परिस्थितियां

इस अनुभाग में कोडेक्स के विकास की प्रगति की व्याख्या की जाती है। वक्ता बताते हैं कि इस साल की शुरुआत में उन्होंने पहला कोडिंग एजेंट लॉन्च किया, फिर कोडेक्स सीएलआई और कोडेक्स क्लाउड जारी किया। वर्तमान ध्यान इन अनुभवों को एकीकृत करने पर है ताकि वे निरंतर और विश्वसनीय तरीके से काम करें। वीजेरो की परिकल्पना की जाती है जो डेवलपर्स को प्रिव्यू-संचालित एजेंटिक प्रोग्रामिंग करने में सक्षम बनाता है, जहां आप एजेंट को चलते हुए ऐप के विरुद्ध सीधे प्रॉम्प्ट कर सकते हैं।

स्थानीय बनाम क्लाउड: एजेंट की परिस्थितियों का चुनाव

यह खंड स्थानीय और क्लाउड-आधारित एजेंट्स के बीच अंतर की गहन चर्चा करता है। वक्ता समझाते हैं कि दीर्घकालीन में दोनों एक जैसे होने चाहिए, लेकिन अल्पकालीन में क्लाउड आमतौर पर छोटे, स्पष्ट कार्यों के लिए अधिक उपयोगी है जिन्हें आप आत्मविश्वास से सौंप सकते हैं। स्थानीय एजेंट तब सर्वश्रेष्ठ होते हैं जब आप एजेंट के पास रहना चाहते हैं, विशेषकर बड़े या जटिल कार्यों के लिए जिनकी सक्रिय निगरानी की आवश्यकता है। एजेंट चुनने के निर्णय को संसाधनों के स्थान द्वारा निर्देशित किया जाता है - यदि आप स्थानीय फ़ाइल सिस्टम पर काम कर रहे हैं तो स्थानीय चलाएं, यदि गिटहब जैसी क्लाउड सेवाओं का उपयोग कर रहे हैं तो क्लाउड चलाएं।

कचरे बनाम मूल्य: एजेंट आउटपुट की गुणवत्ता का सवाल

इस महत्वपूर्ण खंड में एजेंट द्वारा उत्पन्न आउटपुट की गुणवत्ता पर विचार किया जाता है। वक्ता स्वीकार करते हैं कि अस्पष्ट निर्देशों के साथ आप कम गुणवत्ता के परिणाम प्राप्त कर सकते हैं, लेकिन उचित मार्गदर्शन और विशिष्टता के साथ गुणवत्ता काफी सुधर जाती है। वह कम्प्यूटर के 01 संस्करण से वर्तमान क्षमताओं तक की प्रगति को हाइलाइट करते हैं। महत्वपूर्ण बिंदु यह है कि एजेंट शक्ति स्वयं को प्रवर्धित करते हैं - उच्च कौशल वाले इंजीनियर अधिक मूल्य प्राप्त करते हैं, जबकि नए डेवलपर्स भी एक अच्छी नींव प्राप्त करते हैं। एक प्रिंसिपल इंजीनियर एक दिन में 5,000 पंक्तियों का मैनुअल कोड लिख सकता है, लेकिन एजेंट के साथ 50,000 पंक्तियां लिख सकता है।

विभिन्न डेवलपर आर्किटाइप और एजेंट का उपयोग कैसे करें

यह अनुभाग विभिन्न प्रकार के डेवलपर्स के लिए एजेंट का उपयोग कैसे भिन्न होता है, इसकी व्याख्या करता है। जूनियर इंजीनियर अक्सर अधिक दिशानिर्देश की आवश्यकता होती है, जबकि अनुभवी इंजीनियर विस्तृत विशिष्टताएं प्रदान कर सकते हैं। एंटरप्राइज सेटिंग में एक दिलचस्प पैटर्न देखा जाता है: वरिष्ठ इंजीनियर विस्तृत टिकट लिखते हैं, जूनियर इंजीनियर उन्हें एजेंट को सौंपते हैं। agents.md जैसी कस्टम निर्देशनाएं, जो विभिन्न कोडिंग एजेंटों में सामान्य होती हैं, व्हाइटबोर्ड सेशन से विकसित होती हैं। वक्ता कोडेक्स की शुरुआती पुनरावृत्तियों का उदाहरण देते हैं जहां विभिन्न टीमें (प्रोडक्ट इंजीनियर बनाम रीजनिंग टीम) एजेंट के साथ पूरी तरह अलग तरीके से बातचीत करते थे।

खुले स्रोत मॉडल का उदय और एजेंट में उनकी भूमिका

इस बड़े खंड में खुले स्रोत एलएलएम मॉडल की तेजी से प्रगति पर विस्तार से चर्चा की जाती है। वक्ता बताते हैं कि एक साल पहले खुले स्रोत मॉडल का उपयोग लगभग 5% था, लेकिन अब यह 10-20% रेंज में है। फैक्टरी ने देखा है कि जब उन्होंने खुले स्रोत समर्थन जारी किया, तो उपयोग नाटकीय रूप से बढ़ा। कोडेक्स और आंतरिक बेंचमार्किंग से पता चलता है कि जीएलएम जैसे खुले मॉडल काफी प्रतिस्पर्धी हैं, हालांकि सीमांत बंद-स्रोत मॉडल अभी भी आगे हैं। महत्वपूर्ण अंतर यह है कि बंद स्रोत मॉडल अत्याधुनिक तर्क के लिए बेहतर हैं, जबकि खुले स्रोत को विशिष्ट कार्यों के लिए फाइन-ट्यून किया जा सकता है। नई घोषणाएं (हैकू, जीपीटी-4ओ मिनी, जेमिनी फ्लैश) हल्के वजन मॉडल पर अधिक जोर देते हैं जो खुले स्रोत प्रतिद्वंद्विता को सीधे अनुकूल करते हैं।

भविष्य की दिशाएं: अगले साल एजेंट क्या कर सकेंगे

अंतिम खंड एजेंट क्षमताओं के भविष्य की आशाजनक दृष्टिकोण प्रदान करता है। गत वर्ष में, एजेंट आमतौर पर 1-3 चरणों तक सीमित थे, लेकिन आज वे 5-20 चरण चला सकते हैं 90% सफलता दर के साथ। अगले साल, पूर्वानुमान 100+ चरणों तक पहुंचता है जो कई घंटों तक चल सकते हैं। दूसरी प्रमुख प्रगति यह है कि एजेंट अब एमसीपी के माध्यम से बाहरी कनेक्शन कॉन्फ़िगर कर सकते हैं, लेकिन भविष्य में एजेंट्स को यह जानने की भी आवश्यकता नहीं होगी कि कौन से संदर्भ स्रोत दें - वे सक्रिय रूप से उन्हें खोजेंगे। वक्ता जोर देते हैं कि आदर्श भविष्य का एजेंट एक आदर्श सहयोगी होगा - वह व्यक्ति जिसके साथ आप पहली बार विचार साझा करते हैं, और जिसकी विश्वसनीयता और सक्रियता उपयोगकर्ता की तैयारी पर निर्भर करती है।

Community Posts

Write about this video