पेश है Chat SDK

VVercel
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00(उत्साहपूर्ण संगीत)
00:00:02- नमस्ते सबको, मेरा नाम माल्टे है, मैं Vercel का CTO हूँ।
00:00:16आज हमारे साथ जुड़ने के लिए धन्यवाद।
00:00:18जनवरी की शुरुआत में, हमने अपनी कंपनी में सभी को एक आदेश दिया था,
00:00:21यह पता लगाओ कि अपने आउटपुट को कई गुना कैसे बढ़ाया जाए।
00:00:24और लोगों ने जो बनाया उसे देखकर हम अभी भी दंग रह जाते हैं।
00:00:27लगभग हर टीम ने जटिल कार्यों को संभालने के लिए एक एजेंट बनाया,
00:00:30और उनमें से अधिकतर स्लैक (Slack) बॉट्स हैं जिन्हें कोई भी उपयोग कर सकता है।
00:00:34लेकिन हमें एक समस्या का सामना करना पड़ा।
00:00:35हर कोई बार-बार वही दोहराव वाला
00:00:38काम कर रहा था।
00:00:40कोई एक एजेंट बनाता,
00:00:41फिर आपको स्लैक की जटिलताओं को समझना पड़ता,
00:00:43और वह जितना लगता है उससे कहीं ज़्यादा कठिन है।
00:00:45आपको थ्रेड्स और रिएक्शंस को समझना होता है,
00:00:47बॉट्स कैसे मेल खाते हैं, स्टेट को कैसे संभालना है।
00:00:50फिर कोई पूछता,
00:00:51"अरे, क्या आप उस एजेंट को गिटहब (GitHub) से जोड़ सकते हैं?"
00:00:53और पूरी प्रक्रिया फिर से शुरू हो जाती
00:00:55गिटहब के APIs के साथ।
00:00:56तर्क वही था, लेकिन प्लेटफॉर्म का कोड अलग था।
00:00:59हमने जल्दी ही सीख लिया कि वे चैट APIs
00:01:01ऊपर से देखने में एक जैसे लगते हैं,
00:01:03लेकिन अंदर से पूरी तरह अलग होते हैं।
00:01:05स्लैक नेटिव स्ट्रीमिंग का समर्थन करता है।
00:01:06जैसे-जैसे LLM टोकन जेनरेट करता है, आप उन्हें सीधे
00:01:09मैसेज में स्ट्रीम कर सकते हैं।
00:01:10डिस्कॉर्ड (Discord) में, आपको पोस्ट, एडिट, पोस्ट, एडिट करना पड़ता है।
00:01:14गिटहब में, स्ट्रीमिंग बिल्कुल नहीं है।
00:01:16स्लैक में मोडल्स हैं, डिस्कॉर्ड में नहीं।
00:01:18माइक्रोसॉफ्ट टीम्स आपको केवल पढ़ने योग्य रिएक्शंस देता है।
00:01:21ये सिर्फ छोटी-मोटी कमियाँ नहीं हैं, ये मौलिक अंतर हैं
00:01:23कि प्रत्येक प्लेटफॉर्म कैसे काम करता है।
00:01:26इसलिए एक साधारण एजेंट के लिए भी,
00:01:28आपको बहुत सारा लॉजिक लिखना पड़ता है
00:01:31ताकि उसे अलग-अलग टूल्स में इस्तेमाल किया जा सके।
00:01:33यह एक दुःस्वप्न जैसा है।
00:01:34और यह केवल Vercel की समस्या नहीं है।
00:01:36हर कंपनी को यह सोचना होगा कि
00:01:38अपने एजेंट्स को उन प्लेटफॉर्म्स पर कैसे पहुँचाया जाए
00:01:40जहाँ काम पहले से हो रहा है।
00:01:42इसका मतलब है चैट, कोड रिव्यू, इश्यू ट्रैकिंग और बहुत कुछ।
00:01:45AI SDK मॉडल प्रदाताओं के लिए इसी तरह की समस्या हल करता है।
00:01:48आप एक बार कोड लिखते हैं और यह
00:01:50सभी API अंतरों को संभाल लेता है,
00:01:51चाहे आप GPT, Claude, या Gemini को कॉल कर रहे हों।
00:01:54Chat SDK इंटरैक्टिव एजेंट्स के लिए वही काम करता है।
00:01:58यह स्लैक, गिटहब, लीनियर, डिस्कॉर्ड, टेलीग्राम,
00:02:01वॉट्सऐप और अन्य प्लेटफॉर्म्स पर
00:02:04एजेंट इंटरैक्शन के लिए एक सिंगल API है।
00:02:06आप एजेंट बनाते हैं और Chat SDK उसे उन ऐप्स में
00:02:09यूज़र्स तक पहुँचाएगा जिन्हें वे पहले से उपयोग करते हैं।
00:02:11फर्नांडो पिछले कुछ हफ्तों से
00:02:15v0 बैकग्राउंड एजेंट्स बना रहे हैं,
00:02:16और वह आपको बताएंगे कि क्यों Chat SDK
00:02:18उस स्टैक का एक महत्वपूर्ण हिस्सा था।
00:02:21(उत्साहपूर्ण संगीत)
00:02:24(उत्साहपूर्ण संगीत जारी)
00:02:28जब मैंने v0 बैकग्राउंड एजेंट्स बनाना शुरू किया,
00:02:34तो मेरा लक्ष्य आपको स्लैक से v0 को टैग करने देना था
00:02:36ताकि पुल रिक्वेस्ट्स (PR) खोली जा सकें।
00:02:38मैं एक सामान्य कोडिंग एजेंट चाहता था
00:02:40जो बैकग्राउंड में चल सके,
00:02:42किसी भी कोड बेस में, किसी भी भाषा के साथ।
00:02:45तो मैंने निर्माण शुरू किया,
00:02:47और मैंने v0 स्लैक ऐप का पहला वर्जन
00:02:49अपने दोस्तों को भेजा।
00:02:51और पहली चीज़ जो उन्होंने पूछी वह थी,
00:02:53"क्या मैं इसे लीनियर (Linear) इश्यूज में भी इस्तेमाल कर सकता हूँ?
00:02:56और क्या मैं इसे गिटहब PR कमेंट से टैग कर सकता हूँ?"
00:02:58इसने मुझे उस समय की याद दिला दी जब मैंने पहली बार मोबाइल ऐप लॉन्च किया था,
00:03:02जब लोग पूछने लगे थे कि क्या वे इसे वेब पर भी इस्तेमाल कर सकते हैं।
00:03:05यह स्पष्ट हो गया कि v0 को हर जगह काम करना होगा।
00:03:09अपेक्षाएं बदल गई हैं।
00:03:11इसलिए मुझे एक चुनाव करना था।
00:03:14क्या हम v0 बैकग्राउंड एजेंट्स को प्लेटफॉर्म दर प्लेटफॉर्म बनाएं?
00:03:18या क्या हम इसे हर प्लेटफॉर्म के लिए
00:03:22एक एकीकृत API के साथ एक बार में बना सकते हैं?
00:03:24चैट एजेंट्स के लिए रिएक्ट नेटिव (React Native) की तरह?
00:03:27खैर, बात यह है कि मैंने सालों
00:03:30रिएक्ट नेटिव के साथ क्रॉस-प्लेटफॉर्म ऐप्स बनाने में बिताए हैं।
00:03:34यह समस्या मेरे लिए नई नहीं है।
00:03:36और यहीं पर Chat SDK काम आया।
00:03:39Chat SDK के साथ,
00:03:40मैं v0 बैकग्राउंड एजेंट्स बनाने पर ध्यान केंद्रित कर सकता हूँ,
00:03:43और मुझे प्रत्येक प्लेटफॉर्म के
00:03:45अनूठे APIs के बारे में चिंता करने की ज़रूरत नहीं है।
00:03:48तो यह अंदरूनी तौर पर कैसा दिखता है?
00:03:50मैथ यहाँ आपको और दिखाने के लिए मौजूद है।
00:03:53(उत्साहपूर्ण संगीत)
00:03:55- नमस्ते सबको।
00:04:11फर्नांडो की तरह ही, चलिए स्लैक से शुरू करते हैं।
00:04:14मैंने अपने बॉट का उल्लेख किया,
00:04:16और मुझे एक बहुत ही साधारण 'हेलो वर्ल्ड' रिस्पॉन्स मिला।
00:04:21क्रांतिकारी है, मुझे पता है।
00:04:23और अगर आप कोड देखें,
00:04:24तो आप देख सकते हैं कि मेरे लिए यह बॉट बनाना कितना आसान था।
00:04:28मुझे बस एक नया चैट इंस्टेंस बनाना था,
00:04:32और एक 'ऑन मेंशन' लिस्नर जोड़ना था,
00:04:35और थ्रेड में वापस 'हेलो वर्ल्ड' पोस्ट करना था।
00:04:38बस इतना ही।
00:04:39लेकिन हम नहीं चाहते कि डेवलपर्स प्लेन टेक्स्ट बॉट्स बनाएं।
00:04:43हम समृद्ध नेटिव अनुभव चाहते हैं
00:04:45जो प्रत्येक प्लेटफॉर्म का पूरा लाभ उठाए।
00:04:48और डेवलपर्स को JSX पसंद है।
00:04:51इसलिए हम Chat SDK में JSX लेकर आए।
00:04:55अब आप कंपोनेंट्स के साथ वैसे ही निर्माण करते हैं जैसे आप अभ्यस्त हैं।
00:04:58चलिए दो बटन जोड़ते हैं।
00:04:59तो यहाँ नीचे, आप देख सकते हैं,
00:05:03मैं अपने 'हेलो वर्ल्ड' मैसेज को
00:05:05एक 'हेलो वर्ल्ड' कार्ड में बदल दूँगा जिसमें एक 'कंटिन्यू' बटन,
00:05:10और एक 'कैंसिल' बटन होगा।
00:05:11हम एक एक्शन लिस्नर भी जोड़ेंगे
00:05:14जो यूज़र का पूरा नाम बताएगा,
00:05:17जब हम 'कंटिन्यू' पर क्लिक करेंगे।
00:05:19वापस स्लैक में, मैं अपने बॉट को फिर से मेंशन करूँगा।
00:05:24और जैसा कि आप उम्मीद कर सकते हैं, हमें बिल्कुल वही मिला जो हमने बनाया था।
00:05:29कंपोनेंट्स नेटिवली रेंडर होते हैं।
00:05:32मैं 'कंटिन्यू' पर क्लिक करता हूँ, और बॉट तुरंत एक्शन को हैंडल करता है।
00:05:36लेकिन अब यहाँ चीज़ें दिलचस्प हो जाती हैं।
00:05:41क्या होगा अगर मुझे डिस्कॉर्ड पर भी बिल्कुल यही अनुभव चाहिए?
00:05:45मैं डिस्कॉर्ड अडैप्टर जोड़ता हूँ।
00:05:47बस इतना ही।
00:05:48अब, अगर मैं अपने डिस्कॉर्ड चैनल पर वापस जाता हूँ,
00:05:55तो मैं अपने बॉट को मेंशन कर सकता हूँ,
00:05:57और वही UI डिस्कॉर्ड में नेटिवली रेंडर होता है।
00:06:02एक नए प्लेटफॉर्म को सपोर्ट करने के लिए कोड में जीरो बदलाव।
00:06:07यह शानदार है।
00:06:08लेकिन चलिए एजेंट्स के बारे में बात करते हैं।
00:06:10तो यहाँ एक साधारण एजेंट है जिसे मैंने AI SDK का उपयोग करके बनाया है।
00:06:14और एजेंट्स को स्ट्रीमिंग की ज़रूरत होती है।
00:06:17Chat SDK के साथ, स्ट्रीमिंग बहुत आसान है।
00:06:20मैं एक स्ट्रीम बनाता हूँ और उसे थ्रेड पर पोस्ट कर देता हूँ।
00:06:23बस इतना ही।
00:06:24मुझे यह देखने की ज़रूरत नहीं पड़ी कि स्लैक स्ट्रीमिंग को कैसे संभालता है
00:06:27या डिस्कॉर्ड आंशिक अपडेट्स को कैसे संभालता है।
00:06:30मैंने एक API का उपयोग किया।
00:06:32और वापस स्लैक में, अगर मैं बॉट को मेंशन करता हूँ,
00:06:35तो हम देखेंगे कि यह हमें नेटिवली अपना रिस्पॉन्स स्ट्रीम करता है।
00:06:40लेकिन यहीं क्यों रुकें?
00:06:42क्या होगा अगर मैं वॉट्सऐप या टेलीग्राम जैसे प्लेटफॉर्म पर
00:06:45अपने एजेंट को सीधे मैसेज भेजना चाहूँ?
00:06:49Chat SDK के साथ, यह आसान है।
00:06:52मैं एक 'ऑन डायरेक्ट मैसेज' लिस्नर और ज़रूरी अडैप्टर जोड़ता हूँ।
00:06:56अब जो कोई भी एजेंट को DM करेगा उसे वही अनुभव मिलेगा।
00:07:02अगर मैं वेब पर वॉट्सऐप खोलता हूँ और कहता हूँ,
00:07:06"नमस्ते, आप कैसे हैं?"
00:07:08तो हम देखेंगे कि एजेंट हमारे डायरेक्ट मैसेज का जवाब देगा
00:07:12उसी एजेंट का उपयोग करके जिसे हमने बनाया है।
00:07:14अब जबकि हमने एक एजेंट बना लिया है,
00:07:16क्यों न एक पुल रिक्वेस्ट खोली जाए?
00:07:18लेकिन ऐसा करने से पहले,
00:07:20क्या होगा अगर वही एजेंट जिससे मैंने वॉट्सऐप पर चैट की थी,
00:07:24मेरे कोड का रिव्यू कर सके?
00:07:25इसके लिए बस गिटहब अडैप्टर की ज़रूरत है।
00:07:28मैं यहाँ आता हूँ, गिटहब अडैप्टर जोड़ता हूँ,
00:07:32और मैं अपने एजेंट को एक बिल्कुल नए प्लेटफॉर्म पर ले आया हूँ।
00:07:35अगर मैं गिटहब खोलता हूँ और इस पुल रिक्वेस्ट को देखता हूँ,
00:07:39तो मैं कमेंट्स में एजेंट को मेंशन कर सकता हूँ
00:07:42और यह उसी डायरेक्ट मैसेज लिस्नर के साथ जवाब देगा
00:07:45जिसे हमने पहले बनाया था।
00:07:46स्लैक, डिस्कॉर्ड, वॉट्सऐप, टेलीग्राम, गिटहब।
00:07:51ज़रा सोचिए कि ये APIs कितने अलग हैं।
00:07:56लेकिन एक फाइल और कोड की कुछ पंक्तियों के साथ,
00:07:59हम अपने एजेंट को इन सभी पर ले आए।
00:08:01Chat SDK के साथ, आप एक बार एजेंटिक अनुभव बनाते हैं
00:08:06और उन्हें एक सिंगल API के साथ हर जगह तैनात करते हैं।
00:08:09डॉक्यूमेंटेशन और टेम्पलेट्स देखने के लिए chat-sdk.dev पर जाएं।
00:08:14सुनने के लिए धन्यवाद।
00:08:15और मैं यह देखने के लिए उत्साहित हूँ कि आप क्या बनाते हैं।
00:08:17(उत्साहपूर्ण संगीत)

Key Takeaway

Chat SDK डेवलपर्स को एक ही बार कोड लिखकर अपने AI एजेंटों को स्लैक, डिस्कॉर्ड और व्हाट्सएप जैसे कई प्लेटफॉर्म्स पर सहजता से तैनात करने की अनुमति देता है।

Highlights

Vercel ने Chat SDK पेश किया है, जो विभिन्न मैसेजिंग प्लेटफॉर्म्स के लिए एक एकीकृत API प्रदान करता है।

यह SDK डेवलपर्स को स्लैक, डिस्कॉर्ड, गिटहब और व्हाट्सएप जैसे अलग-अलग प्लेटफॉर्म्स की जटिलताओं से बचाता है।

डेवलपर्स अब JSX का उपयोग करके इंटरैक्टिव UI कंपोनेंट्स और बटन बना सकते हैं जो हर प्लेटफॉर्म पर नेटिवली रेंडर होते हैं।

Chat SDK स्ट्रीमिंग और रिपॉन्स हैंडलिंग को आसान बनाता है, चाहे प्लेटफॉर्म इसे सीधे सपोर्ट करता हो या नहीं।

एक ही कोडबेस का उपयोग करके एजेंटों को कई चैनलों (जैसे टेलीग्राम और लीनियर) पर तैनात करना अब संभव है।

यह टूल AI SDK के पूरक के रूप में काम करता है, जो मॉडल प्रदाताओं के बीच के अंतर को कम करता है।

Timeline

चैट ऐप्स के विकास में चुनौतियाँ

Vercel के CTO माल्टे ने बताया कि कैसे उनकी टीम ने उत्पादकता बढ़ाने के लिए कई स्लैक बॉट और एजेंट बनाए। उन्होंने महसूस किया कि हर प्लेटफॉर्म जैसे स्लैक, डिस्कॉर्ड और गिटहब के अपने अलग-अलग API और काम करने के तरीके हैं, जिससे विकास कार्य कठिन हो जाता है। उदाहरण के लिए, स्लैक नेटिव स्ट्रीमिंग का समर्थन करता है जबकि डिस्कॉर्ड में बार-बार एडिट करना पड़ता है। ये मौलिक अंतर डेवलपर्स के लिए एक 'दुःस्वप्न' बन जाते हैं क्योंकि उन्हें हर टूल के लिए अलग लॉजिक लिखना पड़ता है। यह खंड स्पष्ट करता है कि क्यों कंपनियों को एक ऐसे समाधान की आवश्यकता है जो इन विभिन्न माध्यमों के बीच के अंतर को पाट सके।

Chat SDK का परिचय और समाधान

माल्टे ने समझाया कि जिस तरह AI SDK विभिन्न LLM मॉडलों के बीच अंतर को संभालता है, वैसे ही Chat SDK इंटरैक्टिव एजेंटों के लिए काम करता है। फर्नांडो ने v0 बैकग्राउंड एजेंट बनाने के अपने अनुभव को साझा किया, जहाँ यूज़र चाहते थे कि वे स्लैक के साथ-साथ लीनियर और गिटहब पर भी इसका उपयोग कर सकें। उन्होंने इसकी तुलना 'रिएक्ट नेटिव' से की, जो एक ही बार कोड लिखकर कई प्लेटफॉर्म पर चलने की सुविधा देता है। Chat SDK का मुख्य उद्देश्य डेवलपर्स को प्लेटफॉर्म की विशिष्टताओं के बजाय मुख्य एजेंट लॉजिक पर ध्यान केंद्रित करने में मदद करना है। यह बदलाव डेवलपर्स को तेज़ी से नए फीचर्स और प्लेटफॉर्म्स को अपनाने की शक्ति देता है।

JSX के साथ कोडिंग और नेटिव रेंडरिंग

मैथ ने तकनीकी प्रदर्शन के माध्यम से दिखाया कि 'हेलो वर्ल्ड' बॉट बनाना कितना सरल है। उन्होंने प्रदर्शित किया कि कैसे डेवलपर्स JSX का उपयोग करके बटन और कार्ड जैसे समृद्ध UI तत्व बना सकते हैं, जो स्लैक और डिस्कॉर्ड दोनों पर नेटिवली दिखते हैं। कोडिंग के दौरान एक नया 'अडैप्टर' जोड़कर, बिना किसी बदलाव के वही अनुभव दूसरे प्लेटफॉर्म पर भी मिल जाता है। यह खंड दिखाता है कि कैसे 'ऑन मेंशन' लिस्नर्स और एक्शन हैंडलर्स का उपयोग करके इंटरैक्टिविटी जोड़ी जाती है। यह डेवलपर्स के लिए एक क्रांतिकारी कदम है क्योंकि यह जटिल UI कोडिंग को बहुत आसान बना देता है।

स्ट्रीमिंग और मल्टी-प्लेटफॉर्म परिनियोजन

अंतिम खंड में, मैथ ने दिखाया कि कैसे AI एजेंटों के लिए महत्वपूर्ण 'स्ट्रीमिंग' फीचर को Chat SDK के साथ आसानी से लागू किया जा सकता है। उन्होंने एक ही एजेंट को व्हाट्सएप, टेलीग्राम और गिटहब पुल रिक्वेस्ट कमेंट्स से जोड़ा, जिससे यह साबित हुआ कि एक ही लॉजिक हर जगह काम करता है। गिटहब अडैप्टर जोड़कर, वही एजेंट अब कोड रिव्यू करने और कमेंट्स का जवाब देने में सक्षम हो गया। यह वीडियो chat-sdk.dev पर जाकर डॉक्यूमेंटेशन देखने के निमंत्रण के साथ समाप्त होता है। संक्षेप में, यह SDK डेवलपर्स को एक भविष्यवादी उपकरण प्रदान करता है जो उनके AI अनुप्रयोगों की पहुँच को असीमित बना देता है।

Community Posts

View all posts