00:00:00जब से AI मॉडल्स शक्तिशाली हुए हैं, कई लोगों ने बेहतरीन प्रोडक्ट्स बनाना शुरू कर दिया है,
00:00:04जो इन मॉडल्स का इस्तेमाल करके हमारी कई समस्याओं को हल कर रहे हैं। लेकिन ये सिस्टम बहुत ज़्यादा
00:00:09टोकन्स खर्च करते हैं, खासकर तब जब आप API के ज़रिए किसी मॉडल को जोड़ रहे हों। इसका समाधान
00:00:15आपकी सोच से कहीं ज़्यादा आसान है। सबसे अच्छा आर्किटेक्चर कोई जटिल पाइपलाइन या बड़े पैमाने की ट्यूनिंग नहीं है,
00:00:20बल्कि एक पुराना दर्शन है जो Unix आधारित सिस्टम का आधार है—कि हर चीज़ एक फाइल है।
00:00:25अब, मैं जानता हूँ कि वे मॉडल की लागत के बारे में बात नहीं कर रहे थे, और हम डिवाइसेज़ और फाइलों की बात कर रहे हैं। लेकिन
00:00:30हैरानी की बात यह है कि इस भारी लागत की समस्या का समाधान भी बिल्कुल वही सिद्धांत है। और
00:00:35Vercel के एक सॉफ्टवेयर इंजीनियर इसी बारे में बात करते हैं। फाइलें समाधान क्यों हैं, इसे समझने से पहले,
00:00:41आइए समझते हैं कि ये मॉडल वास्तव में कैसे काम करते हैं। मॉडल्स को
00:00:46कोड की विशाल मात्रा पर ट्रेन किया गया है। यही कारण है कि वे कोड को बेहतर ढंग से समझते हैं,
00:00:50साथ ही डायरेक्टरी स्ट्रक्चर और उन नेटिव बैश (bash) स्क्रिप्ट्स को भी जिन्हें डेवलपर्स फाइलें खोजने के लिए इस्तेमाल करते हैं।
00:00:56जब कोई एजेंट grep और ls का उपयोग करता है, तो वह कुछ नया नहीं कर रहा होता। वह बस वही कर रहा है
00:01:01जो उसे पहले से आता है, बस थोड़े और नियंत्रित तरीके से। यह तरीका सिर्फ कोड तक सीमित नहीं है; एजेंट्स
00:01:06किसी भी डायरेक्टरी में काम कर सकते हैं, चाहे उसमें कोड हो या न हो, क्योंकि वे कमांड्स और फाइल सिस्टम को अच्छी तरह समझते हैं।
00:01:11जब भी एजेंट को किसी चीज़ की ज़रूरत होती है, वह ls और find जैसे नेटिव बैश कमांड्स का उपयोग करके फाइल सिस्टम में खोज करता है।
00:01:17एक बार जब एजेंट find की मदद से सही फाइल ढूंढ लेता है,
00:01:23तो वह grep और cat के ज़रिए पैटर्न मैचिंग करके उस फाइल के अंदर प्रासंगिक जानकारी खोजता है।
00:01:27जानकारी का केवल एक छोटा सा हिस्सा ही मॉडल को भेजा जाता है, जबकि बाकी डेटा मेमोरी से बाहर रहता है,
00:01:32जिससे कॉन्टेक्स्ट विंडो साफ रहती है। इसका मतलब है कि हम उन फालतू डेटा पर टोकन बर्बाद नहीं कर रहे
00:01:36जिनकी मॉडल को ज़रूरत ही नहीं है। इस तरीके से एजेंट एक स्ट्रक्चर्ड आउटपुट देता है।
00:01:41यह पैटर्न इतना कारगर है कि Vercel ने खास तौर पर इसी के लिए बना एक बैश टूल ओपन सोर्स कर दिया,
00:01:46जो एजेंट्स को ठीक एक डेवलपर की तरह फाइल सिस्टम को खंगालने की शक्ति देता है।
00:01:51बड़े लैंग्वेज मॉडल सिस्टम बनाते समय, मॉडल को सही जानकारी देने के दो तरीके होते हैं,
00:01:56या तो एक विस्तृत सिस्टम प्रॉम्प्ट के ज़रिए, यह उम्मीद करते हुए कि एजेंट उसका पालन करेगा,
00:02:00या फिर बहुत सारा डेटा वेक्टर डेटाबेस में डालकर उसे निकालने के लिए सिमेंटिक सर्च का उपयोग करना। लेकिन हर
00:02:06तरीके की अपनी सीमाएं हैं। सिस्टम प्रॉम्प्ट की टोकन विंडो सीमित होती है, जिससे यह तय होता है कि हम एक बार में कितनी जानकारी भेज सकते हैं।
00:02:10बड़े डेटा से निपटने के लिए हम सिमेंटिक सर्च का उपयोग करते हैं, जो अर्थ के आधार पर जानकारी ढूँढता है।
00:02:15लेकिन वेक्टर सर्च का उपयोग अर्थ की समानता (semantic similarity) के लिए किया जाता है, न कि सटीक खोज के लिए।
00:02:20यह डेटा के वे हिस्से लौटाता है जो क्वेरी के सामान्य संदर्भ से मेल खाते हैं, न कि वह सटीक वैल्यू जो आप ढूंढ रहे हैं।
00:02:25इससे उन सभी हिस्सों में से सही जानकारी निकालने का काम खुद मॉडल पर ही रह जाता है। हालाँकि, फाइल सिस्टम
00:02:30एक अलग नज़रिया देते हैं। फाइल सिस्टम में, स्ट्रक्चर असल में आपके डोमेन के अनुरूप होता है।
00:02:35अक्सर फोल्डर स्ट्रक्चर में फाइलों के बीच वही संबंध होते हैं जो उनके पैरेंट फोल्डर्स के बीच होते हैं।
00:02:40फाइल सिस्टम के साथ, आपको इन संबंधों को मॉडल के समझने लायक वेक्टर चंक्स में बदलने की ज़रूरत नहीं पड़ती,
00:02:45जिससे उन संबंधों के खोने का डर नहीं रहता जो अक्सर सिमेंटिक सर्च में गायब हो जाते हैं।
00:02:49ये पदानुक्रमित संबंध स्वाभाविक रूप से सुरक्षित रहते हैं, जिससे आपके डेटा का संगठनात्मक तर्क बना रहता है।
00:02:54एक और फायदा यह है कि जानकारी निकालने की प्रक्रिया सटीक होती है क्योंकि grep और बैश टूल्स
00:02:59सटीक मैच (exact matches) देते हैं, वेक्टर सर्च की तरह नहीं जो मिलते-जुलते डेटा के कई हिस्से दे देता है
00:03:05और फिर मॉडल पर छोड़ देता है कि वह किसका उपयोग करे। आपको सिर्फ वही मिलता है जिसकी ज़रूरत है।
00:03:10जब एजेंट बैश टूल्स का उपयोग करते हैं तो कॉन्टेक्स्ट बहुत कम होता है क्योंकि उन्हें केवल वही हिस्सा मिलता है जिसकी ज़रूरत है,
00:03:15और बाकी फालतू डेटा मेमोरी में नहीं जाता। इससे वे गुमराह हुए बिना सटीक जानकारी पर ध्यान केंद्रित कर पाते हैं।
00:03:20अब, यह विचार आपके लिए नया नहीं है। इस आइडिया का उपयोग पहले से ही
00:03:25Claude Code और सभी CLI एजेंट्स में किया जा रहा है, जहाँ वे पैटर्न मैचिंग के ज़रिए नतीजों को सटीक बनाने के लिए बैश फंक्शन का उपयोग करते हैं।
00:03:30हम खुद रिसर्च के लिए Claude Code की क्षमताओं और फाइल सिस्टम का उपयोग करते रहे हैं।
00:03:36हम जिस भी सॉफ्टवेयर टूल को देखते हैं, उसे इस पाइपलाइन से गुज़ारते हैं जिसमें रिसर्च पास करने के लिए
00:03:41हमारे मूल्यांकन मानदंडों के कई चरण होते हैं। यह सब एक मार्कडाउन फाइल में परिभाषित होता है,
00:03:46जिसमें टेस्ट किए जा रहे टूल की ज़रूरतें, उद्देश्य, फाइनल डॉक्यूमेंट लिखने का तरीका और हर चरण की जानकारी होती है।
00:03:51हम Claude को सैंपल के तौर पर कुछ डॉक्यूमेंट्स भी देते हैं जो स्टाइल मैचिंग के लिए गाइड का काम करते हैं,
00:03:56और फाइनल डॉक्यूमेंट रिसर्च रिजल्ट्स फोल्डर में सेव हो जाता है। रिसर्च को दिशा देने के लिए,
00:04:01हमारे पास एक Claude.md फाइल है जो बताती है कि आइडिया को एक-एक करके हर चरण से कैसे गुज़ारना है,
00:04:06ताकि अंत में हमें एक ऐसा रिसर्च डॉक्यूमेंट मिले जो हमारे सभी मानकों पर खरा उतरे।
00:04:11जब भी हमें कुछ रिसर्च करना होता है, मैं बस Claude के पास जाता हूँ और उसे वह आइडिया या टूल बताता हूँ।
00:04:17फिर वह उसे छह चरणों वाली वैलिडेशन प्रक्रिया से गुज़ारता है—पहले टूल को समझता है और फिर उसे एक-एक करके हर चरण से गुज़ारता है।
00:04:22सभी चरणों से गुज़रने के बाद, Claude एक फाइनल रिपोर्ट तैयार करता है जिसे पढ़कर हम देख सकते हैं
00:04:27कि उस आइडिया में दम है या नहीं। फाइल सिस्टम का यह तरीका रिसर्च प्रोसेस को ऑटोमेट करके हमारा बहुत समय बचाता है,
00:04:32जिसे वरना हमें खुद स्टेप-बाय-स्टेप करना पड़ता। अगर आप अपने काम के लिए इस पाइपलाइन को आज़माना चाहते हैं,
00:04:37तो आप हमारी हाल ही में लॉन्च की गई कम्युनिटी “AI Labs Pro” में हमारे जैसा रिसर्च पाइपलाइन बनाने के लिए
00:04:42तैयार टेम्पलेट पा सकते हैं। इसके लिए और पिछले सभी वीडियो के लिए, आपको रेडी-टू-यूज़ टेम्पलेट्स, प्रॉम्प्ट्स,
00:04:47कमांड्स और स्किल्स मिलते हैं जिन्हें आप सीधे अपने प्रोजेक्ट्स में इस्तेमाल कर सकते हैं। अगर आपको हमारा काम पसंद आता है
00:04:52और आप चैनल का सपोर्ट करना चाहते हैं, तो यह सबसे अच्छा तरीका है। लिंक डिस्क्रिप्शन में है।
00:04:57मैं उनका केस स्टडी देख रहा था जिसमें उन्होंने बताया था कि इस आर्किटेक्चर का उपयोग करके
00:05:03सेल्स समरी एजेंट कैसे बनाया जाए। उन्होंने इसे ओपन सोर्स भी किया है, लेकिन इससे मुझे एक दिलचस्प आइडिया आया
00:05:08जिसे मैं खुद आज़माना चाहता था। मैं दरअसल कंपनी पॉलिसी का एक प्रोजेक्ट बना रहा था
00:05:12जहाँ मेरे पास JSON, Markdown और TXT फाइलों में कंपनी का बहुत सारा डेटा था, जो डिपार्टमेंट के हिसाब से अलग-अलग था।
00:05:17आम तौर पर मैं इसे Chroma जैसे वेक्टर डेटाबेस का उपयोग करके बनाता, लेकिन मैंने इस टूल को आज़माने का फैसला किया।
00:05:22मैंने यह आर्किटेक्चर लागू किया। बैकएंड पर, मैंने उस डॉक्यूमेंट फोल्डर का पाथ दिया जिसमें कंपनी का डेटा था
00:05:27और एजेंट को ls, cat, grep और find कमांड्स का एक्सेस दिया, साथ ही यह गाइड भी दी कि किस टूल का कब इस्तेमाल करना है।
00:05:32मैंने Gemini 2.5 Flash मॉडल का उपयोग किया, उसे Vercel का बैश टूल दिया और टूल के अंदर डॉक्यूमेंट्स का पाथ सेट किया।
00:05:39और जब मैंने डेटा से जुड़ा कोई भी सवाल पूछकर एजेंट का टेस्ट किया, तो उसने कंपनी की नीतियों,
00:05:44जैसे कि हैंडबुक और लीव पॉलिसी डॉक्यूमेंट्स के आधार पर बिल्कुल सटीक जवाब दिए।
00:05:49यह देखने के लिए कि यह कैसे काम कर रहा है, मैंने टर्मिनल पर इसके टूल यूसेज को ट्रैक किया।
00:05:55एजेंट ने पहले यह देखने के लिए ls कमांड का उपयोग किया कि कौन से डॉक्यूमेंट्स उपलब्ध हैं और फिर छुट्टियों या मिलते-जुलते शब्दों को
00:06:01खोजने के लिए पैटर्न मैचिंग के साथ grep का उपयोग किया। इन कमांड्स ने हमारी क्वेरी को संभाला और हमें
00:06:06उतनी ही सटीकता से नतीजे दिए जितने एक RAG सिस्टम देता है। अगर आपको इस प्रोजेक्ट का सोर्स कोड चाहिए,
00:06:11तो आप इसे हमारी कम्युनिटी से डाउनलोड कर सकते हैं और खुद आज़मा सकते हैं।
00:06:16अब, इस टूल को देखते समय मेरे मन में पहला सवाल यह आया कि क्या एजेंट्स को सर्वर पर कमांड चलाने की छूट देना वाकई सुरक्षित है?
00:06:21हमने पिछले दिसंबर में ही React सर्वर कंपोनेंट्स में एक कमज़ोरी (vulnerability) देखी थी, जिसे 10.0 का स्कोर मिला था,
00:06:27जो कि उच्चतम है, और इसमें सर्वर पर कोड एग्जीक्यूट होना शामिल था। तो एजेंट्स को यह क्षमता देना वाकई शक्तिशाली और संभावित रूप से खतरनाक हो सकता है।
00:06:32तो मैंने इस टूल पर भरोसा क्यों किया? ऐसा इसलिए क्योंकि यह सैंडबॉक्स में चलता है और पूरी तरह आइसोलेटेड है।
00:06:38यह केवल उसी डायरेक्टरी तक पहुँच पाता है जो हम इसे देते हैं और बाकी किसी चीज़ को नहीं छेड़ता।
00:06:43आर्टिकल में यह भी बताया गया है कि एजेंट प्रोडक्शन सिस्टम के एक्सेस के बिना फाइलों को चेक करता है,
00:06:47इसलिए अगर एजेंट सर्वर पर हानिकारक कमांड चलाने की कोशिश भी करे, तो भी आपका प्रोडक्शन कोड सुरक्षित रहता है।
00:06:52यह दो प्रकार का आइसोलेशन देता है। पहला है इन-मेमोरी एनवायरनमेंट। इसमें यह सिर्फ बैश टूल का उपयोग करता है,
00:06:57जो केवल उन्हीं फाइलों पर बैश स्क्रिप्ट चलाता है जिनका उसके पास एक्सेस है, जैसे हमने अपना एजेंट बनाते समय किया था।
00:07:03दूसरा प्रकार एक पूरी तरह से कंपैटिबल सैंडबॉक्स एनवायरनमेंट है जो Vercel सैंडबॉक्स का उपयोग करके फुल वर्चुअल मशीन आइसोलेशन देता है।
00:07:08हम अपनी ज़रूरत के हिसाब से कोई भी चुन सकते हैं। साधारण काम के लिए इन-मेमोरी वाला तरीका हल्का और तेज़ है,
00:07:14जबकि कड़ी सुरक्षा के लिए फुल VM आइसोलेशन बेहतर है।
00:07:19भले ही यह तरीका प्रति मॉडल कॉल की लागत बचाने के लिए बहुत अच्छा है, लेकिन यह हर तरह की समस्या के लिए सही नहीं है।
00:07:24अगर आपको शब्दों के अर्थों (meaning matching) को मिलाना है, तो यह आदर्श नहीं है क्योंकि बैश टूल्स सटीक मैचिंग के लिए होते हैं।
00:07:29जैसा कि हमने अपने एजेंट के मामले में देखा, उसने ज़रूरी डेटा खोजने के लिए विशिष्ट कीवर्ड्स का उपयोग किया।
00:07:35यह उन फाइल स्ट्रक्चर्स के लिए भी सही नहीं है जो व्यवस्थित नहीं हैं, जहाँ एजेंट को कई बार टूल कॉल करने में संघर्ष करना पड़ेगा।
00:07:40एक ऐसा स्ट्रक्चर जिसे एजेंट आसानी से समझ सके, कहीं ज़्यादा बेहतर होता है। मेरा सुझाव है कि
00:07:46बैश टूल का उपयोग तब करें जब आपके पास बहुत व्यवस्थित डेटा हो और आपकी ज़रूरतें स्पष्ट हों।
00:07:51RAG का उपयोग तब करें जब आपको शब्दों के अर्थ की ज़्यादा परवाह हो या जब आपके सवाल थोड़े पेचीदा हों।
00:07:56खत्म करने से पहले, हमारे प्रायोजक (sponsor) की ओर से कुछ शब्द। Brilliant। सबसे अच्छे इंजीनियर्स सिर्फ सिंटैक्स नहीं जानते,
00:08:01वे समस्याओं को बुनियादी सिद्धांतों से सुलझाते हैं। इसीलिए हमने Brilliant के साथ साझेदारी की है।
00:08:06उनका मानना है कि आप करके ही सबसे अच्छा सीखते हैं। वे सक्रिय समस्या समाधान को प्राथमिकता देते हैं
00:08:11ताकि आप सिर्फ रटने के बजाय कॉन्सेप्ट्स को खुद अनुभव करें। उदाहरण के लिए, उनके “How AI Works” कोर्स में,
00:08:17आप सिर्फ पढ़ते नहीं हैं, बल्कि असल लॉजिक के साथ काम करते हैं। आप लॉस स्पेस में लॉस कैलकुलेट करने और इंटरपोलेशन को विज़ुअलाइज़ करने जैसे तकनीकी काम खुद करेंगे,
00:08:22जिससे आपको ऐसी गहरी समझ मिलेगी जो आप सिर्फ वीडियो लेक्चर से नहीं पा सकते।
00:08:27उनके इंटरैक्टिव टेक्निकल कोर्सेस के ज़रिए, आप उन विषयों में महारत हासिल कर सकते हैं जिनकी हम बात करते हैं।
00:08:32आपको सालाना प्रीमियम सब्सक्रिप्शन पर 20% की छूट भी मिलेगी, जिससे मैथ, डेटा और CS कोर्सेस का पूरा कैटलॉग खुल जाएगा,
00:08:37जो आपको आगे बढ़ने के लिए एक पूरा रोडमैप देगा। अपने 30 दिनों के फ्री ट्रायल के लिए डिस्क्रिप्शन में दिए गए लिंक पर क्लिक करें या अपनी स्क्रीन पर दिख रहे QR कोड को स्कैन करें।
00:08:42इसी के साथ हम इस वीडियो के अंत में पहुँच गए हैं। अगर आप चैनल को सपोर्ट करना चाहते हैं और ऐसे वीडियो बनाने में हमारी मदद करना चाहते हैं,
00:08:47तो आप नीचे दिए गए सुपर थैंक्स बटन का उपयोग करके ऐसा कर सकते हैं। हमेशा की तरह, देखने के लिए धन्यवाद और मैं आपसे अगले वीडियो में मिलूँगा।
00:08:52memorizing. For example, in their course named "How AI Works", you don't just read, you manipulate the
00:08:57actual logic. You'll get hands-on with technicalities like calculating loss in the loss space and
00:09:02visualizing interpolation, building a deep intuition you just can't get from a video lecture. Through
00:09:07their interactive technical courses, you get the most effective way to truly master the concepts
00:09:12we talk about. You'll also get 20% off on annual premium subscription, unlocking their entire catalog
00:09:17of math, data, and CS courses, giving you a complete roadmap to upskill. Click the link in the description
00:09:22or scan the QR code on your screen to claim your free 30-day trial. That brings us to the end of
00:09:28this video. If you'd like to support the channel and help us keep making videos like this, you can
00:09:32do so by using the super thanks button below. As always, thank you for watching and I'll see you in the next one.