मैंने Grep का इस्तेमाल बंद कर दिया और मेरा एजेंट 10 गुना तेज़ हो गया
BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology
Transcript
00:00:00तो, एक MCP प्लगइन है जिसका नाम है Claude Context जो आपके पूरे कोडबेस को इंडेक्स करता है
00:00:06एक वेक्टर डेटाबेस में, जिसका मतलब है कि आपका कोडिंग एजेंट उसे जो सटीक कोड चाहिए वह तेज़ी से पा सकता है
00:00:11grep या glob का उपयोग करके अंदाज़ा लगाए बिना और यह उम्मीद किए बिना कि उसे सही फ़ाइल मिल जाए।
00:00:15यह ASTs के साथ आपके कोड को पार्स भी करता है और हाइब्रिड सर्च दृष्टिकोण का उपयोग करता है, जिसमें सिमेंटिक
00:00:20वेक्टर को कीवर्ड मैचिंग के साथ जोड़ा जाता है, जो अंततः 40% कम कॉन्टेक्स्ट का उपयोग करता है।
00:00:24लेकिन इसके लिए Zilliz क्लाउड अकाउंट और एम्बेडिंग के लिए OpenAI की की ज़रूरत होती है, भले ही आप Claude के कोड का उपयोग करें।
00:00:30तो, क्या अतिरिक्त प्रयास और लागत टोकन बचत के लायक है?
00:00:34सब्सक्राइब बटन दबाएं और आइए पता करें।
00:00:35ठीक है, तो Claude Context, नाम के बारे में पक्का नहीं हूँ, Zilliz द्वारा बनाया गया है, जो एक कंपनी है
00:00:43जिसे Milvus के संस्थापकों द्वारा बनाया गया है, जो एक बहुत ही प्रदर्शनकारी वेक्टर डेटाबेस है।
00:00:47यह MCP द्वारा आपके एजेंट से जुड़ता है, तो इसका मतलब है कि यह किसी भी एजेंट हार्नेस के साथ काम कर सकता है और
00:00:52सिर्फ Claude कोड के साथ ही नहीं।
00:00:54लेकिन यह आपके कोड को आसानी से खोजने योग्य बनाने के लिए तीन काफी जटिल काम करता है।
00:00:58पहला, यह सभी कोड को पार्स करने के लिए TreeSitter का उपयोग करता है, फ़ंक्शंस और क्लासेस के चंक्स बनाता है
00:01:03और यह TypeScript, Python, Rust और Go सहित नौ भाषाओं का समर्थन करता है।
00:01:08फिर यह JSON स्नैपशॉट के साथ प्रत्येक फ़ाइल को हैश करने के लिए एक कस्टम Merkle DAG का उपयोग करता है, जिसका मतलब है कि यह केवल उन्हीं फ़ाइलों को दोबारा इंडेक्स करता है
00:01:15जो बदल गई हैं, न कि पूरे कोडबेस को।
00:01:18और फिर जब आप वास्तव में कोड के माध्यम से खोजना चाहते हैं, तो यह दो अलग-अलग प्रकार की खोज करता है
00:01:22एक ही समय पर, कोड के सिमेंटिक अर्थ को खोजने के लिए एक वेक्टर सर्च, और एक BM25 इंडेक्स
00:01:29सटीक कीवर्ड मिलान के लिए सर्च।
00:01:31यह सब 40% तक कॉन्टेक्स्ट रिडक्शन में परिणामित होता है, जो बड़े कोडबेस के लिए बहुत बड़ी बात है।
00:01:37वास्तव में, आइए इसे VS Code कोडबेस पर टेस्ट करके देखते हैं, जिसमें
00:01:42लगभग 1.5 मिलियन लाइन का कोड है।
00:01:44तो क्लोन किए गए VS Code रेपो के अंदर, मैं GLM5 Turbo के साथ Open Code का उपयोग करने जा रहा हूँ क्योंकि
00:01:50मैं अपनी Claude Pro साप्ताहिक सीमा को खत्म नहीं करना चाहता।
00:01:53और MCP सर्वर सेटअप करने के लिए, जिसे आप यहाँ देख सकते हैं, मैंने पहले ही
00:01:58अपनी Open Code JSON फ़ाइल में प्रासंगिक जानकारी जोड़ दी है।
00:02:01और इस जानकारी के लिए, आप Milvus को स्थानीय रूप से चला सकते हैं, लेकिन मैंने Zilliz क्लाउड का उपयोग किया है।
00:02:06तो मुझे यहाँ से अपनी API की मिली, और मैंने एक क्लस्टर बनाया।
00:02:10तो यह एक AWS क्लस्टर है और यहाँ से पब्लिक एंडपॉइंट्स मिले।
00:02:14अब जब हम क्लस्टर पर हैं, मैंने पहले मुफ़्त वाला उपयोग करने की कोशिश की, लेकिन मुझे बार-बार
00:02:19टाइम आउट की समस्याएँ आ रही थीं।
00:02:20तो मुझे एक सर्वरलेस क्लस्टर लेना पड़ा, जो पैसे तो लेता है, लेकिन उसने बेहतर काम किया।
00:02:25अब एक बार जब आपने MCP सर्वर सेटअप कर लिया है, तो सुनिश्चित करें कि आप नोड का ऐसा वर्ज़न चला रहे हैं जो
00:02:2824 से कम, लेकिन 20 से ऊपर या उसके बराबर हो।
00:02:31मैं अभी इस प्रोजेक्ट के लिए वर्ज़न 22 का उपयोग कर रहा हूँ।
00:02:34और वह आपको चार MCP टूल्स तक पहुँच देगा, इंडेक्स कोड, सर्च कोड, क्लियर इंडेक्स, और गेट
00:02:39इंडेक्स स्टेटस।
00:02:40अब पहली चीज़ जो आपको करनी है वह है कोडबेस को इंडेक्स करना और हम इसे इस प्रॉम्प्ट के साथ कर सकते हैं।
00:02:44लेकिन एंटर दबाने से पहले, आइए देखते हैं कि हमने OpenAI से एम्बेडिंग पर अब तक कितने पैसे खर्च किए हैं
00:02:48जो केवल एक सेंट है और वह मेरे द्वारा 23,000 लाइन के कोडबेस को टेस्ट करने के लिए था।
00:02:53हम अपने क्लस्टर में भी देख सकते हैं कि हमारे पास पहले से ही कोडबेस की जानकारी है जो इंडेक्स की गई थी।
00:02:58तो अब अगर हम इस कोडबेस को इंडेक्स करते हैं, तो इसमें कुछ समय लगता है और बैकग्राउंड में इंडेक्सिंग शुरू होती है।
00:03:02इस बिंदु पर, मैं कोई भी सर्च करने की सलाह नहीं देता।
00:03:03अब क्योंकि यह एक बड़ा कोडबेस है, इसे इंडेक्स होने में थोड़ा समय लगेगा।
00:03:05तो मैं बाद में वापस आऊंगा जब इंडेक्सिंग पूरी हो जाएगी।
00:03:09और लगभग 50 मिनट के बाद, इंडेक्सिंग पूरी हो गई है और हम देख सकते हैं कि हमारे क्लस्टर में 223,000 से अधिक लोडेड एंट्रीज़ के साथ
00:03:11एक नया चंक है।
00:03:16और संदर्भ के लिए, जिस कोड के साथ मैं टेस्ट कर रहा था जिसमें 23,000 लाइन का कोड था, उसमें लगभग
00:03:211,000 लाइन की एंट्रीज़ हैं और उसे इंडेक्स करने में एक मिनट से भी कम समय लगा।
00:03:27और हमारे OpenAI उपयोग के साथ, हम एक सेंट से $1.06 पर पहुँच गए हैं, जो बहुत है, लेकिन मैं
00:03:32नहीं मानता कि 1.5 मिलियन लाइन के कोड को देखना कोई ऐसी चीज़ है जो लोग नियमित रूप से करेंगे।
00:03:38ठीक है, देखते हैं कि सर्च करना कितना तेज़ है।
00:03:42यहाँ हमारे पास Claude Context MCP सर्वर का उपयोग करने वाले Open Code का एक इंस्टेंस है, और यहाँ
00:03:45हमारे पास बिना MCP सर्वर वाला एक इंस्टेंस है।
00:03:49तो यह कोड के माध्यम से सर्च करने के लिए नियमित grep और glob टूल्स का उपयोग करेगा।
00:03:52और हम इसे यह प्रॉम्प्ट देंगे कि इस प्रोजेक्ट के शुरू होने पर एंट्री पॉइंट खोजने के लिए Claude Context का उपयोग करें।
00:03:56आइए देखें कि इसमें कितना समय लगता है।
00:04:00ठीक है, तो यह इंडेक्स टूल का उपयोग कर रहा है और अब यह सर्च टूल का उपयोग कर रहा है।
00:04:01और पूरे प्रोजेक्ट को सर्च करने और मुख्य .ts फ़ाइल को खोजने में लगभग 19 सेकंड लगे।
00:04:02और अब हम इस Open Code को एक समान प्रॉम्प्ट देने जा रहे हैं और यह 14 सेकंड में रिस्पॉन्स ढूंढ लेता है।
00:04:06तो ऐसा है कि इस क्वेरी के लिए, केवल नियमित GLM का उपयोग करना बहुत तेज़ है।
00:04:10आइए एक नया सेशन शुरू करते हैं।
00:04:11और फिर मैं इसे एक नया प्रॉम्प्ट देने जा रहा हूँ कि कौन सा फ़ंक्शन एक नई बिना शीर्षक वाली डॉक्यूमेंट खोलता है।
00:04:15इसने 40 सेकंड में थोड़ा अधिक समय लिया और लाइन नंबर के साथ मुख्य फ़ंक्शन ढूंढ लिया
00:04:16और लगभग 23K टोकन का उपयोग किया।
00:04:20और दूसरे इंस्टेंस ने इसे 12 सेकंड में किया और 18K टोकन का उपयोग किया, लेकिन ऐसा लगता है कि उसने एक अलग फ़ाइल खोजी।
00:04:21वास्तव में, Claude Context एडिटर खोलने से संबंधित कोड और अन्य फ़ाइलें दिखाकर कहीं अधिक जानकारी देता है।
00:04:26तो मैं उन दोनों से मुझे सटीक कोड दिखाने के लिए कहूँगा।
00:04:30और इस बिंदु पर, Claude Context 23 सेकंड में कोड के साथ जवाब देता है और नॉन-Claude Context ओपन कोड
00:04:3249 सेकंड में जवाब देता है, समय का लगभग दोगुना।
00:04:37और यह उसी सटीक कोड पर पहुँचता है जिस पर Claude Context पहुँचा था, जो मुझे एक विचार देता है।
00:04:38मैं इसे एक और व्यापक सामान्य प्रॉम्प्ट देने जा रहा हूँ कि कोड के माध्यम से देखें और मुझे बताएं कि यह प्रोजेक्ट कैसे काम करता है।
00:04:44Claude Context 41K टोकन का उपयोग करके 49 सेकंड में समाप्त होता है, और दूसरा इंस्टेंस तेज़ी से समाप्त होता है और कम टोकन का उपयोग करता है।
00:04:45लेकिन अगर हम उत्पादित आउटपुट पर एक नज़र डालें, तो हम देख सकते हैं कि Claude Context से बहुत अधिक विवरण है जो लेयर्ड आर्किटेक्चर देता है और यहाँ तक कि इलेक्ट्रॉन ऐप और उन प्रक्रियाओं के बारे में भी कुछ जानकारी देता है जिनका वह उपयोग करता है।
00:04:48और नॉन-Claude Context विकल्प भी कुछ आर्किटेक्चर जानकारी देता है, लेकिन यह दूसरे वाले जितना विस्तृत नहीं है।
00:04:52वास्तव में, मैं जानता हूँ कि ऐसा नहीं लग रहा है, लेकिन मैं कहूँगा कि Claude Context कोड जानकारी को बहुत तेज़ी से और बहुत विस्तार से प्राप्त करने में बहुत अच्छा है।
00:04:56मेरा मतलब है, इसे देखो।
00:05:00तो इस प्रॉम्प्ट से, मैंने इलेक्ट्रॉन ऐप में मुख्य प्रक्रिया के बारे में अधिक जानकारी देने के लिए एक फ़ॉलो-अप प्रॉम्प्ट पूछा, जिसे उसने यहाँ बताया था।
00:05:04तो इस प्रॉम्प्ट को पूछने के बाद, इसमें लगभग 1 मिनट 47 सेकंड लगे, लेकिन उस सारे विवरण को देखें।
00:05:06तो यह बूट सीक्वेंस के साथ शुरू हुआ और फिर चरण एक, यानी सर्विस निर्माण और सर्विस इनिशियलाइज़ेशन।
00:05:11और हमारे पास चरण दो से बहुत कुछ है, प्रासंगिक फ़ाइलों के संदर्भों के साथ कोड एप्लिकेशन ऐप।
00:05:13तो हमारे पास app TS लाइन 185 है, और हम और भी आगे बढ़ सकते थे।
00:05:17जबकि Claude Context के बिना, OpenCode अभी भी सब-एजेंटों का उपयोग करके सभी फ़ाइलों के माध्यम से जा रहा है।
00:05:22और यह थोड़ा भ्रामक है क्योंकि हम यह नहीं देख सकते कि प्रत्येक सब-एजेंट कितने टोकन का उपयोग कर रहा है।
00:05:23लेकिन अगर हम थोड़ी देर प्रतीक्षा करें और वापस आएं, तो हम देख सकते हैं कि लगभग पांच मिनट के बाद, OpenCode इलेक्ट्रॉन प्रक्रिया के बारे में बहुत सारी जानकारी के साथ जवाब देता है, लेकिन यह उतना नहीं है जितना Claude Context ने प्रदान किया था, और इसमें पांच गुना अधिक समय लगा।
00:05:28अब, हाँ, शायद अगर मैंने उच्च प्रयास के साथ Opus 4.7 जैसे स्मार्ट मॉडल का उपयोग किया होता, तो उसे अधिक जानकारी मिलती, लेकिन इसमें अभी भी बहुत समय लगता और बहुत अधिक टोकन का उपयोग होता।
00:05:30और ये उस तरह के अंतर हैं, तो पांच मिनट और एक मिनट जो मैं रिकॉर्डिंग से पहले 23K लाइन कोडबेस के साथ टेस्ट करते समय देख रहा था।
00:05:34तो अंत में, यह कहना मुश्किल है कि स्पष्ट विजेता कौन है।
00:05:37मेरा मतलब है, Claude Context ने हमेशा अधिक विवरण प्रदान किया, लेकिन यह हमेशा सबसे तेज़ और सबसे टोकन कुशल नहीं था।
00:05:38और बड़े कोडबेस के लिए, इसे इंडेक्स करने में बहुत लंबा समय लगा।
00:05:43हालाँकि, औसत आकार के कोडबेस के लिए, यानी 20 से 30,000 लाइन का कोड, इंडेक्सिंग समय वास्तव में तेज़ है।
00:05:47और जब परिणामों की बात आती है तो विवरण में अंतर बहुत स्पष्ट है।
00:05:52वास्तव में, मैं कहूँगा कि मैं बड़े कोडबेस पर उपयोग करने की तुलना में औसत आकार के कोडबेस के लिए Claude Context का उपयोग करना बहुत पसंद करूँगा।
00:05:53तो यह सोचने वाली बात है।
00:05:58लेकिन ईमानदारी से कहूँ तो, यह Zilliz के लिए एक बेहतरीन सेल्स टूल से अधिक है क्योंकि Claude Context का उपयोग करने से पहले, मैंने कभी उनके बारे में नहीं सुना था और अब उनके पास एक नया भुगतान करने वाला ग्राहक है।
00:05:59लेकिन भले ही इसे सेटअप करने में कुछ समय लगा और बड़े कोडबेस को इंडेक्स करने में बहुत लंबा समय लगा।
00:06:04एक ऐसे व्यक्ति के रूप में जो नियमित रूप से ओपन सोर्स कोडबेस के माध्यम से जाता है और सवाल पूछता है, मुझे लगता है कि यह एक ऐसा टूल है जिसे मैं बहुत अधिक उपयोग करने जा रहा हूँ।
00:06:05मेरा मतलब है एक औसत आकार के कोडबेस के लिए, सर्वरलेस प्लान बहुत महंगा नहीं है क्योंकि OpenAI एम्बेडिंग पर भी बहुत अधिक खर्च नहीं होता है।
00:06:10तो मुझे इस पर खर्च करने में खुशी है।
00:06:15डेटा पुनर्प्राप्ति और AI की बात करते हुए।
00:06:16यदि आप सीखना चाहते हैं कि स्क्रैच से वास्तव में काम करने वाला एक बहुत अच्छा RAG सिस्टम कैसे बनाया जाए, तो Andris का यह वीडियो देखें।
00:06:21और यदि आप स्टार वार्स के प्रशंसक हैं, तो आप विशेष रूप से इस वीडियो को पसंद करने वाले हैं।
00:06:22लेकिन अगर हम थोड़ी देर प्रतीक्षा करें और वापस आएं, तो हम देख सकते हैं कि लगभग पांच मिनट के बाद, OpenCode
00:06:26इलेक्ट्रॉन प्रक्रिया के बारे में बहुत सारी जानकारी के साथ जवाब देता है, लेकिन यह उतना नहीं है
00:06:31जितना Claude Context ने प्रदान किया था, और इसमें पांच गुना अधिक समय लगा।
00:06:34अब, हाँ, शायद अगर मैंने उच्च प्रयास के साथ Opus 4.7 जैसे स्मार्ट मॉडल का उपयोग किया होता, तो उसे
00:06:40अधिक जानकारी मिलती, लेकिन इसमें अभी भी बहुत समय लगता और बहुत अधिक टोकन का उपयोग होता।
00:06:44और ये उस तरह के अंतर हैं, तो पांच मिनट और एक मिनट जो मैं देख रहा था जब
00:06:48मैं रिकॉर्डिंग से पहले 23K लाइन कोडबेस के साथ टेस्ट कर रहा था।
00:06:51तो अंत में, यह कहना मुश्किल है कि स्पष्ट विजेता कौन है।
00:06:54मेरा मतलब है, Claude Context ने हमेशा अधिक विवरण प्रदान किया, लेकिन यह हमेशा सबसे तेज़ और
00:07:00सबसे टोकन कुशल नहीं था।
00:07:01और बड़े कोडबेस के लिए, इसे इंडेक्स करने में बहुत लंबा समय लगा।
00:07:05हालाँकि, औसत आकार के कोडबेस के लिए, यानी 20 से 30,000 लाइन का कोड, इंडेक्सिंग समय
00:07:10वास्तव में तेज़ है।
00:07:11और जब परिणामों की बात आती है तो विवरण में अंतर बहुत स्पष्ट है।
00:07:14वास्तव में, मैं कहूँगा कि मैं बड़े कोडबेस पर उपयोग करने की तुलना में
00:07:20औसत आकार के कोडबेस के लिए Claude Context का उपयोग करना बहुत पसंद करूँगा।
00:07:22तो यह सोचने वाली बात है।
00:07:23लेकिन ईमानदारी से कहूँ तो, यह Zilliz के लिए एक बेहतरीन सेल्स टूल से अधिक है क्योंकि Claude
00:07:27Context का उपयोग करने से पहले, मैंने कभी उनके बारे में नहीं सुना था और अब उनके पास एक नया भुगतान करने वाला ग्राहक है।
00:07:31लेकिन भले ही इसे सेटअप करने में कुछ समय लगा और बड़े कोडबेस को इंडेक्स करने में बहुत
00:07:36लंबा समय लगा।
00:07:37एक ऐसे व्यक्ति के रूप में जो नियमित रूप से ओपन सोर्स कोडबेस के माध्यम से जाता है और सवाल पूछता है, मुझे लगता है कि
00:07:42यह एक ऐसा टूल है जिसे मैं बहुत अधिक उपयोग करने जा रहा हूँ।
00:07:44मेरा मतलब है एक औसत आकार के कोडबेस के लिए, सर्वरलेस प्लान बहुत महंगा नहीं है क्योंकि
00:07:49OpenAI एम्बेडिंग पर भी बहुत अधिक खर्च नहीं होता है।
00:07:52तो मुझे इस पर खर्च करने में खुशी है।
00:07:53डेटा पुनर्प्राप्ति और AI की बात करते हुए।
00:07:55यदि आप सीखना चाहते हैं कि स्क्रैच से वास्तव में काम करने वाला एक बहुत अच्छा RAG सिस्टम कैसे बनाया जाए जो वास्तव में
00:07:59काम करता है, तो Andris का यह वीडियो देखें।
00:08:02और यदि आप स्टार वार्स के प्रशंसक हैं, तो आप विशेष रूप से इस वीडियो को पसंद करने वाले हैं।