Karpathy का Obsidian RAG + Claude Code = CHEAT CODE

CChase AI
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00आंद्रे कारपैथी ने अभी-अभी हमें
00:00:02अपने व्यक्तिगत ओब्सीडियन RAG सिस्टम की चाबियाँ दी हैं।
00:00:06और मैं RAG को एयर कोट्स में रख रहा हूँ
00:00:07क्योंकि इस ओब्सीडियन आधारित नॉलेज बेस में
00:00:10कोई वेक्टर डेटाबेस नहीं है, कोई एम्बेडिंग्स नहीं है
00:00:12और कोई जटिल रिट्रीवल प्रक्रिया भी नहीं है।
00:00:15फिर भी यह ठीक उसी समस्या को हल करता है
00:00:17जिसे ये अधिक जटिल RAG स्ट्रक्चर हल करने का दावा करते हैं,
00:00:21जो कि हमारे लार्ज लैंग्वेज मॉडल को
00:00:23बड़ी मात्रा में दस्तावेजों को संभालने, सवालों के जवाब देने
00:00:27और उनके बारे में सटीक जानकारी जुटाने में सक्षम बनाना है।
00:00:30और इस ओब्सीडियन आधारित सिस्टम की सबसे अच्छी बात यह है
00:00:32कि यह बहुत हल्का है, यह अनिवार्य रूप से मुफ्त है
00:00:36और यह एक सोलो ऑपरेटर या छोटी टीम के लिए
00:00:38एकदम सही बीच का रास्ता है।
00:00:41तो आज मैं आपको दिखाने जा रहा हूँ
00:00:42कि कारपैथी का ओब्सीडियन नॉलेज सिस्टम कैसे काम करता है,
00:00:45इसे खुद कैसे सेटअप करें
00:00:46और यह पारंपरिक RAG सिस्टम से कैसे अलग है
00:00:50ताकि आप जान सकें कि क्या यह आपके लिए सही विकल्प है।
00:00:52तो जिस प्रक्रिया से हम इस ओब्सीडियन आधारित
00:00:54नॉलेज सिस्टम को बनाने जा रहे हैं, उसे कल
00:00:58आंद्रे कारपैथी द्वारा एक काफी विस्तृत ट्विटर पोस्ट में बताया गया था।
00:01:02अब इस पोस्ट से मुख्य बात यह निकलती है
00:01:04कि हम ऐसे लार्ज लैंग्वेज मॉडल
00:01:05नॉलेज बेस बनाने में सक्षम हैं
00:01:07जो अनिवार्य रूप से उसी तरह काम करते हैं
00:01:09जैसे लाइट RAG या RAG एनीथिंग या ओब्सीडियन के साथ
00:01:12कोई भी अन्य ग्राफ RAG सिस्टम काम करता है।
00:01:17और हम इसे काफी सरल तरीके से कर सकते हैं
00:01:20बस अपने फाइल सिस्टम के एक चतुर स्ट्रक्चर
00:01:23और डेटा को वास्तव में इन्जेस्ट करने के तरीके के माध्यम से।
00:01:25और अंतिम परिणाम यह है कि मैं अपने ओब्सीडियन वॉल्ट में
00:01:28काफी महत्वपूर्ण मात्रा में डेटा और दस्तावेजों को
00:01:32शामिल करने और क्लॉड कोड (Claude Code) का उपयोग करके
00:01:35इसके बारे में सवाल पूछने,
00:01:36विभिन्न चीजों के बीच संबंध का पता लगाने में सक्षम हूँ,
00:01:38यानी ठीक वही काम जो आप
00:01:41एक पारंपरिक RAG सिस्टम के साथ करेंगे,
00:01:43लेकिन बिना किसी तामझाम के और बहुत सरल सेटअप के साथ।
00:01:46और जैसा कि आंद्रे बताते हैं, सेटअप कुछ इस तरह दिखता है।
00:01:49सबसे पहले, हमारे पास डेटा इन्जेशन है।
00:01:51हम लेख ला रहे हैं,
00:01:52हम शोध पत्र ला रहे हैं,
00:01:53हम इंटरनेट या कहीं से भी रेपो ला रहे हैं,
00:01:57और हम इसे एक "रॉ" (raw) डायरेक्टरी में ला रहे हैं
00:02:00जो हमारे ओब्सीडियन वॉल्ट के अंदर है।
00:02:02यह अनिवार्य रूप से वह स्टेजिंग एरिया है
00:02:03इससे पहले कि इसे विकी में बदला जाए।
00:02:05इस बातचीत में एक इंसान के रूप में हम
00:02:07ओब्सीडियन के माध्यम से यह सब होते हुए देख सकते हैं।
00:02:10ओब्सीडियन हर तरह से हमारा फ्रंट एंड है।
00:02:13यहाँ मैं देख सकता हूँ कि सभी दस्तावेज़ कैसे रखे गए हैं।
00:02:15यहाँ मैं सभी विकी पढ़ सकता हूँ।
00:02:17तो यह किसी ब्लैक बॉक्स की तरह छिपा हुआ नहीं है,
00:02:20जैसे कि कोई RAG सिस्टम होता है।
00:02:21लाइट RAG जैसे ग्राफ RAG सेटअप में भी यह काफी कठिन होता है,
00:02:25कि वास्तव में इसके अंदर जाकर सब कुछ देख सकें।
00:02:29मेरा मतलब है, मैं देख सकता हूँ, लेकिन यह जितना भी कूल लगे,
00:02:31यह बहुत कुशल नहीं है।
00:02:33और वहाँ से, आप क्लॉड कोड जैसी
00:02:35किसी चीज़ के माध्यम से बस प्रश्न-उत्तर करते हैं।
00:02:37और जैसा कि आंद्रे ने यहाँ बताया,
00:02:38उन्हें उम्मीद थी कि उन्हें RAG जैसी
00:02:40किसी चीज़ की ज़रूरत पड़ेगी,
00:02:42लेकिन लार्ज लैंग्वेज मॉडल इंडेक्स फाइलों को ऑटो-मेंटेन करने
00:02:43और उसके द्वारा पढ़े गए सभी दस्तावेजों का
00:02:45संक्षिप्त सारांश रखने में काफी अच्छा रहा है।
00:02:47और यह कुछ ऐसा है जो हम भी कर पाएंगे
00:02:49एक बहुत ही सरल Claude.md फाइल के साथ,
00:02:52जो मैं आपको दूंगा।
00:02:53और आप उस Claude.md को पा सकेंगे,
00:02:55साथ ही एक लिखित गाइड भी
00:02:56जिसमें बहुत सारे प्रॉम्प्ट्स हैं,
00:02:57जो मेरी मुफ्त Chase AI कम्युनिटी के अंदर है।
00:03:00उसका एक लिंक
00:03:01इस वीडियो के डिस्क्रिप्शन में होगा।
00:03:03और Chase AI की बात करें तो, और आप जानते थे कि यह आने वाला है,
00:03:06मेरे क्लॉड कोड मास्टरक्लास के लिए एक छोटा सा प्लग।
00:03:08इसे अभी कुछ हफ़्तों पहले ही रिलीज़ किया है,
00:03:09और यह ज़ीरो से AI देव बनने के लिए नंबर वन जगह है,
00:03:12खासकर यदि आप तकनीकी बैकग्राउंड से नहीं आते हैं।
00:03:15आप इसका लिंक पिन किए गए कमेंट में पा सकते हैं।
00:03:18तो सुनिश्चित करें कि आप इसे देखें।
00:03:19यदि आप इस टूल को सीखने के प्रति गंभीर हैं।
00:03:22अब, इससे पहले कि हम इस ओब्सीडियन सिस्टम को
00:03:24सेटअप करने की बारीकियों में जाएँ,
00:03:28आइए वास्तविक फाइल स्ट्रक्चर को देखें
00:03:30क्योंकि यह समझना महत्वपूर्ण है कि
00:03:32डेटा हमारे वॉल्ट में कैसे आ रहा है
00:03:34और फिर विकी में कैसे बदल रहा है।
00:03:36तो ओब्सीडियन वॉल्ट वह जगह है जहाँ सब कुछ रहता है।
00:03:39जैसा कि आप देखेंगे, यदि आपने इसे पहले कभी उपयोग नहीं किया है,
00:03:41जब आप ओब्सीडियन डाउनलोड करते हैं,
00:03:42तो आप एक विशिष्ट फोल्डर को वॉल्ट के रूप में नामित करेंगे।
00:03:45मेरे मामले में, इसे सचमुच "the vault" कहा जाता है।
00:03:48यहीं ओब्सीडियन की हर चीज़ रहती है।
00:03:50वॉल्ट के एक सब-फोल्डर के रूप में,
00:03:52हमारे पास "raw" फोल्डर होगा।
00:03:54raw फोल्डर वह जगह है जहाँ हमारा सारा रिसर्च डाला जाता है।
00:03:58जो कुछ भी हम इन विकी में मैन्युअल रूप से शामिल करना चाहते हैं, उसे यहाँ रखा जाता है।
00:04:01यह अनिवार्य रूप से स्टेजिंग फोल्डर है।
00:04:02तो यहाँ सारा रॉ डेटा रखा जाएगा।
00:04:05यह मार्कडाउन फाइलें हो सकती हैं।
00:04:06यह PDF भी हो सकती हैं।
00:04:07और मैं आपको दिखाने जा रहा हूँ कि ओब्सीडियन क्लिपर का उपयोग करके
00:04:10कैसे किसी भी वेबपेज को मार्कडाउन फाइल में बदलकर
00:04:14स्वचालित रूप से raw फोल्डर में भेजा जा सकता है।
00:04:16हमारे पास एक और सब-फोल्डर होगा
00:04:18जो "Wiki" फोल्डर है।
00:04:19तो लार्ज लैंग्वेज मॉडल जो करने वाला है,
00:04:21क्लॉड कोड हमारे लिए ऑन-डिमांड जो करेगा,
00:04:24या आप इसे एक स्किल या स्वचालित भी बना सकते हैं,
00:04:27वह यह है कि हम इसे raw फोल्डर की ओर इशारा करेंगे और कहेंगे,
00:04:29"अरे, मैं चाहता हूँ कि तुम उस विषय पर एक विकी बनाओ
00:04:33जिसके बारे में तुम जानकारी इकट्ठा कर रहे हो।"
00:04:35वहाँ से, यह फिर उसके बारे में एक विकी बनाएगा।
00:04:37तो आप देख सकते हैं कि हमारे पास यहाँ तीन अलग-अलग विकी हैं,
00:04:41एक AI एजेंट के लिए, एक RAG सिस्टम के लिए,
00:04:43और एक कंटेंट क्रिएशन के लिए।
00:04:45अब, विकी फोल्डर और इन सब-विकी फोल्डर्स के बीच
00:04:50मास्टर इंडेक्स मार्कडाउन है।
00:04:53यह अनिवार्य रूप से उन सभी अलग-अलग विकी की
00:04:54सिर्फ एक सूची है जो बनाई गई हैं।
00:04:58क्योंकि विचार यह है कि जब आप—यह आप हैं—
00:05:02जब आप क्लॉड कोड से बात करते हैं, ठीक है,
00:05:04वह वहाँ क्लॉड कोड है, और कहते हैं,
00:05:06"अरे, मैं AI एजेंट के बारे में और जानना चाहता हूँ।
00:05:08क्या आप पूछ सकते हैं, मैं अपने विकी के बारे में सवाल पूछना चाहता हूँ।"
00:05:12तो, यह क्या करने वाला है?
00:05:13खैर, यह वॉल्ट में जाएगा
00:05:15क्योंकि आप शायद पहले से ही वहाँ हैं।
00:05:17यह फिर विकी फोल्डर में जाएगा।
00:05:18यह मास्टर इंडेक्स फोल्डर में जाएगा और कहेगा,
00:05:21"अरे, हमने कौन से विकी बनाए हैं?
00:05:23ओह, वह RAG सिस्टम के बारे में जानना चाहता है।"
00:05:26ठीक है, यह RAG पर नीचे जाता है।
00:05:28और विकी फोल्डर्स में खुद इंडेक्स फाइलें होती हैं
00:05:31जो सभी अतिरिक्त कंटेंट का विवरण देती हैं।
00:05:33तो ओब्सीडियन हमें जो देता है
00:05:35और यह फाइल स्ट्रक्चर हमें जो देता है
00:05:36वह जानकारी खोजने का एक बहुत ही स्पष्ट रास्ता है,
00:05:39भले ही हमारे पास बहुत सारी जानकारी इधर-उधर बिखरी हो।
00:05:41और इससे क्लॉड कोड को मदद मिलती है
00:05:42क्योंकि उसे डेटा खोजने में
00:05:45ज़्यादा दिक्कत नहीं होने वाली है।
00:05:46हम यह देखने के लिए कि हमारे फाइल स्ट्रक्चर में क्या है,
00:05:48लाखों टूल कॉल्स नहीं चलाने वाले हैं।
00:05:50लेकिन इससे आपको भी मदद मिलती है क्योंकि यह बहुत स्पष्ट है कि कहाँ जाना है।
00:05:52उदाहरण के लिए, यहाँ बाईं ओर मेरा ओब्सीडियन फोल्डर है।
00:05:56मैं ओब्सीडियन UI में हूँ,
00:05:57और हम एक सेकंड में डाउनलोड प्रक्रिया देखेंगे।
00:05:59लेकिन अगर मैं एक विकी देखना चाहता हूँ, तो मैं क्या करूँ?
00:06:01मैं बस विकी पर जाता हूँ।
00:06:03मेरे पास एक मास्टर इंडेक्स है
00:06:04जो वहां मौजूद हर चीज को सूचीबद्ध करता है।
00:06:06अभी, यह सिर्फ तीन चीजें हैं।
00:06:07लेकिन अगर 3,000 भी होतीं, तो भी यह बहुत मुश्किल नहीं होता।
00:06:10और फिर वहां से, आप जानते हैं, मैं इस पर क्लिक कर सकता हूं।
00:06:12यह मुझे उस विशिष्ट विकी के इंडेक्स पर ले जाता है।
00:06:16और फिर मैं उसके अंदर अलग-अलग चीजें देख सकता हूं।
00:06:18यह इतना सरल है।
00:06:19और यह AI के लिए भी उतना ही सरल है,
00:06:21इसीलिए हम अनिवार्य रूप से बस एक
00:06:22मार्कडाउन फाइल स्ट्रक्चर का उपयोग कर पा रहे हैं
00:06:24जो कुछ हद तक एक RAG सिस्टम की नकल करता है।
00:06:27तो हालांकि वह सिद्धांत कूल है,
00:06:28अब आइए देखें कि इसे वास्तव में अपने लिए कैसे सेटअप करना है।
00:06:31सबसे पहले और सबसे महत्वपूर्ण, आपको ओब्सीडियन डाउनलोड करना होगा।
00:06:33आप बस obsidian.md पर जाएंगे, 'Download Now' पर क्लिक करेंगे,
00:06:37और विज़ार्ड का पालन करेंगे।
00:06:38यह पूरी तरह से मुफ्त है।
00:06:40और आप किसी फोल्डर को वॉल्ट के रूप में नामित करेंगे।
00:06:43बस एक बनाएं, उसे "the vault" कहें।
00:06:45यह मेरे लिए आसान बनाता है, और यह शायद आपके लिए भी काम करेगा।
00:06:47वॉल्ट बनाने के बाद,
00:06:49अब हमें इसके अंदर यह फाइल स्ट्रक्चर सेटअप करना होगा।
00:06:52इसे करने का सबसे आसान तरीका क्लॉड कोड के साथ है।
00:06:54वॉल्ट में बस क्लॉड कोड खोलें।
00:06:57तो मैं उसी डायरेक्टरी में हूँ।
00:06:59और आप इसे एक प्रॉम्प्ट देंगे
00:07:01जो इसे यह फाइल स्ट्रक्चर बनाने के लिए कहेगा।
00:07:03अब, सौभाग्य से आपके लिए, मैंने पहले ही प्रॉम्प्ट बना लिया है।
00:07:05तो आप बस इसे कॉपी करके क्लॉड कोड में पेस्ट कर सकते हैं।
00:07:08अब, यदि आप मेरी तरह हैं और आप पहले से ही
00:07:10काफी समय से ओब्सीडियन का उपयोग कर रहे हैं, तो आपके पास
00:07:13पहले से ही वहां बहुत सारे फोल्डर होंगे।
00:07:14तो शायद आप इसे raw नहीं कहना चाहेंगे।
00:07:17शायद आप इसे कुछ और कहना चाहें।
00:07:18इसका पूरा मतलब यह है कि आपको बस
00:07:20किसी फोल्डर को, जैसा कि मैंने कहा, एक होल्डिंग एरिया
00:07:23या स्टेजिंग एरिया के रूप में नामित करना होगा जहाँ यह सारी जानकारी
00:07:25तब तक डाली जाएगी जब तक कि इसे विकी में नहीं बदल दिया जाता।
00:07:27तो आवश्यकतानुसार बस इसे एडजस्ट करें।
00:07:28अब, अगली चीज़ जो हम करना चाहते हैं वह है एक Claude.md फाइल बनाना।
00:07:31पर्सनल असिस्टेंट जैसे प्रोजेक्ट्स, इस तरह की चीजें
00:07:33जो बहुत अधिक मार्कडाउन हैवी होती हैं, उनके लिए Claude.mds एकदम सही हैं।
00:07:37और यह Claude.md फाइल नॉलेज बेस के नियमों,
00:07:40के साथ-साथ इसे मूल रूप से कैसे नेविगेट करना है,
00:07:41उसका विवरण दे रही है।
00:07:43ताकि फिर से, जब हम सवाल पूछें
00:07:44तो हम टोकन बर्बाद न कर रहे हों।
00:07:46फिर से, मेरे पास यह पूरा Claude.md टेम्पलेट प्रॉम्प्ट है
00:07:50जिसे आप उपयोग कर सकते हैं।
00:07:50यह Claude.md फ़ाइल Claude को यह भी बता रही है
00:07:53कि इन मार्कडाउन फ़ाइलों को कैसे व्यवस्थित करना है।
00:07:55इसलिए इस विकी लिंक फॉर्मेट के साथ
00:07:58फ़ाइलों को खोजना बहुत आसान हो जाता है।
00:08:00अब बात करते हैं कि हम इस रॉ (raw) फ़ोल्डर में
00:08:02चीज़ें कैसे ला सकते हैं।
00:08:03हम अपने सिस्टम में डेटा कैसे डाल सकते हैं।
00:08:06खैर, ऐसा करने का एक बहुत आसान तरीका
00:08:08Obsidian वेब क्लिपर है।
00:08:10तो मैं इसका लिंक स्कूल में डाल दूँगा,
00:08:13या आप obsidian.md/clipper पर जा सकते हैं।
00:08:16और यह बस एक क्रोम एक्सटेंशन है,
00:08:18जो किसी भी वेबपेज को डेटा में, यानी एक मार्कडाउन फ़ाइल में
00:08:22बदलना बहुत आसान बना देता है।
00:08:23अब, इस वेब क्लिपर के साथ एक समस्या यह है
00:08:25कि इसे इमेज लाने में मुश्किल होगी।
00:08:26यह उन्हें लाएगा ही नहीं।
00:08:27वे बस एक लिंक की तरह होंगे।
00:08:29लेकिन मैं इन दस्तावेज़ों की इमेजेस को भी देखना चाहता हूँ
00:08:31जिन्हें मैं Obsidian के अंदर डालता हूँ।
00:08:33तो हम क्या करें?
00:08:34खैर, हम इसमें मदद के लिए Obsidian कम्युनिटी स्किल
00:08:37या Obsidian कम्युनिटी प्लगइन का उपयोग करेंगे।
00:08:39तो Obsidian की शानदार चीज़ों में से एक है
00:08:41इसके कम्युनिटी प्लगइन्स।
00:08:42ऐसे हज़ारों प्लगइन्स हैं।
00:08:43तो अगर आप Obsidian के अंदर हैं,
00:08:46मैं अभी डेस्कटॉप ऐप के अंदर हूँ।
00:08:47अगर मैं यहाँ नीचे आकर इस छोटे गियर आइकॉन पर क्लिक करूँ,
00:08:50तो मैं कम्युनिटी प्लगइन्स पर जाऊँगा।
00:08:52मैं ब्राउज़ पर जाऊँगा।
00:08:54और फिर आप "local images plus" सर्च करेंगे।
00:08:56आप इसे डाउनलोड करेंगे, इंस्टॉल करेंगे और चालू करेंगे।
00:09:00सुनिश्चित करें कि यह सक्षम (enabled) है।
00:09:01आप इसकी पुष्टि कर सकते हैं
00:09:03अपने कम्युनिटी प्लगइन्स टैब पर जाकर
00:09:05और यह देखकर कि यह छोटा बटन चालू है।
00:09:08अब, अगर हम Obsidian वेब क्लिपर का उपयोग करते हैं,
00:09:11और मैं उसे यहाँ एक एक्सटेंशन के रूप में देख सकता हूँ,
00:09:13तो आप देख सकते हैं कि क्या होता है।
00:09:15यह तुरंत सब कुछ खींच लेता है।
00:09:17और अगर मैं "add to Obsidian" पर क्लिक करूँ,
00:09:19तो मैं इमेजेस के साथ यह पूरा लेख देख सकता हूँ।
00:09:21अब एक चीज़ है जिसे हमें सेट करना होगा
00:09:24वेब क्लिपर के अंदर,
00:09:25और वह यह सुनिश्चित करना है कि यह इसे
00:09:26अपने आप रॉ (raw) फ़ोल्डर में डाल दे।
00:09:29मैं इसे मैन्युअल रूप से नहीं करना चाहता।
00:09:30आप बस अपने वेब क्लिपर के विकल्पों (options) पर जाएँ।
00:09:34मैंने बस इस पर राइट क्लिक किया।
00:09:35और फिर यहाँ बाईं ओर, जहाँ "default" लिखा है,
00:09:38वहाँ मैंने अपना नया टेम्पलेट बनाया,
00:09:39लेकिन अगर आप चाहें तो डिफ़ॉल्ट पर ही रह सकते हैं,
00:09:42जहाँ लोकेशन और नोट लोकेशन यहाँ लिखी है।
00:09:47आप इसे "clippings" से बदलकर "raw" करना चाहेंगे।
00:09:52और इससे यह सुनिश्चित होगा कि जब आप वेब क्लिपर का उपयोग करें,
00:09:54तो वह अपने आप रॉ फ़ोल्डर में चला जाए।
00:09:56तो अब Obsidian वेब क्लिपर एक्सटेंशन
00:09:59और इमेजेस कम्युनिटी प्लगइन के साथ,
00:10:01हम इंटरनेट के किसी भी वेबपेज को
00:10:04एक मार्कडाउन फ़ाइल में बदल सकते हैं जिसका उपयोग हमारे विकी के लिए होगा।
00:10:08लेकिन यह केवल एक डेटा फ़नल है।
00:10:10यह एक मैन्युअल तरीका है।
00:10:11हम Claude Code से भी बहुत सारा भारी काम करवा सकते हैं।
00:10:14तो मान लीजिए कि मैं Claude Code की स्किल्स के बारे में
00:10:16एक विकी बनाने की कोशिश कर रहा था।
00:10:17तो मैंने Claude Code से कहा,
00:10:18"चलो Claude Code स्किल्स के बारे में एक विकी बनाते हैं।"
00:10:20मैंने पहले ही रॉ फ़ोल्डर में कुछ जानकारी डाल दी है,
00:10:23जो हमने वेब क्लिपर के ज़रिए निकाली थी।
00:10:25तुम खुद रिसर्च करो और प्रासंगिक रॉ
00:10:27MD फ़ाइलें लेकर आओ ताकि वह विकी बन सके।
00:10:29तो अब यह क्या करेगा?
00:10:30यह इंटरनेट पर जाएगा, अपने मानक वेब सर्च का उपयोग करेगा,
00:10:32और यह Claude Code स्किल्स के बारे में
00:10:36अपना खुद का विकी बनाएगा।
00:10:37तो आप देख रहे हैं कि यह रॉ फ़ोल्डर,
00:10:40यह पूरी रॉ पाइपलाइन, आपके लिए ज़्यादा है।
00:10:42यह तब के लिए है जब आप मुख्य रूप से कुछ जानकारी डालना चाहते हैं।
00:10:44अब आप Claude Code से भी ऐसा करवा सकते हैं,
00:10:46लेकिन Claude Code इतना स्मार्ट भी है कि वह रिसर्च को ले सके,
00:10:49खुद समझ सके कि क्या प्रासंगिक है
00:10:50और सीधे विकी बना दे।
00:10:53यह रॉ फ़ोल्डर वास्तव में आपके लिए है,
00:10:55एक इंसान के तौर पर कुछ स्तर का संगठन रखने के लिए।
00:10:58और Claude Code ने जो परिणाम दिया वह यहाँ है।
00:10:59तो उसने Claude Code स्किल्स विकी बना दिया।
00:11:02हम यहाँ मास्टर इंडेक्स में देखते हैं कि इसका संदर्भ यहाँ दिया गया है।
00:11:05अगर मैं इस पर क्लिक करूँ,
00:11:07तो यह हमें Claude Code स्किल्स के इंडेक्स पर ले जाता है।
00:11:10और अभी इसमें चार लेख हैं।
00:11:12तो यह रहा स्किल्स ओवरव्यू लेख।
00:11:15आप देख सकते हैं कि यह वेबसाइटों से लिंक करता है और यह
00:11:18हमारे Obsidian वॉल्ट के अंदर अलग-अलग लेखों से भी लिंक करता है।
00:11:21तो अगर मैं स्किल इकोसिस्टम पर क्लिक करूँ, तो यहाँ और भी चीज़ें हैं।
00:11:25मैं टॉप स्किल्स पर क्लिक करता हूँ, है ना? और इसी तरह।
00:11:27एक लेख से दूसरे लेख तक का रास्ता बहुत साफ है और
00:11:30ये चीज़ें कैसे आपस में जुड़ी हैं,
00:11:32जिसका मतलब है कि जब आप Claude Code से इन लेखों
00:11:34और इन विषयों के बारे में सवाल पूछते हैं,
00:11:35तो इसके लिए उनके जवाब देना आसान और सस्ता होता है,
00:11:39जो हमें इस ज़ाहिर सवाल पर ले आता है।
00:11:41क्या हमें RAG की बिल्कुल ज़रूरत है? आप जानते हैं,
00:11:43हम इस लाइट RAG सेटअप जैसी चीज़ को देखते हैं।
00:11:45आपने लाइट RAG और RAG के साथ मेरे पिछले कुछ वीडियो देखे होंगे,
00:11:48और यह देखकर कि Obsidian के साथ सेटअप कितना आसान है,
00:11:51आप शायद सोच रहे होंगे, खैर,
00:11:52मैं इन ज़्यादा जटिल सेटअपों के साथ
00:11:55परेशान ही क्यों होऊँ?
00:11:56और सच यह है कि यदि आप एक सोलो डेवलपर हैं,
00:11:59एक अकेले ऑपरेटर या एक छोटी टीम हैं जो
00:12:02हज़ारों दस्तावेज़ों के साथ काम नहीं कर रही है,
00:12:04तो जवाब शायद यह है कि आपके लिए Obsidian ज़्यादा सही है।
00:12:08यह हल्का है और आपको सच में RAG की ज़रूरत नहीं है।
00:12:11ये बड़े लैंग्वेज मॉडल्स,
00:12:12Claude Code जैसे हार्नेस आपके काम के लिए
00:12:16काफी अच्छे हैं।
00:12:17और हम यहाँ बैठकर Obsidian RAG और असली RAG के बीच
00:12:18बारीक अंतरों पर बहस कर सकते हैं।
00:12:21लेकिन सच तो यह है कि सबसे बड़ी चीज़ स्केल (पैमाना) है, है ना?
00:12:24क्या हम लाखों दस्तावेज़ों तक स्केल करने की कोशिश कर रहे हैं या नहीं?
00:12:27क्योंकि एक निश्चित स्तर के बाद,
00:12:29एक उचित RAG सिस्टम का उपयोग करना सस्ता और तेज़ होगा।
00:12:32चाहे Claude Code इस MD फ़ाइल डॉक्यूमेंट नेटवर्क को
00:12:33नेविगेट करने में कितना भी अच्छा क्यों न हो
00:12:38जो आपने बनाया है।
00:12:40लेकिन यह ऐसा सवाल नहीं है जिसका सटीक जवाब
00:12:42आपको तुरंत जानने की ज़रूरत है।
00:12:44आप Obsidian जैसी किसी चीज़ से शुरुआत क्यों नहीं करते?
00:12:47और अगर यह साफ हो जाए कि,
00:12:48आपका स्केल इस सिस्टम की क्षमता से कहीं आगे निकल गया है,
00:12:51तो बस RAG पर चले जाएँ।
00:12:53मुझे लगता है कि लोग इस सवाल का जवाब देने में उलझ जाते हैं
00:12:55जबकि बात यह है कि, बस इसे आज़माएँ, बस प्रयोग करें।
00:12:58Obsidian जैसे किसी RAG सिस्टम का उपयोग करने में
00:13:01आपका कुछ खर्च नहीं हो रहा है।
00:13:03और अगर यह काम नहीं करता, तो कोई बात नहीं।
00:13:05तो फिर उसकी जगह लाइट RAG का उपयोग करें,
00:13:06लोग यहाँ बैठकर, जैसा कि वे अनिवार्य रूप से
00:13:09कमेंट्स में करेंगे, इस पर बहस करना चाहते हैं, बस इसे आज़माएँ।
00:13:11मुझे लगता है कि एक निश्चित बिंदु पर जवाब काफी स्पष्ट हो जाएगा
00:13:14कि आपको कब एक असली RAG सिस्टम की ओर बढ़ना है।
00:13:16लेकिन इसकी अच्छी बात यह है कि, फिर से,
00:13:19ज़्यादातर लोगों को असली RAG सिस्टम की ज़रूरत नहीं होती।
00:13:21उन्हें बस नहीं होती, समझे?
00:13:22भले ही वे एक छोटी बिजनेस टीम वाली स्थिति में हों।
00:13:24तो एक उचित, आप जानते हैं,
00:13:27व्यवस्थित सिस्टम जैसे कि Obsidian नॉलेज बेस होना,
00:13:30मेरे ख्याल से ज़्यादातर लोगों के लिए बहुत बड़ा वरदान है।
00:13:33तो मुझे उम्मीद है कि यह जानकारी आपके काम आई होगी।
00:13:35इस बारे में Andre की पोस्ट ज़रूर देखें।
00:13:37वह इसमें काफी गहराई से जानकारी देते हैं।
00:13:39फ्री Chase AI स्कूल को भी ज़रूर देखें।
00:13:41डिस्क्रिप्शन में इसका लिंक दिया गया है जिसमें सभी
00:13:43प्रॉम्ट्स और इसे असल में कैसे करना है, उसका लिखित विवरण है।
00:13:47अगर आप किसी भी हिस्से में उलझ गए थे, और हमेशा की तरह
00:13:50Chase AI Plus को देखें यदि आप उस
00:13:52मास्टरक्लास को पाना चाहते हैं, इसके अलावा,
00:13:54मुझे बताएं कि आपको यह कैसा लगा और मैं आपसे फिर मिलूँगा।

Key Takeaway

हजारों से कम दस्तावेजों वाले उपयोगकर्ताओं के लिए ओब्सीडियन का सरल मार्कडाउन फोल्डर स्ट्रक्चर और क्लॉड कोड का संयोजन, बिना किसी अतिरिक्त लागत या जटिल एम्बेडिंग के एक शक्तिशाली और पारदर्शी RAG विकल्प प्रदान करता है।

Highlights

आंद्रे कारपैथी का ओब्सीडियन आधारित सिस्टम बिना किसी वेक्टर डेटाबेस या एम्बेडिंग्स के जटिल RAG (Retrieval-Augmented Generation) जैसी कार्यक्षमता प्रदान करता है।

यह सिस्टम 'raw' और 'Wiki' फोल्डर स्ट्रक्चर का उपयोग करके क्लॉड कोड (Claude Code) को दस्तावेजों के बीच संबंध खोजने और सटीक उत्तर देने में सक्षम बनाता है।

ओब्सीडियन वेब क्लिपर और 'Local Images Plus' प्लगइन का उपयोग करके किसी भी वेब पेज को इमेज के साथ मार्कडाउन फाइल में बदला जा सकता है।

एक मास्टर इंडेक्स फाइल और व्यक्तिगत विकी इंडेक्स फाइलों के माध्यम से क्लॉड कोड के लिए डेटा खोजना सस्ता और तेज हो जाता है क्योंकि यह टूल कॉल्स को कम करता है।

हजारों दस्तावेजों से कम वाले सोलो डेवलपर्स या छोटी टीमों के लिए ओब्सीडियन आधारित सेटअप पारंपरिक RAG सिस्टम की तुलना में अधिक कुशल और मुफ्त विकल्प है।

Timeline

बिना वेक्टर डेटाबेस वाला हल्का RAG सिस्टम

  • ओब्सीडियन आधारित नॉलेज बेस बिना किसी जटिल रिट्रीवल प्रक्रिया के बड़े दस्तावेजों को संभालने की समस्या हल करता है।
  • यह सिस्टम सोलो ऑपरेटरों के लिए एक किफायती और हल्का विकल्प है जो पारंपरिक RAG के तामझाम को हटा देता है।
  • मार्कडाउन फाइलों का चतुर स्ट्रक्चर क्लॉड कोड को जानकारी के बीच संबंध खोजने में मदद करता है।

जटिल एम्बेडिंग और वेक्टर सर्च के बजाय यह सिस्टम साधारण फाइल ऑर्गनाइजेशन पर निर्भर करता है। क्लॉड कोड जैसे लार्ज लैंग्वेज मॉडल इंडेक्स फाइलों को बनाए रखने और सारांश तैयार करने में पहले से ही बहुत सक्षम हैं। यह दृष्टिकोण उपयोगकर्ता को डेटा पर पूर्ण नियंत्रण देता है और सिस्टम को पूरी तरह से पारदर्शी बनाता है।

प्रभावी नॉलेज बेस के लिए फाइल और फोल्डर स्ट्रक्चर

  • ओब्सीडियन वॉल्ट के भीतर 'raw' फोल्डर नए शोध और लेखों के लिए एक स्टेजिंग एरिया के रूप में कार्य करता है।
  • क्लॉड कोड ऑन-डिमांड 'raw' डेटा को प्रोसेस करके 'Wiki' फोल्डर के भीतर व्यवस्थित लेख और इंडेक्स फाइलें बनाता है।
  • एक मास्टर इंडेक्स फाइल पूरे नॉलेज बेस के लिए एक नेविगेशन मैप का काम करती है जिससे AI के लिए सर्च आसान हो जाती है।

फाइल स्ट्रक्चर ही इस सिस्टम की रीढ़ है। जब क्लॉड कोड से कोई सवाल पूछा जाता है, तो वह सबसे पहले मास्टर इंडेक्स को देखता है ताकि यह जान सके कि कौन से विकी उपलब्ध हैं। इसके बाद वह संबंधित विषय के विशिष्ट इंडेक्स पर जाता है, जो टोकन की खपत को कम करता है और सटीकता बढ़ाता है।

वेब क्लिपर और प्लगइन्स के साथ डेटा इन्जेशन

  • ओब्सीडियन वेब क्लिपर क्रोम एक्सटेंशन किसी भी वेबपेज को सीधे 'raw' फोल्डर में मार्कडाउन के रूप में भेजता है।
  • स्थानीय इमेज को सुरक्षित रखने के लिए 'Local Images Plus' कम्युनिटी प्लगइन का उपयोग किया जाता है।
  • क्लॉड कोड खुद भी इंटरनेट सर्च करके सीधे विकी फाइलें और लेखों के बीच लिंक बना सकता है।

डेटा को सिस्टम में लाने के लिए मैन्युअल और ऑटोमेटेड दोनों तरीके उपलब्ध हैं। वेब क्लिपर के सेटिंग्स में डिफॉल्ट लोकेशन को 'raw' पर सेट करना प्रक्रिया को सुव्यवस्थित करता है। इसके अलावा क्लॉड कोड इतना स्मार्ट है कि वह शोध पत्रों और रेपो को खुद पढ़कर उनके बीच क्रॉस-रेफरेंस लिंक बना सकता है जिससे एक गहरा डॉक्यूमेंट नेटवर्क तैयार होता है।

ओब्सीडियन बनाम पारंपरिक RAG का पैमाना

  • लाखों दस्तावेजों के स्तर पर पहुंचने के बाद ही एक पेशेवर RAG सिस्टम ओब्सीडियन से अधिक सस्ता और तेज साबित होता है।
  • ज्यादातर व्यक्तिगत उपयोगकर्ताओं और छोटे व्यवसायों को कभी भी जटिल RAG इंफ्रास्ट्रक्चर की आवश्यकता नहीं पड़ती।
  • ओब्सीडियन से शुरुआत करना जोखिम मुक्त है क्योंकि इसमें कोई सेटअप लागत नहीं है और इसे बाद में माइग्रेट किया जा सकता है।

चुनाव मुख्य रूप से स्केल या पैमाने पर निर्भर करता है। जब तक डेटा की मात्रा प्रबंधनीय है, ओब्सीडियन का पारदर्शी मॉडल बेहतर है क्योंकि इसमें 'ब्लैक बॉक्स' जैसी कोई समस्या नहीं होती। यदि भविष्य में डेटा की मात्रा बहुत अधिक बढ़ जाती है, तभी लाइट RAG या अन्य जटिल ग्राफ RAG सेटअप पर विचार करना चाहिए।

Community Posts

View all posts