AI कोडिंग के लिए गायब मेमोरी लेयर मिल गई है (Graphify)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00यह आपके कोड बेस में जान फूंकने का सबसे ज़बरदस्त तरीका हो सकता है।
00:00:04अगर आप किसी असली प्रोजेक्ट पर Claude Code या Cursor का इस्तेमाल कर रहे हैं, तो आपको लगता है कि कोड लिखना ही सबसे मुश्किल काम है।
00:00:09पर ऐसा नहीं है। सबसे मुश्किल काम तो अपनी खुद की रिपॉजिटरी को समझना है।
00:00:13आप बस एक सवाल पूछते हैं और आपका AI सिर्फ यह समझने में ही आपके ढेर सारे टोकन खर्च कर देता है कि आखिर चल क्या रहा है।
00:00:18यह धीमा है, महंगा है, और आधे समय तो इसके नतीजे भी अधूरे होते हैं।
00:00:22क्या होगा अगर हर बार अपना पूरा प्रोजेक्ट भेजने के बजाय, आप AI को उसका एक नक्शा दे दें?
00:00:27Grafi ठीक यही काम करता है, और यह टोकन के इस्तेमाल को 70% से भी ज़्यादा कम कर सकता है।
00:00:32चलिए मैं आपको दिखाता हूँ कि यह सब कैसे काम करता है।
00:00:34अभी, आपका AI आपके प्रोजेक्ट को कुछ इस तरह देखता है। बस फाइलों का एक ढेर।
00:00:44उनमें कोई असली संबंध नहीं है। कोई ढांचा नहीं है। कोई मेमोरी नहीं है।
00:00:48इसलिए हर बार जब आप कोई सवाल पूछते हैं, तो उसे सब कुछ शुरू से सीखना पड़ता है।
00:00:53यही वजह है कि जवाब करीब तो लगते हैं, लेकिन पूरी तरह सही नहीं होते।
00:00:56और हाँ, यही वो बात है जिसे कारपैथी (Karpathy) ने "रॉ फोल्डर प्रॉब्लम" कहा था।
00:01:01Grafi उसके ठीक बाद सामने आया। यह एक मेमोरी लेयर की तरह ज़्यादा काम करता है।
00:01:06अगर आपको कोडिंग टूल्स और इस तरह के टिप्स पसंद हैं, तो सब्सक्राइब ज़रूर करें।
00:01:09हमारे वीडियो लगातार आते रहते हैं।
00:01:11ठीक है, अब मैं आपको दिखाता हूँ। यहाँ मेरे पास एक छोटी सी रिपो है। कोड, डॉक्स, डायग्राम।
00:01:16अब, सामान्य तौर पर मुझे हर बार AI को यह सब समझाना पड़ता।
00:01:20इसके बजाय, मैं बस एक कमांड चलाता हूँ, Grafi। बस एक सेकंड रुकिए। अब इसे देखिए।
00:01:27Claude द्वारा Grafi चलाने के बाद, अब यह सिर्फ फाइलें नहीं रह गई हैं। यह एक असली ग्राफ है।
00:01:33सब कुछ आपस में जुड़ा हुआ है। मैं क्लिक करके देख सकता हूँ कि असल में क्या चल रहा है
00:01:38और इसके द्वारा बनाई गई HTML फाइल में ही कौन सी चीजें आपस में जुड़ी हुई हैं।
00:01:42अब AI को सब कुछ दोबारा पढ़ने के लिए कहने के बजाय, मैं उससे पूछ सकता हूँ कि API लेयर से क्या-क्या जुड़ा है।
00:01:50और अब यह इस कॉल से बनी MD फाइल का इस्तेमाल करके संबंधों के आधार पर जवाब देता है।
00:01:56यह अंदाज़ा नहीं लगा रहा, बल्कि संबंधों को देख रहा है। और इस बात ने मुझे हैरान कर दिया।
00:02:00इससे पहले, लगभग 14,000 टोकन इस्तेमाल हुए थे, जो भी संख्या रही हो।
00:02:04इसके बाद, जब यह पहली बार चलता है, तो टोकन की संख्या घटकर सिर्फ कुछ सौ रह जाती है।
00:02:09वही सवाल, लेकिन खर्च पूरी तरह अलग। और यह सब इस तैयार किए गए नक्शे की वजह से हुआ।
00:02:14तो असल में यह कर क्या रहा है? Grafi बुनियादी तौर पर आपके कोड बेस के लिए गूगल मैप्स जैसा है।
00:02:20कच्चे टेक्स्ट के बजाय, आपको नोड्स और कनेक्शन मिलते हैं।
00:02:24अंदरूनी तौर पर, यह ढांचे को समझने के लिए ट्री-सिटर्स (tree sitters) और मतलब निकालने के लिए LLM का इस्तेमाल करता है।
00:02:30फिर यह सब कुछ समूहों में बाँट सकता है, और यह सिर्फ कोड तक सीमित नहीं है।
00:02:35यह PDF, डायग्राम, यहाँ तक कि ऑडियो और वीडियो भी पढ़ता है। सब कुछ लोकली, मशीन से बाहर कुछ नहीं जाता।
00:02:41इससे आपको जो मिलता है वो बहुत सीधा है। हमें एक विज़ुअल ग्राफ मिलता है, एक लिखित रिपोर्ट,
00:02:46और एक ऐसा नॉलेज बेस जिसे हम असल में एक्सप्लोर कर सकते हैं।
00:02:49यह विज़ुअल ग्राफ हम में से बहुतों के लिए बहुत काम का है क्योंकि हम देख सकते हैं कि चीजें कैसे जुड़ती हैं।
00:02:54अब यहीं से वो बदलाव आता है कि AI कोडिंग आमतौर पर कैसे काम करती है।
00:02:57ज़्यादातर टूल्स RAG का इस्तेमाल करते हैं, जिसका मतलब है टेक्स्ट के मिलते-जुलते टुकड़े ढूँढना।
00:03:03लेकिन Grafi ऐसा नहीं करता। यह वास्तविक संबंध बनाता है।
00:03:07यह फंक्शन उसे कॉल करता है। यह मॉड्यूल उस पर निर्भर है।
00:03:11यह विचार इस डॉक्यूमेंट से आया है, और यह आपको यह भी बताता है कि यह कितना सटीक है।
00:03:16तो "यह संबंधित लग रहा है" के बजाय, हमें कुछ ऐसा मिलता है जैसे "यह असल में जुड़ा हुआ है"
00:03:21और वो भी इस बात के विज़ुअल प्रदर्शन के साथ कि क्या किससे जुड़ा है।
00:03:24और सबसे बड़ा अंतर यह है कि यह याद भी रखता है क्योंकि इसने हमारे लिए वो MD फाइल बनाई है,
00:03:30जिसे यह दोबारा देख सकता है। हम हर बार शून्य से शुरुआत नहीं कर रहे हैं।
00:03:33यह सिर्फ वही अपडेट करता है जो बदला है, ताकि आपके AI के पास आखिरकार एक टिकाऊ संदर्भ (context) हो।
00:03:38ठीक है, मुझे तो यह सब काफी शानदार लगा।
00:03:42लेकिन इसके फायदे और नुकसान क्या हैं?
00:03:44सबसे पहली बात, इसकी कार्यक्षमता समय के साथ बढ़ती जाती है।
00:03:47हर सवाल सस्ता होता जाता है। और चूँकि यह कोड,
00:03:51डॉक्स और डायग्राम को जोड़ता है, तो आप ऐसे संबंध ढूँढने लगते हैं जो आपको पता भी नहीं थे।
00:03:56उन उलझे हुए प्रोजेक्ट्स को समझने के लिए यह बहुत बड़ी बात है जिनमें हमें अचानक काम करना पड़ता है।
00:04:00यह तो बहुत अच्छी बात है। अब इसके नुकसानों की बात करते हैं।
00:04:03पहली बार चलाना धीमा हो सकता है और इसमें टोकन खर्च होते हैं, खासकर अगर डॉक्यूमेंट्स ज़्यादा हों।
00:04:08उसके बाद यह कैश (cached) हो जाता है, लेकिन हाँ, पहली बार में असर पड़ता है।
00:04:12यह अभी नया है, इसलिए लॉन्ग-टर्म सपोर्ट के बारे में अभी ज़्यादा जानकारी नहीं है।
00:04:17जब आप इसे इंस्टॉल करें, तो ध्यान दें कि यह grafyy है, जिसमें दो 'y' हैं, एक नहीं।
00:04:20तो स्पेलिंग ज़रूर चेक कर लें। इसके संबंध हमेशा एकदम सही नहीं होते,
00:04:23लेकिन यह उन्हें स्पष्ट रूप से लेबल करता है: एक्सट्रैक्टेड, इनफर्ड या एंबिग्यूअस,
00:04:28ताकि आपको पता हो कि आप किस पर भरोसा कर सकते हैं। और अगर आपकी रिपो बहुत छोटी है,
00:04:32तो यह ज़रूरत से थोड़ा ज़्यादा लगेगा। तो क्या यह काम का है?
00:04:35मेरा मतलब है, हाँ, अगर आप किसी गंभीर काम के लिए AI का इस्तेमाल कर रहे हैं, तो यह कमाल का है।
00:04:38मुझे लगा कि यह सार्थक है। क्योंकि आपकी सबसे बड़ी समस्या कोड चलाना नहीं है,
00:04:42बल्कि फाइलों, समय और संदर्भ के बीच उसे असल में समझना है।
00:04:46और यह ठीक इसी समस्या को सुलझाता है। सिर्फ टोकन की बचत ही इसे आज़माने लायक बनाती है,
00:04:51लेकिन बड़ी जीत यह है कि आपका AI अंदाज़ा लगाना छोड़ देता है और तर्क करना शुरू कर देता है।
00:04:56अगर आप अकेले काम कर रहे हैं, रिसर्च कर रहे हैं, या आपके पास बड़े सिस्टम हैं, तो यह एक बड़ा अपग्रेड है।
00:05:01अगर आप सिर्फ छोटी स्क्रिप्ट्स पर काम कर रहे हैं, तो शायद इसकी ज़रूरत नहीं है,
00:05:04तो आपको इसे आज़माने की ज़रूरत नहीं पड़ेगी। लेकिन ज़्यादातर डेवलपर्स जो इसे आज़माते हैं,
00:05:07उनके लिए यह एक बेहतरीन टूल साबित होगा। अगर आपको कोडिंग टूल्स और टिप्स पसंद हैं
00:05:10जो आपके वर्कफ़्लो को तेज़ करते हैं, तो Better Stack चैनल को सब्सक्राइब ज़रूर करें।
00:05:14हम आपसे दूसरे वीडियो में मिलेंगे।

Key Takeaway

Graphify एक मेमोरी लेयर के रूप में काम करता है जो कोडबेस के संबंधों का ग्राफ बनाकर टोकन खर्च को 70% तक घटाता है और AI को अनुमान लगाने के बजाय सटीक तर्क करने में सक्षम बनाता है।

Highlights

  • Graphify रिपॉजिटरी में संबंधों का एक नक्शा बनाकर AI टोकन के उपयोग को 70% तक कम करता है।

  • यह टूल कोडबेस के भीतर फंक्शन, मॉड्यूल और डॉक्यूमेंट्स के बीच वास्तविक संबंध खोजने के लिए ट्री-सिटर्स और LLM का उपयोग करता है।

  • Graphify लोकली काम करता है और कोड के अलावा PDF, आरेख, ऑडियो और वीडियो फ़ाइलों को भी प्रोसेस कर सकता है।

  • यह टूल संबंधों को एक्सट्रैक्टेड, इनफर्ड या एंबिग्यूअस श्रेणियों में स्पष्ट रूप से लेबल करता है ताकि सटीकता का पता चल सके।

  • रिपॉजिटरी के लिए एक स्थिर नॉलेज बेस बनाने से 14,000 टोकन का खर्च घटकर मात्र कुछ सौ टोकन रह जाता है।

Timeline

रॉ फोल्डर की समस्या और समाधान

  • कोड लिखना सबसे बड़ी चुनौती नहीं है बल्कि जटिल रिपॉजिटरी को समझना सबसे मुश्किल काम है।
  • AI वर्तमान में कोड को केवल फ़ाइलों के ढेर के रूप में देखता है जिसमें कोई आंतरिक संबंध नहीं होता।
  • अधूरे संदर्भ के कारण AI हर सवाल पर टोकन खर्च करके फिर से सीखना शुरू करता है।

Claude Code और Cursor जैसे टूल्स का उपयोग करते समय प्रोजेक्ट की संरचना को समझने में अत्यधिक टोकन और समय बर्बाद होता है। इसे रॉ फोल्डर प्रॉब्लम कहा जाता है जहाँ फ़ाइलों के बीच कोई स्पष्ट ढांचा या मेमोरी नहीं होती। Graphify इस समस्या को हल करने के लिए एक विज़ुअल और लॉजिकल मैप प्रदान करता है।

मेमोरी लेयर के रूप में Graphify का संचालन

  • Graphify चलाने के बाद फ़ाइलें एक आपस में जुड़े हुए ग्राफ में बदल जाती हैं।
  • यह टूल एक MD फ़ाइल बनाता है जो संबंधों के आधार पर जवाब देने के लिए संदर्भ प्रदान करती है।
  • समान प्रश्न के लिए टोकन की संख्या 14,000 से घटकर कुछ सौ रह जाती है।

एक कमांड चलाने पर Graphify पूरी रिपॉजिटरी का विश्लेषण करता है और संबंधों को HTML और MD फ़ाइलों में सहेजता है। उपयोगकर्ता API लेयर या किसी विशिष्ट मॉड्यूल के संबंधों के बारे में सीधे पूछ सकते हैं। यह प्रक्रिया शून्य से शुरुआत करने के बजाय पिछले ज्ञान का उपयोग करती है जिससे लागत में भारी कमी आती है।

तकनीकी संरचना और डेटा प्रोसेसिंग

  • सिस्टम संरचना को समझने के लिए ट्री-सिटर्स और अर्थ निकालने के लिए LLM का संयोजन उपयोग होता है।
  • डेटा प्रोसेसिंग पूरी तरह से लोकल मशीन पर होती है और कोई जानकारी बाहर नहीं भेजी जाती।
  • यह पारंपरिक RAG के विपरीत टेक्स्ट के टुकड़ों के बजाय वास्तविक कोड निर्भरता और संबंधों पर आधारित है।

Graphify कोड के साथ-साथ PDF और वीडियो जैसे मल्टीमॉडल डेटा को भी क्लस्टर कर सकता है। यह केवल मिलते-जुलते टेक्स्ट नहीं ढूँढता बल्कि यह बताता है कि कौन सा फंक्शन किस पर निर्भर है। यह एक टिकाऊ संदर्भ बनाता है जो कोड में बदलाव होने पर केवल अपडेट होता है।

उपयोगिता, सीमाएं और अंतिम मूल्यांकन

  • पहली बार इंडेक्सिंग करना धीमा हो सकता है लेकिन बाद में कैशिंग के कारण गति बढ़ जाती है।
  • यह टूल छोटी स्क्रिप्ट्स के बजाय बड़े और जटिल सिस्टम के लिए अधिक प्रभावी है।
  • स्पेलिंग में दो 'y' (grafyy) का उपयोग करना आवश्यक है।

शुरुआती टोकन निवेश के बाद हर अगला सवाल सस्ता और सटीक होता जाता है। हालांकि यह बहुत छोटी रिपॉजिटरी के लिए अनावश्यक हो सकता है लेकिन गंभीर विकास कार्यों के लिए यह एक अनिवार्य अपग्रेड है। यह AI को केवल कोड लिखने के बजाय प्रोजेक्ट के तर्क को गहराई से समझने की शक्ति देता है।

Community Posts

View all posts