[वॉल स्ट्रीट अंकल] क्वांट निवेश की सच्चाई और मिथक - भाग 1: अधूरा ज्ञान खतरनाक हो सकता है

हिन्दीالعربية Deutsch English Español Français Bahasa Indonesia 日本語 한국어 Português 中文

월월가아재의 과학적 투자

StocksAdvertising/MarketingBeginning InvestingInternet Technology

Transcript

00:00:00लेकिन अगर हम पिछले 10, 20 या 30 सालों को देखें,

00:00:03उस पूरी अवधि पर विचार करते हुए,

00:00:04तो उस दौरान कितने ऐसे पैटर्न्स रहे होंगे जो वास्तव में फायदेमंद थे?

00:00:09इसका जवाब है - अनगिनत। और इसे साबित भी किया जा सकता है।

00:00:12नमस्ते, मैं हूँ वॉल स्ट्रीट गे।

00:00:21आज हम क्वांट इन्वेस्टिंग (Quant Investing) के बारे में बात करेंगे।

00:00:24मेरे यूट्यूब चैनल पर कमेंट्स और ईमेल के जरिए,

00:00:26कई लोगों ने मुझसे क्वांट ट्रेडिंग के बारे में बताने का अनुरोध किया था।

00:00:29मेरे भविष्य के लक्ष्यों और इस चैनल के पाठ्यक्रम के हिसाब से,

00:00:33अल्गोरिदम ट्रेडिंग या क्वांट ट्रेडिंग को,

00:00:36इतनी जल्दी कवर करने की मेरी कोई योजना नहीं थी।

00:00:38लेकिन हमारे चैनल के सब्सक्राइबर्स में से,

00:00:40लगभग 15% लोग क्वांट ट्रेडिंग करते हैं,

00:00:44और साथ ही, आजकल क्वांट इन्वेस्टिंग को लेकर कुछ चिंताजनक बातें भी सामने आ रही हैं।

00:00:48इसीलिए मैंने यह वीडियो बनाने का फैसला किया।

00:00:50आज हम सबसे पहले क्वांट के वर्गीकरण और इसके सिद्धांतों पर,

00:00:53एक संक्षिप्त नज़र डालेंगे,

00:00:56और उसके बाद क्वांट ट्रेडिंग में ध्यान रखने वाली 10 सावधानियों पर चर्चा करेंगे।

00:00:59अगर आप इन 10 बातों को याद रखते हैं, तो क्वांट ट्रेडिंग में,

00:01:04आप अपना कीमती समय बर्बाद करने से बच सकते हैं,

00:01:06या फिर बैक-टेस्टिंग और अन्य तरीकों में,

00:01:09गलत तरीके अपनाने की वजह से,

00:01:11होने वाले बड़े नुकसान से खुद को बचा पाएंगे।

00:01:15हैरानी की बात यह है कि ये बिल्कुल बुनियादी बातें हैं,

00:01:18फिर भी बाजार में बिकने वाले बहुत महंगे पेड कोर्सेज में,

00:01:21इन विषयों पर विस्तार से चर्चा नहीं की जाती।

00:01:24बल्कि वे कोर्सेज बैक-टेस्टिंग और क्वांट इन्वेस्टिंग जैसी चीज़ों को,

00:01:27ज़्यादा ही बढ़ा-चढ़ाकर और आकर्षक बनाकर पेश करते हैं।

00:01:31लेकिन आज इन 10 बातों पर ध्यान देकर आप क्वांट इन्वेस्टिंग या ट्रेडिंग से जुड़ी,

00:01:35किसी भी जानकारी या सर्विस का उपयोग करते समय,

00:01:39काफी हद तक सुरक्षित रहेंगे और खुद को बचा सकेंगे।

00:01:43शुरू करने से पहले, कुछ दिन पहले मैंने थोड़े गुस्से में,

00:01:47एक छोटी सी पोस्ट डाली थी,

00:01:49शायद वहां मैंने थोड़ी गलती कर दी।

00:01:51मैंने लिखा था कि आजकल क्वांट इन्वेस्टिंग को लेकर वायरल मार्केटिंग और बढ़ा-चढ़ाकर किए जा रहे विज्ञापन,

00:01:54अपनी सीमाएं पार कर रहे हैं।

00:01:55उस पर कुछ कमेंट्स ऐसे आए जिनमें किसी खास व्यक्ति,

00:01:59या कंपनी के खिलाफ नफरत भरे शब्द लिखे गए थे।

00:02:02मुझे लगा कि इससे उन लोगों या कंपनियों को ठेस पहुँच सकती है, इसलिए मैंने वह पोस्ट हटा दी।

00:02:06सच कहूँ तो, ये चीज़ें कोई अवैध स्टॉक लीडिंग रूम या,

00:02:09किसी अवैध कंपनी जैसे बुरे काम नहीं हैं,

00:02:12तो शायद मैं ज़रूरत से ज़्यादा दखल दे रहा हूँ।

00:02:16लेकिन दूसरी तरफ, अवैध खातों जैसी समस्याओं में,

00:02:19इस्तेमाल करने वाले लोग भी जानते हैं कि यह गलत है,

00:02:22और उनके लालच की भी इसमें कुछ ज़िम्मेदारी होती है।

00:02:25लेकिन आजकल क्वांट इन्वेस्टिंग की चर्चाओं को देखकर लगता है,

00:02:28कि वे साधारण लोग जो ईमानदारी से मेहनत करके,

00:02:33निवेश के ज़रिए अपनी आर्थिक स्थिति सुधारना चाहते हैं,

00:02:35वे जब क्वांट इन्वेस्टिंग की दुनिया में कदम रखते हैं,

00:02:37तो उन्हें काफी नुकसान हो सकता है।

00:02:40क्योंकि क्वांट इन्वेस्टिंग के साथ अक्सर “विज्ञान” और “आँकड़े” जैसे शब्द जुड़े होते हैं,

00:02:46जिससे लोग भ्रमित हो सकते हैं, भले ही उसमें कुछ चीज़ें अवैज्ञानिक हों।

00:02:51अवैध लीडिंग रूम या खाते तो साफ तौर पर गलत दिखते हैं,

00:02:55इसलिए उनसे बचना आसान है,

00:02:56लेकिन यहाँ मेहनत करने वाले मासूम लोग शिकार बन सकते हैं।

00:03:01कोई कहता है कि कुछ ही दिनों में आप क्वांट इन्वेस्टिंग के एक्सपर्ट बन सकते हैं,

00:03:04या यह दशकों के डेटा से जाँची-परखी रणनीति है,

00:03:08या फिर पिछले 10 सालों में इसने 20% का चक्रवृद्धि ब्याज (compound return) दिया है,

00:03:11तो आगे भी ऐसा ही होगा - इस तरह की बातें की जाती हैं।

00:03:14भले ही कहने वाले का इरादा बुरा न हो और उसने बस यूँ ही कह दिया हो,

00:03:18लेकिन कई नए निवेशक (Stock-children),

00:03:20इसे सच मानकर गलतफहमी का शिकार हो सकते हैं।

00:03:23वे बैक-टेस्टिंग में अपना बहुत सारा समय बर्बाद कर सकते हैं,

00:03:25और उन्हें आर्थिक नुकसान भी उठाना पड़ सकता है।

00:03:27खासकर तब जब वे बैक-टेस्टिंग के परिणामों पर अंधा विश्वास कर लेते हैं।

00:03:32इसीलिए अमेरिकी नियामक SEC के नियमों के अनुसार,

00:03:35अगर कोई फंड इस तरह की मार्केटिंग करता है, तो उसे अवैध माना जाता है।

00:03:38तो जो लोग क्वांट इन्वेस्टिंग के बारे में बात करते हैं,

00:03:41उन्हें दूसरों के पैसे की ज़िम्मेदारी को थोड़ा और गंभीरता से समझना चाहिए।

00:03:45पता नहीं मैं कब तक यूट्यूब करूँगा,

00:03:47लेकिन मैं यह सब सिर्फ अच्छा दिखने के लिए नहीं कह रहा हूँ।

00:03:51मैंने खुद अपने 20 के दशक के मध्य में पैसों की बहुत किल्लत देखी है,

00:03:52इसलिए मैं जानता हूँ कि वह कैसा महसूस होता है।

00:03:56चूंकि मैं अक्सर नुकसान के समय मानसिक प्रबंधन की बात करता हूँ,

00:03:58और अपने पुराने घाटे की कहानियाँ साझा करता हूँ,

00:04:01तो शायद इसीलिए मेरे पास ऐसे बहुत से सवाल आते हैं।

00:04:05हर हफ्ते मुझे ऐसे कई ईमेल मिलते हैं,

00:04:09जिनमें सब्सक्राइबर्स करोड़ों के नुकसान की वजह से सलाह मांगते हैं।

00:04:14इसलिए मुझे लगता है कि फाइनेंस, स्टॉक और रियल एस्टेट से जुड़े यूट्यूबर्स को,

00:04:16एक बार अपनी बातों का आत्म-निरीक्षण ज़रूर करना चाहिए।

00:04:20मैं खुद भी आजकल जब “80 दिनों की निवेश यात्रा” कर रहा हूँ,

00:04:24तो मुझे महसूस हो रहा है कि मैं अनजाने में 'लीडिंग' (Leading) जैसा कुछ कर रहा हूँ।

00:04:26इसलिए मैंने सोचा है कि इस मंदी के खत्म होते ही मैं फिर से अपनी बुनियादी शैली पर लौट जाऊँगा।

00:04:29खैर, इसी उद्देश्य के साथ मैंने यह वीडियो बनाया है।

00:04:33मेरा इरादा किसी खास व्यक्ति या कंपनी को निशाना बनाना बिल्कुल नहीं है।

00:04:37हो सकता है कि क्वांट मार्केटिंग करने वाले लोग भी,

00:04:40अनजाने में कुछ गलतियाँ कर रहे हों।

00:04:43मेरा मकसद बस यह है कि हम सब मिलकर इन चीज़ों को समझें और सुधारें।

00:04:46तो दर्शकों से भी मेरी विनती है कि कमेंट्स में,

00:04:49किसी का नाम लेकर उस पर हमला न करें।

00:04:51भूमिका काफी लंबी हो गई,

00:04:55अब चलिए क्वांट के वर्गीकरण से शुरुआत करते हैं।

00:04:57क्वांट एक बहुत ही व्यापक शब्द है जिसके कई अर्थ हो सकते हैं।

00:04:58सुविधा के लिए अगर हम इसे समय के अनुसार बाँटें,

00:05:01तो सबसे पहले आती है 'अल्ट्रा-हाई फ्रीक्वेंसी ट्रेडिंग' (Ultra HFT)।

00:05:04इसमें सर्वर्स को एक्सचेंज के पास ही रखा जाता है (Co-location),

00:05:07कोडिंग मशीन लैंग्वेज लेवल पर की जाती है,

00:05:10और पूरा ध्यान हार्डवेयर की गति पर होता है।

00:05:12इसके बाद आती है 'अल्गोरिदम ट्रेडिंग',

00:05:14जिसका समय थोड़ा ज़्यादा लंबा होता है।

00:05:19इसमें तकनीकी संकेतक (Technical indicators) या नियमों का पालन किया जाता है।

00:05:20यह आजकल व्यक्तिगत निवेशकों के बीच काफी लोकप्रिय हो रही है,

00:05:22खासकर बैक-टेस्टिंग प्लेटफॉर्म्स की वजह से।

00:05:24फिर आता है 'स्टैटिस्टिकल आर्बिट्राज' (Statistical Arbitrage) जैसे 'पेयर ट्रेडिंग'।

00:05:28इसमें सांख्यिकीय मॉडल और तकनीकों का उपयोग करके,

00:05:29पुराने पैटर्न्स को ढूँढा जाता है,

00:05:33और इस धारणा पर काम किया जाता है कि कीमतें वापस औसत पर आएंगी (Mean reversion)।

00:05:35अगला है 'फैक्टर इन्वेस्टिंग' (Factor Investing)।

00:05:39यह थोड़ा दीर्घकालिक होता है, जिसमें मोमेंटम, वैल्यू, या कैरी जैसे,

00:05:41कीमतों को प्रभावित करने वाले कारकों (Factors) को पहचाना जाता है।

00:05:42पिछले कुछ सालों में 'क्वांटामेंटल' (Quantamental) काफी चर्चा में है।

00:05:44इसमें फंडामेंटल एनालिसिस को डेटा के ज़रिए ऑटोमेट किया जाता है,

00:05:46और वैकल्पिक डेटा (Alternative data) का उपयोग करके लंबी अवधि का निवेश किया जाता है।

00:05:48इसी तरह, मशीन लर्निंग, बिग डेटा और वैकल्पिक डेटा का उपयोग,

00:05:50अब कई अलग-अलग क्षेत्रों में फैल रहा है।

00:05:52ये वर्गीकरण बस समझने की सुविधा के लिए हैं,

00:05:54क्योंकि इनके बीच की सीमाएं काफी धुंधली हैं।

00:05:59कभी-कभी इस पूरे क्षेत्र को ही अल्गोरिदम ट्रेडिंग कह दिया जाता है।

00:06:01इसलिए मैं यहाँ सामान्य तौर पर 'क्वांट ट्रेडिंग' शब्द का ही इस्तेमाल करूँगा।

00:06:03क्वांट ट्रेडिंग के बुनियादी सिद्धांत इस प्रकार हैं:

00:06:06पहला, आपके पास एक निवेश का विचार या परिकल्पना (Hypothesis) होनी चाहिए।

00:06:07उसके बाद आता है 'बैक-टेस्टिंग'।

00:06:10आप उस विचार को पुराने ऐतिहासिक डेटा पर परखते हैं।

00:06:12आप देखते हैं कि अगर मैंने अतीत में ऐसा किया होता,

00:06:16तो क्या वास्तव में मुझे मुनाफा होता?

00:06:18अगर बैक-टेस्टिंग में अच्छे नतीजे मिलते हैं,

00:06:20तो फिर आप वास्तविक ट्रेडिंग शुरू करते हैं,

00:06:23और साथ ही जोखिम प्रबंधन (Risk management) भी करते हैं।

00:06:26इन चार चरणों में यह पूरी प्रक्रिया चलती है।

00:06:28देखा जाए तो 2010 के दशक के मध्य तक,

00:06:30क्वांट ट्रेडिंग केवल बड़े संस्थानों और पीएचडी धारकों वाले,

00:06:31क्वांट फंड्स तक ही सीमित थी।

00:06:33लेकिन धीरे-धीरे यह तकनीक और निष्पादन के मामले में,

00:06:35काफी सामान्य होती जा रही है।

00:06:37अमेरिका में 'क्वांटोपियन' जैसी सेवाओं के आने से,

00:06:40बैक-टेस्टिंग बहुत आसान हो गई है,

00:06:42और अब आम लोग भी बड़ी आसानी से इसका उपयोग कर पा रहे हैं।

00:06:44लेकिन इसके साथ ही, क्वांट इन्वेस्टिंग को लेकर गलतफहमियां भी बढ़ रही हैं।

00:06:47उदाहरण के लिए, कोई कह सकता है कि पिछले 15 सालों में,

00:06:50अगर आपने 0.92 से कम PBR वाली और पिछले 12 महीनों में बढ़त दिखाने वाली कंपनियों में निवेश किया होता,

00:06:51तो आपको सालाना 20.2% का रिटर्न मिलता।

00:06:54फिर वे PBR की वैल्यू थोड़ा बदलकर देखते हैं,

00:06:56तो रिटर्न 14% या 17.8% हो जाता है।

00:06:57इस तरह की कई बैक-टेस्टिंग करने के बाद,

00:07:00वे देखते हैं कि पहला परिणाम सबसे अच्छा था,

00:07:01और वे निष्कर्ष निकालते हैं कि हमें इसी नियम के साथ निवेश करना चाहिए।

00:07:03लेकिन असल में, यह सोचने का एक गलत तरीका है।

00:07:06अगर आप गौर से सोचें,

00:07:09तो बैक-टेस्टिंग इस अनिश्चित धारणा पर टिकी है,

00:07:13कि अतीत का पैटर्न भविष्य में भी दोहराया जाएगा।

00:07:16इसमें हम बस उन पैटर्न्स को ढूँढ रहे हैं जो अतीत में सफल थे।

00:07:18लेकिन अगर हम पिछले 10, 20 या 30 सालों की अवधि को देखें,

00:07:21तो उस दौरान ऐसे कितने पैटर्न्स हो सकते हैं जिन्होंने अच्छा मुनाफा दिया होगा?

00:07:23ज़रा वीडियो रोकें और इस बारे में सोचें।

00:07:25जवाब है - अनंत। इसे साबित भी किया जा सकता है।

00:07:28चूंकि रणनीतियों के पैरामीटर्स निरंतर (Continuous) होते हैं,

00:07:30इसलिए हज़ारों-लाखों ऐसी रणनीतियाँ संभव हैं जो अतीत में सफल रही होंगी।

00:07:33लेकिन असली सवाल यह है कि उनमें से कितनी भविष्य में भी सफल होंगी?

00:07:35यही क्वांट इन्वेस्टिंग का सबसे महत्वपूर्ण हिस्सा है।

00:07:38अतीत में सफल रहे किसी पैटर्न को ढूँढना,

00:07:40अगर आपके पास सही टूल्स हैं, तो कोई भी कर सकता है।

00:07:42लेकिन ऐसी चीज़ ढूँढना जो अतीत में भी अच्छी थी और भविष्य में भी अच्छी रहेगी,

00:07:46बेहद मुश्किल काम है।

00:07:48यह भूसे के ढेर में सुई ढूँढने जैसा है।

00:07:51मैंने कई वेबसाइट्स और ब्लॉग्स पर देखा है,

00:07:53कि जोएल ग्रीनब्लाट का “मैजिक फॉर्मूला” (Magic Formula) बहुत मशहूर है।

00:07:56उन्होंने मार्केट कैप जैसे कुछ सरल फ़िल्टर्स का उपयोग करके,

00:07:58शेयरों को चुनने का एक बहुत ही आसान तरीका बताया था।

00:08:01उन्होंने इस पर एक किताब भी लिखी थी,

00:08:03जो व्यक्तिगत निवेशकों के बीच काफी लोकप्रिय हुई।

00:08:04हेज फंड की दुनिया में जोएल एक बहुत बड़ा नाम हैं।

00:08:07उन्होंने 1980 के दशक से निवेश करना शुरू किया था,

00:08:09और उस दौरान उनका रिटर्न वॉरेन बफेट से भी बेहतर था।

00:08:12शायद इसीलिए उनका “मैजिक फॉर्मूला” इतना प्रसिद्ध हुआ।

00:08:14लेकिन मैं आपको सीधे तौर पर बता दूँ,

00:08:16कि यह फॉर्मूला जितना दिखता है, उससे कहीं ज़्यादा पेचीदा हो सकता है।

00:08:18अतीत की सफलता भविष्य की गारंटी नहीं होती।

00:08:21कई लोग केवल उन पैटर्न्स को देख रहे हैं जो चार्ट पर सुंदर दिखते हैं।

00:08:24लेकिन क्वांट ट्रेडिंग में सबसे बड़ी चुनौती 'ओवर-फिटिंग' (Over-fitting) है।

00:08:26यानी ऐसी रणनीति बनाना जो डेटा के लिए तो सही है, पर वास्तविकता के लिए नहीं।

00:08:29हमें यह समझना होगा कि बाज़ार हमेशा बदलता रहता है।

00:08:30जो नियम पिछले 10 साल काम कर गए, वे शायद कल काम न करें।

00:08:32यही कारण है कि हमें रणनीतियों के पीछे के 'तर्क' को समझना चाहिए।

00:08:34सिर्फ आँकड़ों पर भरोसा करना खतरनाक हो सकता है।

00:08:36एक सफल क्वांट निवेशक वही है जो जोखिम को समझता है।

00:08:38बैक-टेस्टिंग केवल पहला कदम है, अंतिम सत्य नहीं।

00:08:42हमें भविष्य के अनपेक्षित बदलावों के लिए तैयार रहना चाहिए।

00:08:46मार्केट में बहुत सारा 'शोर' (Noise) होता है।

00:08:50उस शोर में से असली 'सिग्नल' को पहचानना ही कला है।

00:08:52ज़्यादातर लोग बस कंप्यूटर के द्वारा निकाली गई लाइनों को देखते हैं।

00:08:55पर वे भूल जाते हैं कि बाज़ार इंसानी व्यवहार से भी चलता है।

00:08:56क्वांट का मतलब केवल गणित नहीं, बल्कि मनोविज्ञान भी है।

00:09:00अगले हिस्से में, हम उन 10 गलतियों पर विस्तार से बात करेंगे।

00:09:02इनमें से पहली गलती है 'डेटा स्नूपिंग' (Data Snooping)।

00:09:04यानी तब तक डेटा को खंगालना जब तक मनचाहा नतीजा न मिल जाए।

00:09:07यह विज्ञान नहीं, बल्कि खुद को धोखा देने जैसा है।

00:09:09दूसरी बड़ी समस्या है ट्रांजेक्शन कॉस्ट (Transaction Cost) को अनदेखा करना।

00:09:12कागज़ पर दिखने वाला मुनाफा अक्सर ब्रोकरेज और टैक्स में खत्म हो जाता है।

00:09:13तीसरी बात है तरलता या लिक्विडिटी (Liquidity) का अभाव।

00:09:15छोटे शेयरों में बैक-टेस्टिंग के नतीजे अक्सर भ्रामक होते हैं।

00:09:17उन्होंने शेयरों को चुनने के लिए एक ऐसा फॉर्मूला बनाया

00:09:20और निवेश के उस 'मैजिक फॉर्मूला' पर एक किताब लिखी।

00:09:24वह किताब काफी चर्चा में रही

00:09:25और ऐसा लगता है कि व्यक्तिगत निवेशकों के बीच काफी मशहूर हो गई है,

00:09:28लेकिन हेज फंड की दुनिया में भी यह व्यक्ति बहुत प्रसिद्ध है।

00:09:31उन्होंने 1980 के दशक से निवेश करना शुरू किया था,

00:09:33और उस निवेश अवधि के दौरान उन्होंने वारेन बफेट से भी

00:09:35बेहतर रिटर्न हासिल किया।

00:09:37शायद इसीलिए मैजिक फॉर्मूला को इतनी ज्यादा तवज्जो मिली,

00:09:40लेकिन मैं आपको निष्कर्ष पहले ही बता देता हूँ।

00:09:42ग्रीनब्लैट कोई 'क्वांट' (quant) निवेशक नहीं हैं,

00:09:44और उनके हेज फंड ने केवल मैजिक फॉर्मूला के आधार पर निवेश नहीं किया था।

00:09:47यानी वह शानदार रिटर्न सिर्फ मैजिक फॉर्मूला से नहीं आया था।

00:09:50वह फंड वैल्यू इन्वेस्टिंग के साथ-साथ

00:09:52'स्पेशल सिचुएशन' इन्वेस्टिंग भी करता था।

00:09:54उदाहरण के लिए, 'स्पिन-ऑफ' जैसी स्थितियों में,

00:09:57जब कोई कंपनी दो हिस्सों में बँटती है,

00:09:59तब कीमतों में जो अंतर या विसंगति आती है,

00:10:01उस मौके को पहचानकर वे मुनाफा कमाते थे।

00:10:04उन्होंने इस तरह की पद्धतियों का साथ में इस्तेमाल किया था।

00:10:07और मुझे नहीं लगता कि वैल्यू इन्वेस्टिंग वाले हिस्से में भी

00:10:10उन्होंने इतने सरल फॉर्मूले का इस्तेमाल किया होगा।

00:10:12बेशक, उस ढांचे का कुछ असर तो रहा होगा।

00:10:14लेकिन उन्होंने इसे केवल मशीनी तरीके से फॉर्मूले के आधार पर खरीदकर

00:10:18इतना बड़ा मुनाफा नहीं कमाया होगा।

00:10:20अब, अगर हम मैजिक फॉर्मूला सार्वजनिक होने के बाद,

00:10:222005 से इसके रिटर्न का बैकटेस्टिंग करके देखें,

00:10:26तो यह ग्रे (grey) रेखा S&P इंडेक्स है

00:10:28और यह हरी रेखा मैजिक फॉर्मूला है।

00:10:29आप देख सकते हैं कि इसमें काफी अस्थिरता रही,

00:10:32और यह लगातार बाजार से पिछड़ता गया।

00:10:34यह सिस्टमिक इक्विटी ETF जैसे निवेशों की वजह से हो सकता है,

00:10:37क्योंकि जब इस तरह के कई और निवेश बाजार में आए

00:10:40और बाजार पहले से ज्यादा कुशल (efficient) हो गया,

00:10:42तो वह फायदा या 'एज' खत्म हो गया।

00:10:44इतने प्रसिद्ध फॉर्मूले की इस स्थिति से पता चलता है कि

00:10:48अतीत में मुनाफे वाले पैटर्न ढूँढना बहुत आसान है।

00:10:50और आप उस पर किताब भी लिख सकते हैं।

00:10:53लेकिन भविष्य में भी मुनाफा देने वाला पैटर्न ढूँढना

00:10:56सच में बहुत ही मेहनत और बारीकी का काम है।

00:11:00इसलिए, कुछ दिनों की सोच और चंद क्लिक से मिलने वाली

00:11:03सालाना 20% रिटर्न की रणनीति दुनिया में मौजूद नहीं है।

00:11:06एक और उदाहरण 'क्वांटोपिअन' (Quantopian) का है।

00:11:08क्वांटोपिअन एक स्टार्टअप था जो लगभग 2011 में शुरू हुआ था,

00:11:12जिसने अमेरिका में बैकटेस्टिंग को बहुत आसान बना दिया था।

00:11:16वहाँ 3 लाख लोगों ने 1.2 करोड़ बार बैकटेस्टिंग करके

00:11:20ढेर सारी क्वांट रणनीतियाँ बनाईं और उनका परीक्षण किया।

00:11:24प्रसिद्ध अरबपति स्टीव कोहेन ने इसमें निवेश किया था,

00:11:27जो कि एक हेज फंड ट्रेडर हैं।

00:11:29और क्वांटोपिअन के शीर्ष स्तर के क्वांट्स ने

00:11:32शोध पत्र (papers) तक प्रकाशित किए कि,

00:11:34इन रणनीतियों में से कौन सी भविष्य में सफल होगी,

00:11:37इसे किस मानक और सांख्यिकीय पद्धति से

00:11:40चुनना चाहिए।

00:11:41उन्होंने इस पर बहुत गहन शोध किया और

00:11:44रणनीतियों का चयन किया ताकि

00:11:46उनके जरिए एक नया हेज फंड चलाया जा सके।

00:11:48यही उनका विचार था,

00:11:49लेकिन वे बुरी तरह विफल रहे।

00:11:51अंततः पिछले साल उन्होंने अपना कारोबार बंद कर दिया।

00:11:53ऐसी चीजें क्यों होती हैं?

00:11:55और जो दर्शक क्वांट ट्रेडिंग या निवेश करना चाहते हैं,

00:11:58वे ऐसे परिणामों से कैसे बच सकते हैं?

00:12:02बेशक, इससे पूरी तरह बचना मुमकिन नहीं है।

00:12:03और मुझे लगता है कि यह काफी कठिन काम है,

00:12:07फिर भी, अगर आप इसे आजमाना चाहते हैं,

00:12:10तो कम से कम इन 10 बातों को ध्यान में रखें

00:12:12और सावधानी बरतें।

00:12:13मैं इसी दृष्टिकोण से एक-एक करके आपको बताऊंगा।

00:12:16सिर्फ इन 10 बातों का ध्यान रखकर भी आप

00:12:17गलत बैकtesting के कारण होने वाले समय की बर्बादी और नुकसान से

00:12:22बच सकते हैं।

00:12:24बेशक, अच्छे बैकटेस्टिंग का मतलब मुनाफे की गारंटी नहीं है।

00:12:27सबसे पहली बात है कि आपको डेटा पर संदेह करना चाहिए।

00:12:31कुछ लोग गूगल या याहू के डेटा का इस्तेमाल करते हैं,

00:12:34लेकिन वह डेटा उम्मीद से कहीं ज्यादा 'गंदा' (त्रुटिपूर्ण) होता है।

00:12:37इसलिए, जो लोग शुरुआत से क्वांट ट्रेडिंग करना चाहते हैं,

00:12:41उन्हें डेटा के स्तर पर बहुत सी बाधाओं का सामना करना पड़ता है।

00:12:45ऐसा मुफ्त डेटा बहुत ही खराब और गलतियों से भरा होता है।

00:12:47और डेटा को साफ करने की प्रक्रिया में,

00:12:50जिसे डेटा क्लीनिंग कहते हैं,

00:12:51आपको लग सकता है कि सिर्फ गलतियाँ ढूँढनी हैं,

00:12:54लेकिन इसमें इंसान का व्यक्तिगत निर्णय

00:12:57और पक्षपात (bias) भी शामिल हो जाता है।

00:12:59चलिए एक उदाहरण लेते हैं।

00:13:01मान लीजिए कोई शेयर 41 से 43 डॉलर के बीच ट्रेड हो रहा था

00:13:05और उसी पर बंद हुआ।

00:13:06लेकिन बाजार बंद होने के समय

00:13:08किसी ट्रेडर ने गलती से एक ऑर्डर दे दिया

00:13:11और 28 डॉलर पर एक शेयर का सौदा हो गया।

00:13:14तकनीकी रूप से देखा जाए तो,

00:13:16उस दिन का निचला स्तर (low) 28 डॉलर है।

00:13:18भले ही उस व्यक्ति ने गलती की और नुकसान उठाया,

00:13:21पर रिकॉर्ड में निचला स्तर 28 डॉलर ही दर्ज होना चाहिए।

00:13:24यही हकीकत है।

00:13:25अब सवाल है कि आप 'लो' और 'हाई' कैसे तय करेंगे?

00:13:28अगर आप इसे हटाकर 41 डॉलर को निचला स्तर मानते हैं,

00:13:31तो आप असल में हुए एक ट्रेड

00:13:34यानी वास्तविक निचले स्तर को डेटा से हटा रहे हैं।

00:13:36लेकिन अगर आप इसे नहीं हटाते हैं,

00:13:38और मान लीजिए आपकी रणनीति यह है कि

00:13:40अगर 5 मिनट में कीमत 5% से ज्यादा गिरती है,

00:13:44तो खरीदारी का ऑर्डर देना है।

00:13:45ऐसी रणनीति का बैकटेस्टिंग करते समय,

00:13:47सिस्टम यह मान लेगा कि

00:13:48आपने 28 डॉलर पर शेयर खरीद लिया है।

00:13:51फिर नतीजा यह दिखेगा कि आपने 28 पर खरीदा

00:13:53और 42 डॉलर की क्लोजिंग प्राइस पर

00:13:55उसे तुरंत बेच दिया,

00:13:58जिससे उस रणनीति का मुनाफा

00:13:59बहुत ज्यादा बढ़ा-चढ़ाकर दिखाई देगा।

00:14:01चूंकि यह सिर्फ 1 शेयर था, तो आप इसे हटा सकते हैं,

00:14:03लेकिन अगर उस ट्रेडर की गलती

00:14:0610 शेयर, 100 शेयर या 10,000 शेयरों की होती तो?

00:14:09वास्तव में ऐसे मामले होते हैं।

00:14:11ऐसी गलतियाँ समय-समय पर होती रहती हैं।

00:14:14यहाँ तक कि करोड़ों का नुकसान करने वाले

00:14:17बड़े मामले भी हकीकत में हुए हैं,

00:14:20लेकिन 100 या 1,000 शेयरों वाली गलतियाँ

00:14:21काफी आम हैं।

00:14:23हाल के वर्षों में,

00:14:24चूंकि अब एल्गोरिदम ही

00:14:25ट्रेड्स को एक्जीक्यूट करते हैं,

00:14:27इसलिए सुरक्षा के कई उपाय किए गए हैं।

00:14:29तो अब यह पहले की तरह अक्सर नहीं होता,

00:14:31लेकिन बैकटेस्टिंग के लिए

00:14:33एल्गोरिदम के आने से पहले का डेटा,

00:14:36जैसे कि 2011 या 2005 का डेटा,

00:14:37जब आप इतना पीछे जाते हैं,

00:14:39तो ऐसे मामले आपको अक्सर देखने को मिलेंगे।

00:14:41तो आप उनसे कैसे निपटेंगे?

00:14:43साथ ही, कुछ ऐसी चीजें (products) होती हैं

00:14:44जो कई अलग-अलग एक्सचेंजों पर ट्रेड होती हैं।

00:14:45ऐसी स्थितियों में,

00:14:47क्या उन सभी एक्सचेंजों का डेटा

00:14:49एक साथ मिलाकर,

00:14:50उनके हाई, लो,

00:14:52वॉल्यूम आदि को सही तरीके से

00:14:53साफ करके एकीकृत (integrate) किया गया है?

00:14:56या फिर

00:14:57सिर्फ कुछ ही एक्सचेंजों का डेटा लेकर

00:14:59अधूरे डेटा के आधार पर

00:15:01बैकटेस्टिंग की जा रही है?

00:15:02अगर डेटा की कीमत कम है,

00:15:04तो इसकी संभावना काफी ज्यादा होती है।

00:15:05और MDD (Maximum Drawdown) की गणना करते समय,

00:15:07क्या आप क्लोजिंग प्राइस के बजाय लो प्राइस का इस्तेमाल करते हैं?

00:15:09उदाहरण के लिए, हर महीने

00:15:11रीबैलेंसिंग करने वाली रणनीतियों का

00:15:13बैकटेस्टिंग करते समय,

00:15:14डेली डेटा का उपयोग करते हुए

00:15:15सिर्फ क्लोजिंग प्राइस का इस्तेमाल किया जाता है।

00:15:17लेकिन वास्तव में,

00:15:18सटीक गिरावट (drawdown) मापने के लिए,

00:15:20आपको दिन के दौरान होने वाली गिरावट (intra-day drawdown)

00:15:21भी देखनी चाहिए।

00:15:22ऐसी छोटी-छोटी बातें,

00:15:24या फ्यूचर्स (futures) में बैकटेस्टिंग करते समय,

00:15:26यदि वह एक्सपायरी वाला प्रोडक्ट है,

00:15:27तो उसे 'रोलओवर' कैसे किया जा रहा है?

00:15:29अक्सर बैकटेस्टिंग में,

00:15:31लगातार आने वाली फ्यूचर्स एक्सपायरी को जोड़कर

00:15:33एक डेटा सेट बनाया जाता है,

00:15:34जिस पर टेस्टिंग होती है।

00:15:35लेकिन उस एक्सपायरी रोलओवर को

00:15:37किस तरह से हैंडल किया जा रहा है?

00:15:38इस तरह की समस्याएँ

00:15:39और इनके अलावा भी बहुत सी समस्याएँ होती हैं।

00:15:40तो क्या आपने इन डेटा समस्याओं के बारे में

00:15:42कभी सोचा है?

00:15:44या अगर आप किसी बैकटेस्टिंग सेवा का उपयोग कर रहे हैं,

00:15:47तो क्या आप बस यह मान लेते हैं कि कंपनी ने डेटा ठीक ही दिया होगा?

00:15:51इन चीजों की जांच करना बहुत जरूरी है,

00:15:53क्योंकि डेटा की वजह से बहुत सारी गलतियाँ होती हैं

00:15:57और अक्सर बैकटेस्टिंग के परिणाम

00:15:59पूरी तरह से गलत या भ्रामक हो जाते हैं।

00:16:01डेटा से जुड़ी एक और बड़ी समस्या है

00:16:04'सर्वाइवरशिप बायस' (Survivorship Bias)।

00:16:06यह बैकटेस्टिंग की सबसे आम गलतियों में से एक है।

00:16:08यह जो तस्वीर आप देख रहे हैं,

00:16:10पता नहीं यह पहले विश्व युद्ध की है या दूसरे की,

00:16:12लेकिन वायु सेना अपने विमानों को मजबूत बनाना चाहती थी।

00:16:16उन्हें यह तय करना था कि विमान के किस हिस्से पर

00:16:18ज्यादा सुरक्षा कवच या कवच की परत लगानी चाहिए।

00:16:20इसे समझने के लिए,

00:16:21इंजीनियरों ने युद्ध से

00:16:24वापस लौटे विमानों का निरीक्षण किया और

00:16:26यह देखा कि उन पर सबसे ज्यादा गोलियाँ कहाँ लगी हैं।

00:16:28उन्होंने उस हिस्से की पहचान की।

00:16:29उन्होंने सोचा कि इन हिस्सों पर सबसे ज्यादा गोलियाँ लग रही हैं,

00:16:33इसलिए हमें यहाँ

00:16:34लोहे की चादर को और मोटा करना चाहिए,

00:16:36और उन्होंने यही निष्कर्ष निकाला।

00:16:38लेकिन यह एक बहुत बड़ी गलती थी।

00:16:40क्योंकि असल में, इस हिस्से,

00:16:42इस हिस्से,

00:16:42या इन हिस्सों पर

00:16:44जिन विमानों को गोलियाँ लगी थीं,

00:16:46वे सभी क्रैश हो गए और कभी वापस नहीं लौटे।

00:16:49तो सिर्फ उपलब्ध डेटा के आधार पर

00:16:50दिए गए डेटा के आधार पर निष्कर्ष निकालना कितना खतरनाक हो सकता है,

00:16:52यह उसका एक बहुत अच्छा उदाहरण है।

00:16:54अब, अगर हम शेयर बाजार में 'सर्वाइवरशिप बायस' (survival bias) की बात करें,

00:16:56तो उदाहरण के लिए,

00:16:57अभी देखने पर ऐसा लगता है कि,

00:16:59अगर हमने 80 के दशक में एप्पल और माइक्रोसॉफ्ट खरीदा होता,

00:17:02तो किस्मत चमक गई होती।

00:17:03ऐसा सोचकर,

00:17:05मान लीजिए कि हम वैसी ही टेक कंपनियों के शेयर खरीदने की रणनीति बनाते हैं।

00:17:08लेकिन वास्तव में, उस समय 80 के दशक में,

00:17:10एप्पल या माइक्रोसॉफ्ट जितनी ही होनहार कंपनियां,

00:17:13उस समय 30 से भी ज्यादा थीं।

00:17:14और उनमें से 28 कंपनियां खत्म हो गईं।

00:17:17यानी सिर्फ दो कंपनियां ही बची रहीं।

00:17:19तो चूँकि सिर्फ ये दो ही बचीं,

00:17:22इन्हें देखते हुए हम सोचते हैं कि,

00:17:23अरे, अगर हम अभी वैसे निवेश करेंगे तो मालामाल हो जाएंगे।

00:17:27इस तरह, केवल आज जीवित बची कंपनियों को ही,

00:17:30बैकटेस्टिंग (backtesting) का आधार बनाकर,

00:17:32जब आप टेस्टिंग करते हैं, तो मुनाफा बढ़ा-चढ़ाकर ही दिखेगा।

00:17:35और जाहिर है, बैकटेस्टिंग की अवधि जितनी लंबी होगी,

00:17:38यह समस्या उतनी ही बढ़ती जाएगी।

00:17:40क्योंकि उस लंबी अवधि के दौरान,

00:17:41निश्चित रूप से ऐसी कई कंपनियां रही होंगी जो शुरुआत में तो थीं,

00:17:43पर बाद में गायब हो गईं।

00:17:45लेकिन हैरानी की बात है कि कई नए निवेशक,

00:17:47जब इस तरह की बैकटेस्टिंग शुरू करते हैं,

00:17:48तो सबसे पहले 'स्टॉक यूनिवर्स' (stock universe) तय करते हैं।

00:17:51यानी किन शेयरों पर टेस्टिंग करनी है,

00:17:54उसका दायरा तय करते समय,

00:17:55वे आज मौजूद कंपनियों को ही उसमें शामिल करते हैं।

00:17:58और फिर उसी दायरे के भीतर,

00:17:59विभिन्न पैमानों पर बैकटेस्टिंग करके,

00:18:02यह तय करने की कोशिश करते हैं कि उनमें से अच्छी कंपनियां कैसे चुनें।

00:18:05जब वे इस तरह से फैसला लेते हैं,

00:18:07तो इसका मतलब यह है कि,

00:18:08टेस्टिंग की शुरुआत से लेकर अब तक,

00:18:11दिवालिया हो चुकी सभी कंपनियां बाहर हो जाती हैं।

00:18:13यह मानकर बैकटेस्टिंग की जा रही है,

00:18:16जैसे आपके पास भविष्य देख लेने की कोई दैवीय शक्ति हो।

00:18:18ऐसे में मुनाफा तो असलियत से ज्यादा बढ़ा-चढ़ाकर दिखेगा ही।

00:18:21इसलिए बैकटेस्टिंग करते समय,

00:18:23अगर यह 20 साल की टेस्टिंग है,

00:18:25तो साल 2001 में मौजूद कंपनियों के साथ,

00:18:29इसकी शुरुआत करनी चाहिए और,

00:18:30उन्हीं को अपना आधार बनाना चाहिए।

00:18:32मैं यह बात कहना चाहता हूँ।

00:18:33एक और बात,

00:18:34यूट्यूब पर दिखने वाले 'सुपर इन्वेस्टर्स' (super investors) के मामले में भी,

00:18:37सर्वाइवरशिप बायस की समस्या होने की संभावना हो सकती है।

00:18:40निश्चित रूप से कई लोग अपनी काबिलियत से सुपर इन्वेस्टर बने हैं,

00:18:43लेकिन कुछ ऐसे भी हो सकते हैं जिन्होंने बहुत बड़ा जोखिम लिया,

00:18:45किसी एक शेयर में बहुत बड़ी हिस्सेदारी खरीदी,

00:18:48और जब उसकी किस्मत चमक गई,

00:18:49तो वे सुपर इन्वेस्टर बन गए।

00:18:51लेकिन ऐसा ही जोखिम उठाने वाले,

00:18:5330 या 50 और लोग भी रहे होंगे।

00:18:55पर उस तरह का बड़ा जोखिम लेने वाले उन 50 लोगों में से,

00:18:58केवल एक ही बच पाया,

00:18:59और दर्शक केवल उसी सफल व्यक्ति को देख रहे हैं।

00:19:02तो यह भी शायद सर्वाइवरशिप बायस का ही एक मामला हो सकता है।

00:19:05इसलिए इस समय,

00:19:06अगर आप बहुत बड़ा जोखिम भरा निवेश करते हैं,

00:19:08If you make such an incredibly high-risk investment,

00:19:11तो इसकी कोई गारंटी नहीं है कि आप सफल होंगे,

00:19:13बल्कि 50 में से एक खुशकिस्मत व्यक्ति होने पर ही ऐसा संभव है।

00:19:17तो इन पूर्वाग्रहों (biases) के प्रति जागरूक रहने मात्र से ही,

00:19:20आप काफी तर्कसंगत और समझदारी भरा निवेश कर सकते हैं।

00:19:22इसलिए बैकटेस्टिंग प्लेटफॉर्म का उपयोग करते समय,

00:19:24डेटा से जुड़ी वे समस्याएं जिनके बारे में मैंने पहले बताया,

00:19:27या सर्वाइवरशिप बायस की समस्या,

00:19:28लोग अक्सर सब कुछ उस प्लेटफॉर्म प्रदाता पर ही छोड़ देते हैं।

00:19:31बहुत ही सहजता से।

00:19:32लेकिन क्या वाकई उस कंपनी ने,

00:19:33इन चीजों या डेटा की उन समस्याओं पर,

00:19:35सच में बहुत बारीकी से काम किया होगा?

00:19:37क्या उन्होंने उपयोगकर्ताओं के मुनाफे और,

00:19:39उनके वास्तविक रिटर्न की चिंता करते हुए,

00:19:41इतना सारा पैसा लगाकर,

00:19:43डेटा को बिल्कुल सटीक और साफ बनाया होगा?

00:19:45इस बात की जांच आपको जरूर करनी चाहिए।

00:19:48इसके बाद, दूसरी सावधानी बरतने वाली बात है,

00:19:50“लुक-अहेड बायस” (look-ahead bias),

00:19:52यानी भविष्य को पहले से न देखना।

00:19:54To give look-ahead bias a rough name,

00:19:57तो इसे 'भविष्य दर्शन पूर्वाग्रह' कह सकते हैं?

00:19:58शायद इसे इस तरह से भी समझा जा सकता है।

00:20:00ट्रेडिंग के समय जो जानकारी उपलब्ध नहीं होनी चाहिए,

00:20:03चूँकि बैकटेस्टिंग पिछले डेटा पर की जाती है,

00:20:05तो समय के हिसाब से,

00:20:07ऐसी जानकारी जो पिछले साल उपलब्ध नहीं थी,

00:20:09पर पिछले साल की ट्रेडिंग में उस जानकारी का संदर्भ लेकर,

00:20:12ट्रेडिंग करने का लॉजिक (logic) तैयार करना,

00:20:14ऐसी गलतियाँ अक्सर देखने को मिलती हैं।

00:20:15इसी को लुक-अहेड बायस कहा जाता है।

00:20:18इसका एक बहुत ही आम उदाहरण यह है कि,

00:20:21मान लीजिए, इस महीने सितंबर 2021 के हिसाब से,

00:20:24सभी कोरियाई शेयरों की बैकटेस्टिंग करना मुश्किल है,

00:20:27तो चलिए सिर्फ 100 शेयरों पर करते हैं।

00:20:29उपयोगकर्ता ऐसा सोचता है।

00:20:30तो वह कोस्पी (KOSPI) की मार्केट कैप वाली टॉप 100 कंपनियों को चुनता है,

00:20:34और उन पर बैकटेस्टिंग करता है।

00:20:35जैसे कि PER (मूल्य-आय अनुपात) इतना हो तो खरीदने की रणनीति।

00:20:38इस तरह से,

00:20:3910 साल की बैकटेस्टिंग करने पर,

00:20:41मुनाफा बहुत अच्छा दिखता है।

00:20:42पर यहाँ गलत क्या हुआ?

00:20:44आपने सितंबर 2021 के हिसाब से टॉप 100 कंपनियों को चुना,

00:20:50सिर्फ उन्हीं को छांटा,

00:20:51लेकिन जब आप 2011 से 10 साल की बैकटेस्टिंग कर रहे हैं,

00:20:55तो यह तो वैसा ही हुआ जैसे 2011 में ही आपको पता हो,

00:20:59कि 2021 में कौन सी कंपनियां टॉप 100 में होंगी।

00:21:01मार्केट कैप में ऊपर होने का मतलब असल में यह है कि,

00:21:03उस शेयर की कीमत लगातार बढ़ती रही है।

00:21:06लोग भले ही इन चीजों पर ध्यान न दें,

00:21:08पर मार्केट कैप के आधार पर सीमा तय करके,

00:21:11कि चलो बस कुछ सौ कंपनियां ही लेते हैं,

00:21:12जब वे ऐसा सोचते हैं,

00:21:14तो वे बहुत बड़ी गलती कर रहे होते हैं।

00:21:15और एक और उदाहरण यह है कि,

00:21:17कंपनी के वित्तीय विवरणों (financial statements) के डेटा पर बैकटेस्टिंग करते समय,

00:21:21हर तिमाही में हर कंपनी द्वारा नतीजे घोषित करने की,

00:21:24तारीखें अलग-अलग होती हैं।

00:21:26लेकिन उन कंपनियों के नतीजे घोषित करने के बाद,

00:21:29क्या उसके बाद पोर्टफोलियो में बदलाव (rebalancing) या,

00:21:31ट्रेडिंग की जा रही है?

00:21:33मान लीजिए अगले महीने की शुरुआत में कंपनी ने नतीजे दिए,

00:21:36पर उस जानकारी का पता होने के बावजूद, उससे कुछ दिन पहले ही,

00:21:40महीने के अंत में पोर्टफोलियो बदल दिया गया।

00:21:41यह तो भविष्य जानकर पहले ही ट्रेड करने जैसा हो गया।

00:21:44ऐसी चीजें बैकटेस्टिंग में घुल-मिल सकती हैं।

00:21:46और एक अन्य उदाहरण यह है,

00:21:48मान लीजिए कि आप क्लोजिंग प्राइस (closing price) पर ट्रेड करते हैं।

00:21:50ऐसा मानकर,

00:21:52आप रोज़ाना पोर्टफोलियो रीबैलेंस करते हैं,

00:21:54पर क्लोजिंग प्राइस तो दिन खत्म होने के बाद ही पता चलता है।

00:21:57लेकिन अगर ऑर्डर को बाजार बंद होने से,

00:22:005 मिनट पहले निष्पादित करने की बैकटेस्टिंग की जाती है,

00:22:03तो इस तरह से समय के अंतराल में,

00:22:05भविष्य को पहले से जान लेने का,

00:22:07पूर्वाग्रह पैदा हो सकता है।

00:22:09अब, इसके बाद तीसरी बात बहुत ही ज्यादा महत्वपूर्ण है।

00:22:11ओवर-ऑप्टिमाइज़ेशन (over-optimization) से बचना।

00:22:13इस बात पर जितना भी ज़ोर दिया जाए, कम है।

00:22:16ओवर-ऑप्टिमाइज़ेशन का मतलब है कि,

00:22:18दिए गए केवल सैंपल डेटा (sample data) पर ही,

00:22:19मॉडल को बहुत ज्यादा सटीक या प्रभावी बनाना।

00:22:23उदाहरण के लिए, अभी हमारे पास यह सैंपल है।

00:22:25तो हम जो जानना चाहते हैं,

00:22:27वह इसके पीछे की पूरी 'पॉपुलेशन' (population) है।

00:22:29पूरी वास्तविक स्थिति को,

00:22:32हम आंकना चाहते हैं।

00:22:34अगर कोई पॉपुलेशन का मतलब नहीं जानता,

00:22:36तो मैं संक्षेप में समझा देता हूँ।

00:22:38जैसे हम चुनाव परिणामों के लिए,

00:22:40जनमत सर्वेक्षण (survey) करते हैं।

00:22:41अगर हम पूरे देश के लोगों का सर्वे करें,

00:22:44तो वह एक सटीक और संपूर्ण सर्वेक्षण होगा।

00:22:46जिसकी सटीकता 100% होगी।

00:22:48पर पूरे देश का सर्वे करना संभव नहीं है,

00:22:50इसलिए पूरे देश में से कुछ 'सैंपल' चुने जाते हैं।

00:22:53सिर्फ कुछ लोगों को चुनकर, यह माना जाता है कि वह सैंपल पूरी आबादी का प्रतिनिधित्व करता है।

00:22:58यानी वह प्रतिनिधि (representative) है।

00:22:59यह मानकर हम अनुमान लगाते हैं।

00:23:02तो इस तरह के डेटा में भी, वास्तव में इसके पीछे की आबादी का डेटा,

00:23:06कुछ इस तरह फैला होगा,

00:23:08और उनमें से हम कुछ सैंपल चुनते हैं,

00:23:10और उन सैंपल्स के ज़रिए यह अंदाज़ा लगाते हैं कि पूरी आबादी का डेटा कैसा दिखेगा।

00:23:16तो यह उस आकार के हिसाब से मॉडल को 'फिट' (fit) करने की कोशिश है।

00:23:20पर मॉडल को फिट करने का मतलब है कि,

00:23:22इस सैंपल और मॉडल की 'ट्रेंड लाइन' (trend line) के बीच,

00:23:25हमें वह रेखा ढूंढनी होगी जहाँ अंतर (error) कम से कम हो।

00:23:30ऐसी रेखाएं।

00:23:30लेकिन अगर आप यहाँ दिख रहे इस टेढ़े-मेढ़े,

00:23:34जटिल मॉडल को फिट करते हैं,

00:23:37तो इस सैंपल डेटा के हिसाब से अंतर 'जीरो' है।

00:23:39यह हर एक बिंदु को छू रहा है।

00:23:41तो इस सैंपल के लिए यह बिना किसी त्रुटि वाला,

00:23:44जीरो एरर मॉडल है।

00:23:47पर क्या वाकई यह पीछे की पूरी आबादी को सही से दर्शाता है?

00:23:51शायद नहीं, है ना?

00:23:51अगर आप नए सैंपल लेंगे, तो यह अंतर बहुत बढ़ जाएगा।

00:23:54इसलिए आपको इसे सही तरीके से फिट करना चाहिए,

00:23:58ताकि जब नए सैंपल आएं,

00:24:00तो उन गलतियों का कुल जोड़ कम रहे।

00:24:03दूसरी ओर, अगर आप एक बहुत ही साधारण सीधी रेखा को,

00:24:06इस तरह फिट कर देते हैं,

00:24:08तो इसे 'अंडर-फिट' (underfit) कहेंगे, यानी कम ऑप्टिमाइज़ेशन।

00:24:10तो सैंपल में ही अंतर (error) बहुत ज्यादा हो जाएगा।

00:24:13इसलिए किसी भी मॉडलिंग में सबसे ज़रूरी बात यह है कि,

00:24:16उसे सही ढंग से ऑप्टिमाइज़ किया जाए।

00:24:18लेकिन बहुत से लोग जब बैकटेस्टिंग करते हैं,

00:24:20तो वे पिछले डेटा को, जो एक तरह से सैंपल डेटा ही है,

00:24:24उस सैंपल डेटा के साथ इस तरह काम करते हैं कि,

00:24:26बस उस सैंपल के भीतर मुनाफा ज्यादा से ज्यादा दिखे,

00:24:29और इसके लिए वे उसमें दुनिया भर के नियम डाल देते हैं,

00:24:32ताकि रिटर्न अधिकतम हो सके।

00:24:35उदाहरण के लिए, 2015 से 2021 तक के डेटा पर बैकटेस्टिंग करने पर पता चला कि,

00:24:39अगर PER 13.75 से ज्यादा और 17.23 से कम हो,

00:24:43और मार्केट कैप 51.7 अरब से ज्यादा और 62.3 अरब से कम हो,

00:24:46अगर आप PBR 1.17 से कम वाले शेयर खरीदते हैं,

00:24:50तो सालाना 70% रिटर्न संभव है।

00:24:52इस तरह के बैकटेस्टिंग परिणाम सामने आए हैं।

00:24:54इसे देखकर ही पता चलता है कि यह पूरी तरह से ओवरफिटिंग है।

00:24:57यह अत्यधिक अनुकूलन (Over-optimization) का मामला है।

00:24:58जैसे कि कोई कंपनी जिसका PER 17.24 था लेकिन उसका प्रदर्शन बहुत खराब था,

00:25:04शायद वह इस डेटा में शामिल थी।

00:25:05या फिर मार्केट कैप लगभग 51.5 अरब था,

00:25:09लेकिन वह एक बहुत ही बुरा उदाहरण था, इसलिए उन्होंने ऐसा सेट किया।

00:25:12इस तरह से सिर्फ उस सैंपल डेटा या पुराने डेटा को देखकर बहुत बारीकी से,

00:25:16अगर आप किसी भी तरह से रिटर्न को अधिकतम करने की कोशिश करते हैं,

00:25:19तो इस तरह का मॉडल तैयार होता है।

00:25:21और फिर भविष्य में अगर उस वितरण से वास्तव में डेटा सामने आता है,

00:25:25तो त्रुटि की गुंजाइश (margin of error) बढ़ जाती है।

00:25:27यह वही बात है,

00:25:28चलिए इसे थोड़ा और विस्तार से देखते हैं।

00:25:29यह भी अत्यधिक अनुकूलन (over-optimization) का एक उदाहरण है।

00:25:31हम लाल और नीले रंग को अच्छी तरह से विभाजित करने वाली,

00:25:34एक रेखा सीखना चाहते हैं।

00:25:36वैसा एक रेखा मॉडल।

00:25:37लेकिन यहाँ यह काली रेखा बिल्कुल सही तरीके से सीखी गई है,

00:25:40जबकि यह हरी टेढ़ी-मेढ़ी रेखा,

00:25:42दिखाई देने वाले नीले और लाल बिंदुओं के आधार पर,

00:25:46उन्हें पूरी तरह से विभाजित कर रही है।

00:25:48तो इस सैंपल डेटा के हिसाब से,

00:25:50यह शून्य त्रुटि वाली एक आदर्श रेखा है,

00:25:52लेकिन वास्तव में इसके पीछे की जनसंख्या में,

00:25:55नीले बिंदु कहीं भी आ सकते हैं,

00:25:57और लाल बिंदु भी कहीं से भी निकल सकते हैं,

00:25:59तो भविष्य में जब वास्तव में नया डेटा आएगा,

00:26:03तो इस हरी रेखा में बहुत सारी त्रुटियाँ होंगी।

00:26:05ऐसा हम अनुमान लगा सकते हैं।

00:26:07इसलिए अगर आप पुराने डेटा में बहुत बारीकी से फिट बैठते हैं,

00:26:10तो वह भविष्य में लागू नहीं होगा।

00:26:11यह भी कुछ वैसा ही उदाहरण है,

00:26:13स्कूल में पढ़ने वाले 100 छात्रों की व्यक्तिगत जानकारी का,

00:26:15विस्तृत डेटा एकत्र किया गया।

00:26:16इसके आधार पर, इस वर्ष के 100 छात्रों में से,

00:26:19यह पहचानें कि किन छात्रों के अंक अच्छे होंगे।

00:26:20तब आप कहेंगे कि जिनका उपनाम 'संग' है,

00:26:22या जिनकी लंबाई इतनी है,

00:26:23Just like that, in the data of last year's top students,

00:26:26अत्यधिक अनुकूलन (over-optimize) करके,

00:26:28अगर आप ऐसे पहचान के नियम तय करते हैं,

00:26:30और इसे इस साल के छात्रों पर लागू करते हैं,

00:26:32तो यह पूरी तरह से बेतुका हो सकता है।

00:26:34इसके बजाय, अगर आप नियम बनाते हैं कि जो छात्र,

00:26:37इतने घंटों से ज्यादा पढ़ाई करते हैं,

00:26:39और इसे पिछले साल के छात्रों के डेटा पर लागू करते हैं,

00:26:42तो यह इतनी बारीकी वाले नियम की तुलना में,

00:26:44इसकी सटीकता कम हो सकती है।

00:26:45लेकिन भले ही सटीकता थोड़ी कम हो,

00:26:47अगर इसे वास्तव में इस साल के छात्रों पर आजमाया जाए,

00:26:49तो इसकी सटीकता उतनी ही अच्छी रहने की संभावना अधिक है।

00:26:53तो फिर, हम इस ओवर-ऑप्टिमाइजेशन की समस्या को कैसे कम कर सकते हैं?

00:26:56हर बैकटेस्टिंग में किसी न किसी हद तक ओवर-ऑप्टिमाइजेशन की समस्या होती है,

00:27:00और इसे पूरी तरह से खत्म करना असंभव है।

00:27:01तो, उदाहरण के लिए, पिछले 5 वर्षों के डेटा पर बैकटेस्ट की गई रणनीति का रिटर्न,

00:27:06भविष्य के 3 वर्षों में प्रभावी होगा या नहीं, यह हमें कैसे पता चलेगा?

00:27:08उस सवाल का सही जवाब तो,

00:27:11बस 3 साल तक ट्रेडिंग करके देखना ही है, है ना?

00:27:12लेकिन यह तो बाद की बात है,

00:27:15अगर आपने 3 साल तक ट्रेडिंग की और नुकसान हुआ,

00:27:17तो यह बेमतलब होगा, है ना?

00:27:17इसलिए एक तरीका है,

00:27:19जिसे “आउट ऑफ सैंपल डेटा” (Out of Sample Data) कहते हैं,

00:27:21यानी सैंपल के बाहर के डेटा का उपयोग करना।

00:27:23मुझे नहीं पता कि यह अनुवाद सही है या नहीं,

00:27:25लेकिन इसे आमतौर पर OOS डेटा कहा जाता है।

00:27:27तो उदाहरण के लिए,

00:27:28सितंबर 2015 से सितंबर 2021 तक,

00:27:31यानी 6 साल के डेटा में,

00:27:33अच्छे रिटर्न वाली रणनीति ढूँढना और,

00:27:34अक्टूबर 2021 से ट्रेडिंग शुरू करना सही नहीं होगा।

00:27:38ऐसा करने के बजाय,

00:27:39सितंबर 2014 से सितंबर 2020 तक,

00:27:426 साल के डेटा का उपयोग करके,

00:27:44एक अच्छी रणनीति ढूँढें और फिर,

00:27:46उसे अक्टूबर 2020 से लेकर,

00:27:49सितंबर 2021 तक के डेटा पर एक बार फिर बैकटेस्ट करें।

00:27:52यानी 2014 से 6 साल के डेटा पर,

00:27:55बैकटेस्टिंग करते समय एक अच्छी रणनीति ढूँढने के बाद,

00:27:57यह कल्पना करें कि आप वास्तव में अक्टूबर 2020 से ट्रेडिंग कर रहे हैं,

00:28:02और 1 साल के लिए उसका बैकटेस्ट करें।

00:28:04अगर उसका परिणाम अच्छा आता है,

00:28:06तो अक्टूबर 2021 से वास्तविक ट्रेडिंग शुरू करें।

00:28:09बेशक, इस तरह से विभाजित करने पर,

00:28:10एक दूसरी समस्या भी पैदा होती है,

00:28:12लेकिन हम उस पर थोड़ी देर बाद चर्चा करेंगे।

00:28:13अभी मैं जो बात पहुँचाना चाहता हूँ वह यह है कि,

00:28:16अगर आपके पास इतना सैंपल डेटा है,

00:28:18तो इसमें से एक हिस्सा अलग कर दें।

00:28:19उसे अलग रखकर,

00:28:21बाकी डेटा पर रणनीति ढूँढने के लिए कड़ी मेहनत करें,

00:28:23खूब बैकटेस्टिंग करें,

00:28:24और इसे यहाँ ऑप्टिमाइज़ करने के बाद,

00:28:26सीधे वास्तविक निवेश में न जाएँ,

00:28:28बल्कि रणनीति बनाने के लिए,

00:28:30जिस डेटा का उपयोग नहीं किया गया था,

00:28:31यह कल्पना करते हुए कि यह अब असली खेल है,

00:28:33उस पर इसे आजमाएँ।

00:28:34इसे ही सैंपल के बाहर का डेटा,

00:28:35या OOS डेटा का उपयोग करना कहते हैं।

00:28:38डेटा साइंस में,

00:28:39ट्रेनिंग डेटा, वैलिडेशन डेटा,

00:28:41ट्रेन डेटा, टेस्ट डेटा,

00:28:42या डेवलपमेंट डेटा जैसे,

00:28:44शब्द इतने महत्वपूर्ण नहीं हैं।

00:28:45तो, चौथा बिंदु तीसरे से जुड़ा है,

00:28:46सत्यापन (validation) का मौका केवल एक बार मिलता है।

00:28:48यह बहुत, बहुत, बहुत महत्वपूर्ण है।

00:28:50इस पर जितना भी जोर दिया जाए कम है,

00:28:53यह वास्तव में एक अत्यंत महत्वपूर्ण वाक्य है,

00:28:58चलिए इस आउट-ऑफ-सैंपल डेटा टेस्टिंग के बारे में,

00:29:01थोड़ा और विस्तार से बात करते हैं।

00:29:03अब, सैंपल डेटा और आउट-ऑफ-सैंपल डेटा के,

00:29:04कई अलग-अलग नाम हैं,

00:29:06लेकिन इस वीडियो में,

00:29:08हम इन्हें ट्रेनिंग डेटा और वैलिडेशन डेटा के रूप में,

00:29:09एकसमान नाम देंगे।

00:29:11पिछले उदाहरण में आपने देखा,

00:29:122014 से 2020 तक का,

00:29:13डेटा ट्रेनिंग डेटा है,

00:29:16ट्रेनिंग डेटा का मतलब है,

00:29:18वह डेटा जिसका उपयोग रणनीति खोजने के लिए किया गया था,

00:29:19और रणनीति खोजने के बाद,

00:29:20उसे सत्यापित (validate) करना,

00:29:22यानी उस आखिरी 1 साल के,

00:29:24डेटा पर जो बैकटेस्टिंग की गई,

00:29:26उसे हम वैलिडेशन डेटा कहेंगे।

00:29:28तो, यह ग्राफ क्या दिखाता है?

00:29:30नियम या मॉडल कितना जटिल है,

00:29:32जैसे-जैसे हम दाईं ओर बढ़ते हैं,

00:29:35मॉडल उतना ही जटिल होता जाता है।

00:29:36जैसे कि 173cm से लेकर,

00:29:38173.25cm तक,

00:29:40इस तरह से अगर आप नियम तय करते हैं,

00:29:42तो जैसे-जैसे आप ऐसा करेंगे,

00:29:44जटिलता बढ़ती जाएगी।

00:29:45और यह 'पूर्वानुमान त्रुटि' (prediction error) है,

00:29:47यानी जब इसे असलियत में लागू किया जाता है,

00:29:49तो त्रुटि कितनी बड़ी होती है,

00:29:50यहाँ आप देख सकते हैं कि,

00:29:52ट्रेनिंग सैंपल,

00:29:53यानी ट्रेनिंग डेटा में,

00:29:54आप जितना जटिल मॉडल उपयोग करेंगे,

00:29:55त्रुटि उतनी ही कम होती जाएगी।

00:29:58जैसा कि पहले बताया गया था, जहाँ कई सैंपल्स हैं,

00:29:59वहाँ आप उसे टेढ़ा-मेढ़ा करके,

00:30:02जितना जटिल बनाएंगे,

00:30:03उस सैंपल डेटा के भीतर,

00:30:05आप त्रुटि को शून्य तक ला सकते थे।

00:30:06इसलिए मॉडल को जितना अधिक जटिल बनाएंगे,

00:30:08त्रुटि उतनी ही शून्य की ओर बढ़ेगी;

00:30:12लेकिन इस तरह से सीखे गए मॉडल को,

00:30:14जब आप अलग रखे गए वैलिडेशन डेटा पर,

00:30:16आजमा कर देखते हैं,

00:30:18तो देखते हैं कि त्रुटि कितनी आती है।

00:30:19शुरू में जब मॉडल बहुत सरल होता है,

00:30:21जैसे कि एक सीधी रेखा,

00:30:23या जब वह 'अंडरफिट' होता है,

00:30:24तो त्रुटि लगभग समान रहती है।

00:30:26लेकिन जैसे-जैसे मॉडल या नियम जटिल होते जाते हैं,

00:30:28इस ट्रेनिंग डेटा के सैंपल में,

00:30:31त्रुटि कम होती रहती है,

00:30:33लेकिन इस वैलिडेशन डेटा में,

00:30:35एक न्यूनतम स्तर (bottom) पर पहुँचने के बाद,

00:30:37अत्यधिक जटिल होने लगते ही त्रुटि बढ़ने लगती है।

00:30:40निवेश के बैकटेस्टिंग के संदर्भ में कहें तो,

00:30:42अगर आप बहुत अधिक बैकटेस्टिंग चलाते हैं,

00:30:45और बहुत बारीक नियम तय करते हैं,

00:30:47बार-बार बैकटेस्ट करते हैं,

00:30:51और बहुत बारीकी से,

00:30:52पैरामीटर्स सेट करते हैं,

00:30:55जैसे कि PER का मान कितना होना चाहिए,

00:30:56जितना अधिक आप इसे बारीक और जटिल बनाएंगे,

00:30:59पुराने डेटा पर रिटर्न उतना ही बढ़ता जाएगा।

00:31:02चूँकि यह त्रुटि का ग्राफ है, इसलिए जितना कम हो उतना अच्छा है।

00:31:05मतलब, पुराने डेटा पर बहुत अधिक फिट किया गया बैकटेस्ट,

00:31:08जितना अधिक आप फिट करेंगे, रिटर्न उतना ही बेहतर दिखेगा,

00:31:12लेकिन जब इसे वास्तविकता में लागू किया जाता है,

00:31:15तो बहुत अधिक जटिलता की स्थिति में,

00:31:17नियम जितना जटिल होगा,

00:31:18वास्तविक रिटर्न उतना ही कम होता जाएगा।

00:31:21यह कुछ इस तरह काम करता है।

00:31:23अभी मैंने कम त्रुटि का मतलब,

00:31:24बेहतर रिटर्न बताया,

00:31:26और अधिक त्रुटि का मतलब खराब रिटर्न,

00:31:28इस तरह से मैंने इसे व्यक्त किया है;

00:31:31लेकिन तकनीकी रूप से देखा जाए तो,

00:31:32त्रुटि बढ़ने का मतलब केवल,

00:31:33रिटर्न कम होना नहीं है।

00:31:34मतलब, आप बैकटेस्टिंग को जितना गलत करेंगे,

00:31:37और जितना अधिक ओवरफिट करेंगे,

00:31:39बैकटेस्टिंग रिटर्न और भविष्य के रिटर्न के बीच का अंतर,

00:31:42यानी त्रुटि उतनी ही बड़ी होती जाएगी।

00:31:45वह त्रुटि संयोग से,

00:31:47ज़्यादा भी हो सकती है,

00:31:49या कम भी हो सकती है।

00:31:50लेकिन आम तौर पर जब ऐसी त्रुटि होती है,

00:31:51लेकिन आम तौर पर, अगर ऐसी कोई गलती होती है,

00:31:53तो वास्तविक दुनिया में मुनाफा कम हो जाता है।

00:31:55ऐसा इसलिए है क्योंकि पिछले डेटा के साथ फिट करते समय,

00:31:57हमने मुनाफे को जितना हो सके बढ़ाने के लिए

00:31:59जबरदस्ती डेटा को एडजस्ट किया होता है,

00:32:00इसलिए जब उस मुनाफे के आंकड़े में कोई अंतर आता है,

00:32:02तो वह आमतौर पर नीचे की ओर ही होता है।

00:32:03तो फिर, हम ट्रेनिंग डेटा और वैलिडेशन डेटा को

00:32:06बैकटेस्टिंग के लिए कैसे विभाजित करें?

00:32:08उदाहरण के लिए, 2011 से 2021 तक के

00:32:1111 साल के डेटा पर ट्रेनिंग करके अगले साल से उसे लागू करना,

00:32:15इसका मतलब है कि आप अलग से वैलिडेशन डेटा का उपयोग नहीं कर रहे हैं।

00:32:18आप पूरे डेटा को ट्रेनिंग के लिए इस्तेमाल करके उसे लागू कर रहे हैं,

00:32:21और मैं इसकी सलाह नहीं देता।

00:32:22जैसा कि मैंने पहले बताया, विभाजन करने का

00:32:25एक तरीका यह है कि 10 साल के डेटा को ट्रेनिंग डेटा मानकर सीखें,

00:32:28फिर 2021 के आखिरी 1 साल पर उसे वैलिडेट करें,

00:32:31और फिर 2022 से उसे लागू करें।

00:32:34लेकिन जैसा कि मैं थोड़ी देर में बताऊंगा,

00:32:36यह भी बहुत अच्छा तरीका नहीं है।

00:32:38इसके अलावा कुछ और बेहतर तरीके क्या हैं?

00:32:40एक तरीका है जिसे 'वॉक-फॉरवर्ड टेस्टिंग' कहते हैं,

00:32:43इसमें क्या होता है कि,

00:32:44उदाहरण के लिए, 1999 से 3 साल के डेटा पर

00:32:46ट्रेनिंग करके पैरामीटर्स को ऑप्टिमाइज़ किया जाता है,

00:32:49और उसके आधार पर 1 साल के लिए वैलिडेशन किया जाता है,

00:32:52और फिर इसे 'रोलिंग' तरीके से आगे बढ़ाया जाता है।

00:32:55इस तरह से अगर आप अपनी रणनीति तैयार करते हैं,

00:32:58तो मान लीजिए कि एक बहुत ही सरल मॉडल है,

00:33:01वैसे तो मुझे लगता है कि सिर्फ PER के आधार पर बैकटेस्टिंग करना

00:33:04बेतुका है,

00:33:05पर मान लेते हैं कि एक निश्चित स्तर से कम PER वाले शेयर खरीदने की रणनीति है।

00:33:08तो 10 साल के डेटा के आधार पर

00:33:11अगर आप PER को ऑप्टिमाइज़ करते हैं,

00:33:13तो हर साल के लिए सबसे अच्छे PER मानक अलग-अलग होंगे,

00:33:17लेकिन आप उनमें से एक औसत स्तर चुनेंगे जो आम तौर पर ठीक हो।

00:33:20लेकिन अगर आप इस दायरे को थोड़ा छोटा करें,

00:33:22तो पिछले 3 सालों के आधार पर PER वैल्यू तय करके ट्रेड करें,

00:33:26और इस तरह से टेस्टिंग करें,

00:33:28तो आप इन पैरामीटर्स को समय के साथ

00:33:30ज्यादा लचीले ढंग से एडजस्ट कर पाएंगे।

00:33:32यह टेस्टिंग का एक तरीका है,

00:33:35आप इस तरह से भी टेस्ट कर सकते हैं,

00:33:37और इसके बाद आता है K-Fold CV,

00:33:38जिसे क्रॉस वैलिडेशन कहा जाता है।

00:33:39यह कैसे काम करता है कि,

00:33:41यहाँ K का मतलब है कि आप डेटा को कितने हिस्सों में बांटते हैं।

00:33:45अगर आप चित्र देखें, तो K की वैल्यू 5 होगी।

00:33:47अगर K को 5 तय किया जाए, तो डेटा के 5 बराबर हिस्से किए जाते हैं,

00:33:50और 4 साल के डेटा पर मॉडल को ट्रेन करने के बाद,

00:33:531 साल के वैलिडेशन डेटा पर मुनाफे की जांच की जाती है।

00:33:56फिर किन्हीं अन्य 4 हिस्सों पर ट्रेनिंग दी जाती है,

00:33:59और बचे हुए एक साल पर उसकी जांच की जाती है।

00:34:01इस तरह से प्रक्रिया दोहराने के बाद, सभी मुनाफे का औसत निकाला जाता है।

00:34:05यानी, इन सभी परिणामों का मीन (औसत) लिया जाता है।

00:34:09माना जाता है कि यह आपके अपेक्षित मुनाफे के काफी करीब होगा।

00:34:12यही इसके पीछे की सोच है।

00:34:13इसके अलावा, मान लीजिए आप पिछले 10 सालों का डेटा इस्तेमाल कर रहे हैं।

00:34:16तो कुछ लोग सम (even) वर्षों के डेटा पर ट्रेनिंग करते हैं

00:34:19और विषम (odd) वर्षों के डेटा पर वैलिडेशन करते हैं।

00:34:22इन सभी तरीकों के अपने फायदे और नुकसान हैं,

00:34:23लेकिन अगर मैं इस तरीके का फायदा बताऊं,

00:34:26तो यह 'मार्केट रिजीम चेंज' के प्रति पैरामीटर्स को स्थिर रखता है।

00:34:30इसका मतलब यह है कि,

00:34:31जब वित्तीय संकट या कोरोना जैसी स्थिति आती है,

00:34:33तो बाजार का स्वभाव बदल जाता है।

00:34:35उदाहरण के लिए, 2008 में वित्तीय संकट आया,

00:34:39लेकिन अगर आपने 1998 से 2007 तक के डेटा पर ट्रेनिंग करके

00:34:43सबसे अच्छा मुनाफा देने वाली रणनीति खोजी,

00:34:45और फिर उसे वैलिडेट किया,

00:34:46तो चूंकि बाजार का स्वभाव पूरी तरह बदल चुका है,

00:34:49डेटा का वितरण (distribution) भी बदल जाएगा,

00:34:51और बाद की बाजार स्थितियों में

00:34:52पिछले पैटर्न काम नहीं आएंगे।

00:34:55लेकिन अगर आप डेटा को इस (क्रॉस वैलिडेशन) तरीके से बांटते हैं,

00:34:57तो किसी बड़ी घटना के कारण

00:35:00बाजार के स्वभाव और पैटर्न में आने वाले बदलावों के बावजूद

00:35:02आप ज्यादा मजबूती से वैलिडेशन कर सकते हैं।

00:35:06इसलिए इस पद्धति का भी उपयोग किया जाता है,

00:35:08पर ऐसा करते समय 'भविष्य को देखने' (look-ahead bias) वाली बात का

00:35:11बहुत ध्यान रखना पड़ता है।

00:35:13क्योंकि आपके ट्रेडिंग साइकिल के आधार पर,

00:35:16अगर आप मासिक आधार पर ट्रेड कर रहे हैं,

00:35:18और आपके ट्रेनिंग डेटा में

00:35:192014 का डेटा शामिल है,

00:35:22तो 2013 के नियमों या डेटा के उपयोग के आधार पर,

00:35:26ऐसी जानकारी जो केवल 2014 में ही पता चल सकती थी,

00:35:28वह गलती से वैलिडेशन डेटा में मिल सकती है।

00:35:30इससे वैलिडेशन डेटा का मुनाफा बढ़ा-चढ़ाकर दिखने लगेगा,

00:35:34क्योंकि आपने अनजाने में भविष्य की जानकारी के साथ ट्रेनिंग कर ली है।

00:35:36इसलिए आपको इस हिस्से को लेकर बहुत सावधान रहना चाहिए।

00:35:39मैंने इसे बहुत मोटे तौर पर समझाया है,

00:35:41लेकिन मशीन लर्निंग जैसे क्षेत्रों में,

00:35:44'हाइपर-पैरामीटर्स' जैसी चीजें होती हैं।

00:35:46आम तौर पर 'पैरामीटर्स' वे होते हैं जिन्हें मॉडल खुद

00:35:50सैंपल डेटा की गलती को कम करने के लिए एडजस्ट करता है,

00:35:54लेकिन 'हाइपर-पैरामीटर्स' इंसान को खुद तय करने पड़ते हैं।

00:35:57उदाहरण के लिए, अगर आप 'रिग्रेशन एनालिसिस' कर रहे हैं,

00:35:59तो आप सीधी रेखा (linear) का उपयोग करेंगे या वक्र (curve) का,

00:36:03यानी आपका मॉडल समीकरण कितना जटिल होगा,

00:36:07यह निर्णय

00:36:09एक इंसान लेता है।

00:36:11तो इन पैरामीटर्स की संख्या जैसी चीजें 'हाइपर-पैरामीटर्स' हैं।

00:36:15एक बार जब आप इन्हें तय कर लेते हैं, तो डेटा के आधार पर,

00:36:18डेटा की त्रुटि (error) को कम करने की दिशा में

00:36:22मॉडल उस लाइन को फिट करता है।

00:36:23इसमें जो ढलान (slope) या इंटरसेप्ट (intercept) होते हैं,

00:36:28जो डेटा के अनुसार सीखे जाते हैं, उन्हें 'पैरामीटर्स' कहा जाता है।

00:36:33आपको विभिन्न हाइपर-पैरामीटर्स को भी आज़माकर देखना चाहिए।

00:36:36इसलिए डेटा को केवल ट्रेन और टेस्ट में बांटने के बजाय,

00:36:40एक और हिस्सा अलग किया जाता है जिसे 'डेव (Dev) डेटा' कहते हैं।

00:36:42वहाँ ऑप्टिमाइज़ेशन करने के बाद,

00:36:45हाइपर-पैरामीटर्स को वहां सेट किया जाता है,

00:36:48और फिर टेस्ट डेटा से उसकी अंतिम पुष्टि की जाती है।

00:36:51जो लोग मशीन लर्निंग जानते हैं, वे इसे समझ गए होंगे,

00:36:55और जो नहीं जानते, वे शायद इतने संक्षिप्त विवरण से नहीं समझ पाएंगे,

00:36:58इसलिए चलिए आगे बढ़ते हैं।

00:37:00लेकिन इस काम को करते समय एक बहुत ही,

00:37:04बहुत ही महत्वपूर्ण बात है जिस पर जितना जोर दिया जाए कम है।

00:37:08वह है 'वैलिडेशन डेटा'।

00:37:10वैलिडेशन डेटा के परिणामों को कभी भी, कभी भी दोबारा नहीं देखना चाहिए।

00:37:15इसके परिणाम को...

00:37:16हम ट्रेनिंग डेटा पर बार-बार बैकटेस्टिंग करके एक बेहतरीन रणनीति खोजते हैं, है ना?

00:37:22तो ट्रेनिंग डेटा पर तो हमें एक अच्छी मुनाफे वाली रणनीति मिल गई,

00:37:26लेकिन क्या वह असली दुनिया में भी उतनी ही अच्छी होगी, यह जांचने के लिए

00:37:31हम उस समय या डेटा का उपयोग करते हैं जो ट्रेनिंग में शामिल नहीं था।

00:37:38लेकिन इसे कभी भी दो बार नहीं चलाना चाहिए।

00:37:41इसे सिर्फ एक बार चलाएं, और अगर उस एक बार में मुनाफा खराब आता है,

00:37:45तो चाहे आपने सालों मेहनत की हो या उस रणनीति को बनाने में जान लगा दी हो,

00:37:50आपको उस पूरी रणनीति को छोड़ देना चाहिए।

00:37:52क्यों? क्योंकि वास्तविक बाजार में उस रणनीति को लागू करने का मौका भी सिर्फ एक बार मिलता है।

00:37:57आप समय को पीछे तो नहीं मोड़ सकते।

00:37:58इसके बावजूद, लोग अक्सर पछतावे में आकर, जब वैलिडेशन डेटा खराब निकलता है,

00:38:03तो फिर से ट्रेनिंग डेटा में पैरामीटर्स को थोड़ा बदलते हैं और

00:38:07जब तक वैलिडेशन डेटा में अच्छा मुनाफा न दिखे, उसे दोहराते हैं।

00:38:10जैसे ही आप ऐसा करते हैं, वह वैलिडेशन डेटा अब वैलिडेशन डेटा नहीं रह जाता,

00:38:14बल्कि वह ट्रेनिंग डेटा का ही हिस्सा बन जाता है।

00:38:16क्योंकि आपने उस डेटा को शामिल करके ही पैरामीटर्स को ऑप्टिमाइज़ किया है।

00:38:21इसलिए यह रणनीति असली बाजार में कैसा प्रदर्शन करेगी,

00:38:26इसकी हम कोई गारंटी नहीं दे सकते।

00:38:29इसीलिए वह हिस्सा बहुत महत्वपूर्ण है।

00:38:31बैकटेस्टिंग करते समय एक और महत्वपूर्ण बिंदु, जो इसी से जुड़ा है,

00:38:34वह है 'मार्केट रिजीम' का विचार और यह कि समय बदलता रहता है।

00:38:37मैं आपसे एक सवाल पूछता हूँ।

00:38:3920 साल की बैकटेस्टिंग और 3 साल की बैकटेस्टिंग में से,

00:38:42कौन सी ज्यादा सार्थक है?

00:38:44मैंने पहले ही शीर्षक ऐसा दिया है कि जवाब साफ है,

00:38:47लेकिन कई नए निवेशक सोचते हैं कि बैकटेस्टिंग जितनी लंबी होगी,

00:38:50या डेटा जितना ज्यादा होगा, उतना ही अच्छा है।

00:38:54लेकिन अगर मुझे इन दोनों में से चुनना हो,

00:38:57तो हालांकि यह आपके समय के नजरिए और ट्रेडिंग की फ्रीक्वेंसी पर निर्भर करता है,

00:39:00लेकिन फिर भी...

00:39:01ज्यादातर मामलों में, मैं 3 साल वाला विकल्प चुनूँगा।

00:39:03डेटा की मात्रा जितनी अधिक हो, उतना ही अच्छा है।

00:39:06लेकिन वह डेटा एक ही 'डिस्ट्रीब्यूशन' (वितरण) से आना चाहिए।

00:39:09डेटा का ज्यादा होना हमेशा अच्छा है,

00:39:11लेकिन अगर उसमें ऐसा डेटा मिल जाए जहां माहौल पूरी तरह बदल चुका था, तो वह अच्छा नहीं है।

00:39:17लंबे समय की बैकटेस्टिंग में जो समस्या आती है,

00:39:20वह यह है कि बाजार का स्वभाव बदल जाता है।

00:39:22यह शायद वास्तविक ब्याज दर का ग्राफ है या...

00:39:26खैर, यह ब्याज दरों से संबंधित ग्राफ है,

00:39:28और आप देख सकते हैं कि समय के साथ 'उचित ब्याज दर' की अवधारणा,

00:39:33हालांकि इसमें उतार-चढ़ाव होता है,

00:39:34पर उस व्यवस्था के तहत ब्याज दर का स्तर अचानक बदल जाता है।

00:39:38इस समय यह यहाँ था, शायद यह ऑयल शॉक का समय था,

00:39:41खैर, उस घटना के बाद यह यहाँ पहुँच गया,

00:39:45और फिर 80 के दशक के बाद से,

00:39:47यह स्तर सामान्य ब्याज दर के रूप में माना जाने लगा।

00:39:51अब मान लीजिए आप बॉन्ड ट्रेडिंग कर रहे हैं,

00:39:53और आपने इस कालखंड के डेटा से ट्रेडिंग रणनीति सीखी है,

00:39:57ताकि आप उसे यहाँ इस्तेमाल कर सकें।

00:39:59लेकिन अगर इस बीच 'मार्केट रिजीम' बदल गया,

00:40:02तो उस पुराने डेटा से बनी मुनाफे वाली रणनीति,

00:40:07यहाँ काम नहीं करेगी।

00:40:08इसे ही 'मार्केट रिजीम चेंज' कहा जाता है।

00:40:11बाजार के स्वभाव, उसकी व्यवस्था या तंत्र में बदलाव।

00:40:14बाजार का यह स्वभाव बदलाव

00:40:17बाजार में भाग लेने वाले खिलाड़ियों (players) के बदलने से भी होता है।

00:40:20जैसे कोरोना के बाद, रिटेल निवेशकों की भारी आमद हुई,

00:40:23जिससे 'गेमस्टॉप' जैसी घटनाएं हुईं।

00:40:25कोरोना से पहले,

00:40:27वे शॉर्ट-सेलिंग रणनीतियां,

00:40:30और शॉर्ट-सेलिंग के विशेषज्ञ हेज फंड भी थे,

00:40:32उनकी रणनीतियां बहुत कारगर थीं,

00:40:34लेकिन बाजार के स्वभाव में आए इस अचानक बदलाव से,

00:40:37कुछ तो दिवालिया होने की कगार पर पहुँच गए।

00:40:39इसके अलावा, कानूनों और नियमों में बदलाव, जैसे वित्तीय संकट के बाद,

00:40:43इन्वेस्टमेंट बैंकों के लिए प्रॉप (prop) ट्रेडिंग प्रतिबंधित कर दी गई,

00:40:45और डेरिवेटिव मार्केट में कई नए नियमों ने बाजार को बदल दिया।

00:40:49तो वित्तीय संकट से पहले के डेटा पर

00:40:50आधारित जो रणनीतियां थीं,

00:40:52वे बाद में उतनी प्रभावी नहीं रहीं।

00:40:54फिर आती हैं बाहरी घटनाएं,

00:40:55जैसे ऑयल शॉक जैसी कोई बड़ी घटना

00:40:57जो पूरे बाजार को हिला देती है,

00:40:59कोई बड़ी मैक्रो-इकोनॉमिक घटना।

00:41:01और साथ ही व्यापक आर्थिक बदलाव,

00:41:03जैसे-जैसे कर्ज का अनुपात धीरे-धीरे बढ़ता गया,

00:41:06तो ब्याज दरें, जो पहले इस स्तर पर थीं,

00:41:08अब बेहद कम ब्याज दर के युग में पहुँच गई हैं।

00:41:11इसी के साथ, मात्रात्मक सहजता (QE) ने भी

00:41:13ऐसी कम ब्याज दरों को बनाए रखने में मदद की,

00:41:15और इस कारण पिछले 10 वर्षों में

00:41:17ग्रोथ स्टॉक ने जबरदस्त प्रदर्शन किया है।

00:41:19लेकिन अगर आपने मात्रात्मक सहजता से पहले के डेटा से

00:41:22एक ऐसी रणनीति बनाई जो बहुत लाभदायक दिखती थी,

00:41:24जैसे कि वैल्यू स्टॉक खरीदना आदि,

00:41:25तो जाहिर है कि अगले 10 वर्षों के लिए

00:41:27वह रणनीति बहुत खराब रही होगी।

00:41:28इसके अलावा नई तकनीकों का आगमन

00:41:30या औद्योगिक संरचना में बदलाव

00:41:32जैसे अन्य कारक भी होते हैं।

00:41:33इसलिए 20 साल का बैकटेस्टिंग करते समय,

00:41:35क्या 2001 का डेटा वाकई मायने रखता है?

00:41:38बेशक, “मार्केट रेजिम चेंज” का मतलब

00:41:40इस बात पर निर्भर करता है कि

00:41:42आप किन कारकों पर ध्यान दे रहे हैं।

00:41:43अंततः, रणनीति का लॉजिक,

00:41:45नियम या मॉडल

00:41:47किन तत्वों को देख रहे हैं

00:41:49और किस तरह के डेटा का उपयोग कर रहे हैं,

00:41:51उसके आधार पर

00:41:52आपको उस डेटा के रेजिम में

00:41:53होने वाले बदलावों को देखना होगा।

00:41:55इसलिए, कुछ डेटा ऐसे हो सकते हैं

00:41:56जिनकी प्रकृति मासिक आधार पर

00:41:58बहुत तेज़ी से बदलती है,

00:41:59जबकि कुछ अन्य डेटा

00:42:0110 या 15 वर्षों तक बहुत स्थिर हो सकते हैं।

00:42:03चूंकि कोरोना जैसे चक्र भी अलग-अलग होते हैं,

00:42:05तो सामान्य तौर पर यह कहना

00:42:07कि सिर्फ कोरोना आने की वजह से

00:42:09उससे पहले के सभी पैटर्न

00:42:09बेकार हो गए हैं, ऐसा नहीं है।

00:42:12लेकिन फिर भी, अगर आप

00:42:1420 साल पुराना डेटा इस्तेमाल करते हैं,

00:42:15तो निश्चित रूप से इसमें कुछ समस्या है।

00:42:17आप इसे इस तरह देख सकते हैं,

00:42:18कि यदि आप बहुत पुराने डेटा का

00:42:20उपयोग करके अनुमान लगाने की कोशिश करते हैं,

00:42:22तो हो सकता है कि मार्केट रेजिम

00:42:23बीच में कई बार बदला हो,

00:42:24लेकिन फिर से बदलावों के बाद

00:42:25यदि वह बहुत पुराना डेटा

00:42:29वर्तमान स्थिति को दर्शाता है,

00:42:30तो उसका उपयोग संभव हो सकता है।

00:42:32यही कारण है कि कुछ लोग कहते हैं

00:42:33कि आज का समय 1940 के दशक से मिलता-जुलता है।

00:42:35खैर, यह तो एक अलग बात थी,

00:42:37लेकिन मुद्दे पर वापस आते हैं।

00:42:38तो, क्वांट ट्रेडिंग

00:42:41अब बहुत आम हो गई है

00:42:42और व्यक्तिगत निवेशक भी इसे कर रहे हैं,

00:42:44लेकिन दीर्घकालिक निवेश में

00:42:45क्वांट निवेश की एक बड़ी खामी यह है कि

00:42:47जब आप इन मात्रात्मक तकनीकों को

00:42:49लंबे समय के निवेश पर लागू करते हैं,

00:42:51तो पर्याप्त डेटा तकनीक हासिल करने के साथ-साथ

00:42:53रेजिम चेंज से बचना बहुत मुश्किल होता है।

00:42:55उदाहरण के लिए, मान लें कि हमारे पास

00:42:57मिनट-दर-मिनट डेटा का उपयोग करने वाली एल्गोरिथम रणनीति है।

00:42:59एक मिनट में, नहीं, एक घंटे में

00:43:01डेटा के 60 पॉइंट होते हैं।

00:43:02चूंकि 60 मिनट होते हैं,

00:43:03तो 60 डेटा पॉइंट मिलेंगे।

00:43:04अब मान लीजिए कि

00:43:05यह 24 घंटे चलने वाला कोई फ्यूचर्स मार्केट है।

00:43:08तो अगर हम 24 से गुणा करें,

00:43:09तो 1440 पॉइंट होंगे।

00:43:10क्या यह सही है?

00:43:10हाँ, एक दिन में 1440 डेटा पॉइंट होते हैं।

00:43:12तो अगर एक दिन में 1440 पॉइंट हैं,

00:43:15और साल में 250 ट्रेडिंग दिन हैं

00:43:17(हफ्ते में 5 दिन के हिसाब से),

00:43:20तो एक साल में लगभग 3.5 लाख

00:43:21डेटा पॉइंट के आसपास की संख्या

00:43:23सिर्फ एक साल में हासिल की जा सकती है।

00:43:25सिर्फ एक साल के डेटा से ही

00:43:26आपको 3 लाख से ज्यादा डेटा पॉइंट मिल जाते हैं,

00:43:29इसलिए इतने बड़े डेटा सेट के साथ

00:43:32आप सार्थक जांच कर सकते हैं

00:43:33और अधिक जटिल मॉडल का उपयोग भी

00:43:35आसानी से कर सकते हैं।

00:43:36लेकिन अब मासिक आधार पर होने वाली

00:43:37रिबैलेंसिंग रणनीति की बात करते हैं।

00:43:39एक साल में केवल 12 डेटा पॉइंट होंगे।

00:43:41तो 20 साल के बाद भी

00:43:42आपके पास केवल 240 पॉइंट होंगे।

00:43:44चूंकि आप समय के साथ डेटा की संख्या नहीं बढ़ा सकते,

00:43:47इसलिए लोग विभिन्न शेयरों को देखते हुए

00:43:49डेटा के दायरे को थोड़ा विस्तार देते हैं

00:43:51ताकि सांख्यिकीय महत्व हासिल किया जा सके।

00:43:53लेकिन अंत में, समय के साथ होने वाले

00:43:54रेजिम चेंज से बचना मुश्किल है।

00:43:57तो ये चीज़ें वाकई बहुत चुनौतीपूर्ण हैं।

00:43:58कोरोना महामारी के बाद,

00:44:00बहुत से क्वांट विशेषज्ञों ने—

00:44:02जैसे कि इनिगो फ्रेजर-जेनकिंस,

00:44:05जो एक बहुत प्रसिद्ध कंपनी में क्वांट हेड थे—

00:44:09उन्होंने इस बारे में लिखा कि

00:44:11“मैं अब क्वांट क्यों नहीं रहा?”

00:44:13उनका मूल तर्क यह था कि

00:44:15क्वांट का काम भविष्य की भविष्यवाणी के लिए अतीत के पैटर्न का उपयोग करना है,

00:44:19लेकिन इस तरह से

00:44:20जब कोरोना जैसी घटना होती है, तो पुराने पैटर्न बेकार हो जाते हैं।

00:44:23जब मार्केट रेजिम में बदलाव आता है,

00:44:25तो क्वांट बहुत ही कम कुछ कर पाते हैं।

00:44:28यही वजह है कि क्वांट विशेषज्ञों के लिए

00:44:30एक अस्तित्वगत संकट की बात की जा रही है।

00:44:31और पिछला साल क्वांट के लिए बहुत बुरा था।

00:44:34हालाँकि कुछ क्वांट अच्छा करने में सफल रहे,

00:44:36लेकिन औसत तौर पर यह बहुत, बहुत खराब रहा।

00:44:38मुझे लगता है कि हम अब आधे रास्ते पर पहुँच गए हैं,

00:44:40लेकिन डेढ़ घंटा पहले ही बीत चुका है,

00:44:43इसलिए पहला भाग यहीं समाप्त करते हैं।

00:44:45कल दूसरे भाग में, हम बिंदु 6 से 10 तक चर्चा करेंगे,

00:44:49इसके फायदों और सीमाओं को देखेंगे,

00:44:50और फिर क्वांट के अध्ययन के लिए पाठ्यक्रम

00:44:52के बारे में बात करेंगे।

00:44:54तो, आपसे दूसरे भाग में मिलते हैं।

00:44:55धन्यवाद।

Description

목차 00:00 시작 01:43 필독: 공지사항 04:57 퀀트의 분류 06:31 퀀트 매매의 원칙 07:06 잘못된 "퀀트 투자"의 예 08:10 백테스팅의 가정 09:05 조엘 그린블라트 "마법 공식"의 허와 실 11:06 백테스팅 플랫폼이자 헤지펀드 퀀토피안의 몰락 12:02 퀀트 투자에서 조심해야할 점 10가지 12:27 1. 데이터를 의심하라 19:48 2. 미래를 먼저 바라보지 마라 22:09 3. 과최적화를 피하라 28:46 4. 검증 기회는 단 한번 뿐이다 38:31 5. 시대는 변한다 [[[ 2부에서 계속... ]]] 안녕하세요. 월스트리트 현역 데이터 과학자, 전직 시카고 옵션 트레이더입니다. 최근 몇 년, 퀀트 투자가 개인 투자자 사이에서 점점 보편화되고 있습니다. 그런데 퀀트 투자와 백테스팅도 잘못하면 독이 된다는 사실, 알고 계신가요? 이번 영상에서는 퀀트 투자나 매매를 할 때 반드시 명심해야할 점 10가지에 대해 2부에 걸쳐서 다룹니다. 이 10가지만 명심하셔도 적어도 잘못된 방법으로 백테스팅해서 시간낭비를 하거나 금전적 손실을 입는 것은 예방할 수 있다고 생각합니다. 물론, 올바르게 백테스팅을 하더라도 수익이 보장되지는 않습니다. 많은 구독과 좋아요, 알림 설정 부탁드립니다. #퀀트투자 #백테스팅 #퀀트매매

Community Posts

क्वांट निवेश बैकटेस्टिंग का घातक धोखा: 2026 के लिए व्यावहारिक उत्तरजीविता रणनीति

makedream8 мар. 2026 г.8230

Write about this video