00:00:00लेकिन अगर हम पिछले 10, 20 या 30 सालों को देखें,
00:00:03उस पूरी अवधि पर विचार करते हुए,
00:00:04तो उस दौरान कितने ऐसे पैटर्न्स रहे होंगे जो वास्तव में फायदेमंद थे?
00:00:09इसका जवाब है - अनगिनत। और इसे साबित भी किया जा सकता है।
00:00:12नमस्ते, मैं हूँ वॉल स्ट्रीट गे।
00:00:21आज हम क्वांट इन्वेस्टिंग (Quant Investing) के बारे में बात करेंगे।
00:00:24मेरे यूट्यूब चैनल पर कमेंट्स और ईमेल के जरिए,
00:00:26कई लोगों ने मुझसे क्वांट ट्रेडिंग के बारे में बताने का अनुरोध किया था।
00:00:29मेरे भविष्य के लक्ष्यों और इस चैनल के पाठ्यक्रम के हिसाब से,
00:00:33अल्गोरिदम ट्रेडिंग या क्वांट ट्रेडिंग को,
00:00:36इतनी जल्दी कवर करने की मेरी कोई योजना नहीं थी।
00:00:38लेकिन हमारे चैनल के सब्सक्राइबर्स में से,
00:00:40लगभग 15% लोग क्वांट ट्रेडिंग करते हैं,
00:00:44और साथ ही, आजकल क्वांट इन्वेस्टिंग को लेकर कुछ चिंताजनक बातें भी सामने आ रही हैं।
00:00:48इसीलिए मैंने यह वीडियो बनाने का फैसला किया।
00:00:50आज हम सबसे पहले क्वांट के वर्गीकरण और इसके सिद्धांतों पर,
00:00:53एक संक्षिप्त नज़र डालेंगे,
00:00:56और उसके बाद क्वांट ट्रेडिंग में ध्यान रखने वाली 10 सावधानियों पर चर्चा करेंगे।
00:00:59अगर आप इन 10 बातों को याद रखते हैं, तो क्वांट ट्रेडिंग में,
00:01:04आप अपना कीमती समय बर्बाद करने से बच सकते हैं,
00:01:06या फिर बैक-टेस्टिंग और अन्य तरीकों में,
00:01:09गलत तरीके अपनाने की वजह से,
00:01:11होने वाले बड़े नुकसान से खुद को बचा पाएंगे।
00:01:15हैरानी की बात यह है कि ये बिल्कुल बुनियादी बातें हैं,
00:01:18फिर भी बाजार में बिकने वाले बहुत महंगे पेड कोर्सेज में,
00:01:21इन विषयों पर विस्तार से चर्चा नहीं की जाती।
00:01:24बल्कि वे कोर्सेज बैक-टेस्टिंग और क्वांट इन्वेस्टिंग जैसी चीज़ों को,
00:01:27ज़्यादा ही बढ़ा-चढ़ाकर और आकर्षक बनाकर पेश करते हैं।
00:01:31लेकिन आज इन 10 बातों पर ध्यान देकर आप क्वांट इन्वेस्टिंग या ट्रेडिंग से जुड़ी,
00:01:35किसी भी जानकारी या सर्विस का उपयोग करते समय,
00:01:39काफी हद तक सुरक्षित रहेंगे और खुद को बचा सकेंगे।
00:01:43शुरू करने से पहले, कुछ दिन पहले मैंने थोड़े गुस्से में,
00:01:47एक छोटी सी पोस्ट डाली थी,
00:01:49शायद वहां मैंने थोड़ी गलती कर दी।
00:01:51मैंने लिखा था कि आजकल क्वांट इन्वेस्टिंग को लेकर वायरल मार्केटिंग और बढ़ा-चढ़ाकर किए जा रहे विज्ञापन,
00:01:54अपनी सीमाएं पार कर रहे हैं।
00:01:55उस पर कुछ कमेंट्स ऐसे आए जिनमें किसी खास व्यक्ति,
00:01:59या कंपनी के खिलाफ नफरत भरे शब्द लिखे गए थे।
00:02:02मुझे लगा कि इससे उन लोगों या कंपनियों को ठेस पहुँच सकती है, इसलिए मैंने वह पोस्ट हटा दी।
00:02:06सच कहूँ तो, ये चीज़ें कोई अवैध स्टॉक लीडिंग रूम या,
00:02:09किसी अवैध कंपनी जैसे बुरे काम नहीं हैं,
00:02:12तो शायद मैं ज़रूरत से ज़्यादा दखल दे रहा हूँ।
00:02:16लेकिन दूसरी तरफ, अवैध खातों जैसी समस्याओं में,
00:02:19इस्तेमाल करने वाले लोग भी जानते हैं कि यह गलत है,
00:02:22और उनके लालच की भी इसमें कुछ ज़िम्मेदारी होती है।
00:02:25लेकिन आजकल क्वांट इन्वेस्टिंग की चर्चाओं को देखकर लगता है,
00:02:28कि वे साधारण लोग जो ईमानदारी से मेहनत करके,
00:02:33निवेश के ज़रिए अपनी आर्थिक स्थिति सुधारना चाहते हैं,
00:02:35वे जब क्वांट इन्वेस्टिंग की दुनिया में कदम रखते हैं,
00:02:37तो उन्हें काफी नुकसान हो सकता है।
00:02:40क्योंकि क्वांट इन्वेस्टिंग के साथ अक्सर “विज्ञान” और “आँकड़े” जैसे शब्द जुड़े होते हैं,
00:02:46जिससे लोग भ्रमित हो सकते हैं, भले ही उसमें कुछ चीज़ें अवैज्ञानिक हों।
00:02:51अवैध लीडिंग रूम या खाते तो साफ तौर पर गलत दिखते हैं,
00:02:55इसलिए उनसे बचना आसान है,
00:02:56लेकिन यहाँ मेहनत करने वाले मासूम लोग शिकार बन सकते हैं।
00:03:01कोई कहता है कि कुछ ही दिनों में आप क्वांट इन्वेस्टिंग के एक्सपर्ट बन सकते हैं,
00:03:04या यह दशकों के डेटा से जाँची-परखी रणनीति है,
00:03:08या फिर पिछले 10 सालों में इसने 20% का चक्रवृद्धि ब्याज (compound return) दिया है,
00:03:11तो आगे भी ऐसा ही होगा - इस तरह की बातें की जाती हैं।
00:03:14भले ही कहने वाले का इरादा बुरा न हो और उसने बस यूँ ही कह दिया हो,
00:03:18लेकिन कई नए निवेशक (Stock-children),
00:03:20इसे सच मानकर गलतफहमी का शिकार हो सकते हैं।
00:03:23वे बैक-टेस्टिंग में अपना बहुत सारा समय बर्बाद कर सकते हैं,
00:03:25और उन्हें आर्थिक नुकसान भी उठाना पड़ सकता है।
00:03:27खासकर तब जब वे बैक-टेस्टिंग के परिणामों पर अंधा विश्वास कर लेते हैं।
00:03:32इसीलिए अमेरिकी नियामक SEC के नियमों के अनुसार,
00:03:35अगर कोई फंड इस तरह की मार्केटिंग करता है, तो उसे अवैध माना जाता है।
00:03:38तो जो लोग क्वांट इन्वेस्टिंग के बारे में बात करते हैं,
00:03:41उन्हें दूसरों के पैसे की ज़िम्मेदारी को थोड़ा और गंभीरता से समझना चाहिए।
00:03:45पता नहीं मैं कब तक यूट्यूब करूँगा,
00:03:47लेकिन मैं यह सब सिर्फ अच्छा दिखने के लिए नहीं कह रहा हूँ।
00:03:51मैंने खुद अपने 20 के दशक के मध्य में पैसों की बहुत किल्लत देखी है,
00:03:52इसलिए मैं जानता हूँ कि वह कैसा महसूस होता है।
00:03:56चूंकि मैं अक्सर नुकसान के समय मानसिक प्रबंधन की बात करता हूँ,
00:03:58और अपने पुराने घाटे की कहानियाँ साझा करता हूँ,
00:04:01तो शायद इसीलिए मेरे पास ऐसे बहुत से सवाल आते हैं।
00:04:05हर हफ्ते मुझे ऐसे कई ईमेल मिलते हैं,
00:04:09जिनमें सब्सक्राइबर्स करोड़ों के नुकसान की वजह से सलाह मांगते हैं।
00:04:14इसलिए मुझे लगता है कि फाइनेंस, स्टॉक और रियल एस्टेट से जुड़े यूट्यूबर्स को,
00:04:16एक बार अपनी बातों का आत्म-निरीक्षण ज़रूर करना चाहिए।
00:04:20मैं खुद भी आजकल जब “80 दिनों की निवेश यात्रा” कर रहा हूँ,
00:04:24तो मुझे महसूस हो रहा है कि मैं अनजाने में 'लीडिंग' (Leading) जैसा कुछ कर रहा हूँ।
00:04:26इसलिए मैंने सोचा है कि इस मंदी के खत्म होते ही मैं फिर से अपनी बुनियादी शैली पर लौट जाऊँगा।
00:04:29खैर, इसी उद्देश्य के साथ मैंने यह वीडियो बनाया है।
00:04:33मेरा इरादा किसी खास व्यक्ति या कंपनी को निशाना बनाना बिल्कुल नहीं है।
00:04:37हो सकता है कि क्वांट मार्केटिंग करने वाले लोग भी,
00:04:40अनजाने में कुछ गलतियाँ कर रहे हों।
00:04:43मेरा मकसद बस यह है कि हम सब मिलकर इन चीज़ों को समझें और सुधारें।
00:04:46तो दर्शकों से भी मेरी विनती है कि कमेंट्स में,
00:04:49किसी का नाम लेकर उस पर हमला न करें।
00:04:51भूमिका काफी लंबी हो गई,
00:04:55अब चलिए क्वांट के वर्गीकरण से शुरुआत करते हैं।
00:04:57क्वांट एक बहुत ही व्यापक शब्द है जिसके कई अर्थ हो सकते हैं।
00:04:58सुविधा के लिए अगर हम इसे समय के अनुसार बाँटें,
00:05:01तो सबसे पहले आती है 'अल्ट्रा-हाई फ्रीक्वेंसी ट्रेडिंग' (Ultra HFT)।
00:05:04इसमें सर्वर्स को एक्सचेंज के पास ही रखा जाता है (Co-location),
00:05:07कोडिंग मशीन लैंग्वेज लेवल पर की जाती है,
00:05:10और पूरा ध्यान हार्डवेयर की गति पर होता है।
00:05:12इसके बाद आती है 'अल्गोरिदम ट्रेडिंग',
00:05:14जिसका समय थोड़ा ज़्यादा लंबा होता है।
00:05:19इसमें तकनीकी संकेतक (Technical indicators) या नियमों का पालन किया जाता है।
00:05:20यह आजकल व्यक्तिगत निवेशकों के बीच काफी लोकप्रिय हो रही है,
00:05:22खासकर बैक-टेस्टिंग प्लेटफॉर्म्स की वजह से।
00:05:24फिर आता है 'स्टैटिस्टिकल आर्बिट्राज' (Statistical Arbitrage) जैसे 'पेयर ट्रेडिंग'।
00:05:28इसमें सांख्यिकीय मॉडल और तकनीकों का उपयोग करके,
00:05:29पुराने पैटर्न्स को ढूँढा जाता है,
00:05:33और इस धारणा पर काम किया जाता है कि कीमतें वापस औसत पर आएंगी (Mean reversion)।
00:05:35अगला है 'फैक्टर इन्वेस्टिंग' (Factor Investing)।
00:05:39यह थोड़ा दीर्घकालिक होता है, जिसमें मोमेंटम, वैल्यू, या कैरी जैसे,
00:05:41कीमतों को प्रभावित करने वाले कारकों (Factors) को पहचाना जाता है।
00:05:42पिछले कुछ सालों में 'क्वांटामेंटल' (Quantamental) काफी चर्चा में है।
00:05:44इसमें फंडामेंटल एनालिसिस को डेटा के ज़रिए ऑटोमेट किया जाता है,
00:05:46और वैकल्पिक डेटा (Alternative data) का उपयोग करके लंबी अवधि का निवेश किया जाता है।
00:05:48इसी तरह, मशीन लर्निंग, बिग डेटा और वैकल्पिक डेटा का उपयोग,
00:05:50अब कई अलग-अलग क्षेत्रों में फैल रहा है।
00:05:52ये वर्गीकरण बस समझने की सुविधा के लिए हैं,
00:05:54क्योंकि इनके बीच की सीमाएं काफी धुंधली हैं।
00:05:59कभी-कभी इस पूरे क्षेत्र को ही अल्गोरिदम ट्रेडिंग कह दिया जाता है।
00:06:01इसलिए मैं यहाँ सामान्य तौर पर 'क्वांट ट्रेडिंग' शब्द का ही इस्तेमाल करूँगा।
00:06:03क्वांट ट्रेडिंग के बुनियादी सिद्धांत इस प्रकार हैं:
00:06:06पहला, आपके पास एक निवेश का विचार या परिकल्पना (Hypothesis) होनी चाहिए।
00:06:07उसके बाद आता है 'बैक-टेस्टिंग'।
00:06:10आप उस विचार को पुराने ऐतिहासिक डेटा पर परखते हैं।
00:06:12आप देखते हैं कि अगर मैंने अतीत में ऐसा किया होता,
00:06:16तो क्या वास्तव में मुझे मुनाफा होता?
00:06:18अगर बैक-टेस्टिंग में अच्छे नतीजे मिलते हैं,
00:06:20तो फिर आप वास्तविक ट्रेडिंग शुरू करते हैं,
00:06:23और साथ ही जोखिम प्रबंधन (Risk management) भी करते हैं।
00:06:26इन चार चरणों में यह पूरी प्रक्रिया चलती है।
00:06:28देखा जाए तो 2010 के दशक के मध्य तक,
00:06:30क्वांट ट्रेडिंग केवल बड़े संस्थानों और पीएचडी धारकों वाले,
00:06:31क्वांट फंड्स तक ही सीमित थी।
00:06:33लेकिन धीरे-धीरे यह तकनीक और निष्पादन के मामले में,
00:06:35काफी सामान्य होती जा रही है।
00:06:37अमेरिका में 'क्वांटोपियन' जैसी सेवाओं के आने से,
00:06:40बैक-टेस्टिंग बहुत आसान हो गई है,
00:06:42और अब आम लोग भी बड़ी आसानी से इसका उपयोग कर पा रहे हैं।
00:06:44लेकिन इसके साथ ही, क्वांट इन्वेस्टिंग को लेकर गलतफहमियां भी बढ़ रही हैं।
00:06:47उदाहरण के लिए, कोई कह सकता है कि पिछले 15 सालों में,
00:06:50अगर आपने 0.92 से कम PBR वाली और पिछले 12 महीनों में बढ़त दिखाने वाली कंपनियों में निवेश किया होता,
00:06:51तो आपको सालाना 20.2% का रिटर्न मिलता।
00:06:54फिर वे PBR की वैल्यू थोड़ा बदलकर देखते हैं,
00:06:56तो रिटर्न 14% या 17.8% हो जाता है।
00:06:57इस तरह की कई बैक-टेस्टिंग करने के बाद,
00:07:00वे देखते हैं कि पहला परिणाम सबसे अच्छा था,
00:07:01और वे निष्कर्ष निकालते हैं कि हमें इसी नियम के साथ निवेश करना चाहिए।
00:07:03लेकिन असल में, यह सोचने का एक गलत तरीका है।
00:07:06अगर आप गौर से सोचें,
00:07:09तो बैक-टेस्टिंग इस अनिश्चित धारणा पर टिकी है,
00:07:13कि अतीत का पैटर्न भविष्य में भी दोहराया जाएगा।
00:07:16इसमें हम बस उन पैटर्न्स को ढूँढ रहे हैं जो अतीत में सफल थे।
00:07:18लेकिन अगर हम पिछले 10, 20 या 30 सालों की अवधि को देखें,
00:07:21तो उस दौरान ऐसे कितने पैटर्न्स हो सकते हैं जिन्होंने अच्छा मुनाफा दिया होगा?
00:07:23ज़रा वीडियो रोकें और इस बारे में सोचें।
00:07:25जवाब है - अनंत। इसे साबित भी किया जा सकता है।
00:07:28चूंकि रणनीतियों के पैरामीटर्स निरंतर (Continuous) होते हैं,
00:07:30इसलिए हज़ारों-लाखों ऐसी रणनीतियाँ संभव हैं जो अतीत में सफल रही होंगी।
00:07:33लेकिन असली सवाल यह है कि उनमें से कितनी भविष्य में भी सफल होंगी?
00:07:35यही क्वांट इन्वेस्टिंग का सबसे महत्वपूर्ण हिस्सा है।
00:07:38अतीत में सफल रहे किसी पैटर्न को ढूँढना,
00:07:40अगर आपके पास सही टूल्स हैं, तो कोई भी कर सकता है।
00:07:42लेकिन ऐसी चीज़ ढूँढना जो अतीत में भी अच्छी थी और भविष्य में भी अच्छी रहेगी,
00:07:46बेहद मुश्किल काम है।
00:07:48यह भूसे के ढेर में सुई ढूँढने जैसा है।
00:07:51मैंने कई वेबसाइट्स और ब्लॉग्स पर देखा है,
00:07:53कि जोएल ग्रीनब्लाट का “मैजिक फॉर्मूला” (Magic Formula) बहुत मशहूर है।
00:07:56उन्होंने मार्केट कैप जैसे कुछ सरल फ़िल्टर्स का उपयोग करके,
00:07:58शेयरों को चुनने का एक बहुत ही आसान तरीका बताया था।
00:08:01उन्होंने इस पर एक किताब भी लिखी थी,
00:08:03जो व्यक्तिगत निवेशकों के बीच काफी लोकप्रिय हुई।
00:08:04हेज फंड की दुनिया में जोएल एक बहुत बड़ा नाम हैं।
00:08:07उन्होंने 1980 के दशक से निवेश करना शुरू किया था,
00:08:09और उस दौरान उनका रिटर्न वॉरेन बफेट से भी बेहतर था।
00:08:12शायद इसीलिए उनका “मैजिक फॉर्मूला” इतना प्रसिद्ध हुआ।
00:08:14लेकिन मैं आपको सीधे तौर पर बता दूँ,
00:08:16कि यह फॉर्मूला जितना दिखता है, उससे कहीं ज़्यादा पेचीदा हो सकता है।
00:08:18अतीत की सफलता भविष्य की गारंटी नहीं होती।
00:08:21कई लोग केवल उन पैटर्न्स को देख रहे हैं जो चार्ट पर सुंदर दिखते हैं।
00:08:24लेकिन क्वांट ट्रेडिंग में सबसे बड़ी चुनौती 'ओवर-फिटिंग' (Over-fitting) है।
00:08:26यानी ऐसी रणनीति बनाना जो डेटा के लिए तो सही है, पर वास्तविकता के लिए नहीं।
00:08:29हमें यह समझना होगा कि बाज़ार हमेशा बदलता रहता है।
00:08:30जो नियम पिछले 10 साल काम कर गए, वे शायद कल काम न करें।
00:08:32यही कारण है कि हमें रणनीतियों के पीछे के 'तर्क' को समझना चाहिए।
00:08:34सिर्फ आँकड़ों पर भरोसा करना खतरनाक हो सकता है।
00:08:36एक सफल क्वांट निवेशक वही है जो जोखिम को समझता है।
00:08:38बैक-टेस्टिंग केवल पहला कदम है, अंतिम सत्य नहीं।
00:08:42हमें भविष्य के अनपेक्षित बदलावों के लिए तैयार रहना चाहिए।
00:08:46मार्केट में बहुत सारा 'शोर' (Noise) होता है।
00:08:50उस शोर में से असली 'सिग्नल' को पहचानना ही कला है।
00:08:52ज़्यादातर लोग बस कंप्यूटर के द्वारा निकाली गई लाइनों को देखते हैं।
00:08:55पर वे भूल जाते हैं कि बाज़ार इंसानी व्यवहार से भी चलता है।
00:08:56क्वांट का मतलब केवल गणित नहीं, बल्कि मनोविज्ञान भी है।
00:09:00अगले हिस्से में, हम उन 10 गलतियों पर विस्तार से बात करेंगे।
00:09:02इनमें से पहली गलती है 'डेटा स्नूपिंग' (Data Snooping)।
00:09:04यानी तब तक डेटा को खंगालना जब तक मनचाहा नतीजा न मिल जाए।
00:09:07यह विज्ञान नहीं, बल्कि खुद को धोखा देने जैसा है।
00:09:09दूसरी बड़ी समस्या है ट्रांजेक्शन कॉस्ट (Transaction Cost) को अनदेखा करना।
00:09:12कागज़ पर दिखने वाला मुनाफा अक्सर ब्रोकरेज और टैक्स में खत्म हो जाता है।
00:09:13तीसरी बात है तरलता या लिक्विडिटी (Liquidity) का अभाव।
00:09:15छोटे शेयरों में बैक-टेस्टिंग के नतीजे अक्सर भ्रामक होते हैं।
00:09:17उन्होंने शेयरों को चुनने के लिए एक ऐसा फॉर्मूला बनाया
00:09:20और निवेश के उस 'मैजिक फॉर्मूला' पर एक किताब लिखी।
00:09:24वह किताब काफी चर्चा में रही
00:09:25और ऐसा लगता है कि व्यक्तिगत निवेशकों के बीच काफी मशहूर हो गई है,
00:09:28लेकिन हेज फंड की दुनिया में भी यह व्यक्ति बहुत प्रसिद्ध है।
00:09:31उन्होंने 1980 के दशक से निवेश करना शुरू किया था,
00:09:33और उस निवेश अवधि के दौरान उन्होंने वारेन बफेट से भी
00:09:35बेहतर रिटर्न हासिल किया।
00:09:37शायद इसीलिए मैजिक फॉर्मूला को इतनी ज्यादा तवज्जो मिली,
00:09:40लेकिन मैं आपको निष्कर्ष पहले ही बता देता हूँ।
00:09:42ग्रीनब्लैट कोई 'क्वांट' (quant) निवेशक नहीं हैं,
00:09:44और उनके हेज फंड ने केवल मैजिक फॉर्मूला के आधार पर निवेश नहीं किया था।
00:09:47यानी वह शानदार रिटर्न सिर्फ मैजिक फॉर्मूला से नहीं आया था।
00:09:50वह फंड वैल्यू इन्वेस्टिंग के साथ-साथ
00:09:52'स्पेशल सिचुएशन' इन्वेस्टिंग भी करता था।
00:09:54उदाहरण के लिए, 'स्पिन-ऑफ' जैसी स्थितियों में,
00:09:57जब कोई कंपनी दो हिस्सों में बँटती है,
00:09:59तब कीमतों में जो अंतर या विसंगति आती है,
00:10:01उस मौके को पहचानकर वे मुनाफा कमाते थे।
00:10:04उन्होंने इस तरह की पद्धतियों का साथ में इस्तेमाल किया था।
00:10:07और मुझे नहीं लगता कि वैल्यू इन्वेस्टिंग वाले हिस्से में भी
00:10:10उन्होंने इतने सरल फॉर्मूले का इस्तेमाल किया होगा।
00:10:12बेशक, उस ढांचे का कुछ असर तो रहा होगा।
00:10:14लेकिन उन्होंने इसे केवल मशीनी तरीके से फॉर्मूले के आधार पर खरीदकर
00:10:18इतना बड़ा मुनाफा नहीं कमाया होगा।
00:10:20अब, अगर हम मैजिक फॉर्मूला सार्वजनिक होने के बाद,
00:10:222005 से इसके रिटर्न का बैकटेस्टिंग करके देखें,
00:10:26तो यह ग्रे (grey) रेखा S&P इंडेक्स है
00:10:28और यह हरी रेखा मैजिक फॉर्मूला है।
00:10:29आप देख सकते हैं कि इसमें काफी अस्थिरता रही,
00:10:32और यह लगातार बाजार से पिछड़ता गया।
00:10:34यह सिस्टमिक इक्विटी ETF जैसे निवेशों की वजह से हो सकता है,
00:10:37क्योंकि जब इस तरह के कई और निवेश बाजार में आए
00:10:40और बाजार पहले से ज्यादा कुशल (efficient) हो गया,
00:10:42तो वह फायदा या 'एज' खत्म हो गया।
00:10:44इतने प्रसिद्ध फॉर्मूले की इस स्थिति से पता चलता है कि
00:10:48अतीत में मुनाफे वाले पैटर्न ढूँढना बहुत आसान है।
00:10:50और आप उस पर किताब भी लिख सकते हैं।
00:10:53लेकिन भविष्य में भी मुनाफा देने वाला पैटर्न ढूँढना
00:10:56सच में बहुत ही मेहनत और बारीकी का काम है।
00:11:00इसलिए, कुछ दिनों की सोच और चंद क्लिक से मिलने वाली
00:11:03सालाना 20% रिटर्न की रणनीति दुनिया में मौजूद नहीं है।
00:11:06एक और उदाहरण 'क्वांटोपिअन' (Quantopian) का है।
00:11:08क्वांटोपिअन एक स्टार्टअप था जो लगभग 2011 में शुरू हुआ था,
00:11:12जिसने अमेरिका में बैकटेस्टिंग को बहुत आसान बना दिया था।
00:11:16वहाँ 3 लाख लोगों ने 1.2 करोड़ बार बैकटेस्टिंग करके
00:11:20ढेर सारी क्वांट रणनीतियाँ बनाईं और उनका परीक्षण किया।
00:11:24प्रसिद्ध अरबपति स्टीव कोहेन ने इसमें निवेश किया था,
00:11:27जो कि एक हेज फंड ट्रेडर हैं।
00:11:29और क्वांटोपिअन के शीर्ष स्तर के क्वांट्स ने
00:11:32शोध पत्र (papers) तक प्रकाशित किए कि,
00:11:34इन रणनीतियों में से कौन सी भविष्य में सफल होगी,
00:11:37इसे किस मानक और सांख्यिकीय पद्धति से
00:11:40चुनना चाहिए।
00:11:41उन्होंने इस पर बहुत गहन शोध किया और
00:11:44रणनीतियों का चयन किया ताकि
00:11:46उनके जरिए एक नया हेज फंड चलाया जा सके।
00:11:48यही उनका विचार था,
00:11:49लेकिन वे बुरी तरह विफल रहे।
00:11:51अंततः पिछले साल उन्होंने अपना कारोबार बंद कर दिया।
00:11:53ऐसी चीजें क्यों होती हैं?
00:11:55और जो दर्शक क्वांट ट्रेडिंग या निवेश करना चाहते हैं,
00:11:58वे ऐसे परिणामों से कैसे बच सकते हैं?
00:12:02बेशक, इससे पूरी तरह बचना मुमकिन नहीं है।
00:12:03और मुझे लगता है कि यह काफी कठिन काम है,
00:12:07फिर भी, अगर आप इसे आजमाना चाहते हैं,
00:12:10तो कम से कम इन 10 बातों को ध्यान में रखें
00:12:12और सावधानी बरतें।
00:12:13मैं इसी दृष्टिकोण से एक-एक करके आपको बताऊंगा।
00:12:16सिर्फ इन 10 बातों का ध्यान रखकर भी आप
00:12:17गलत बैकtesting के कारण होने वाले समय की बर्बादी और नुकसान से
00:12:22बच सकते हैं।
00:12:24बेशक, अच्छे बैकटेस्टिंग का मतलब मुनाफे की गारंटी नहीं है।
00:12:27सबसे पहली बात है कि आपको डेटा पर संदेह करना चाहिए।
00:12:31कुछ लोग गूगल या याहू के डेटा का इस्तेमाल करते हैं,
00:12:34लेकिन वह डेटा उम्मीद से कहीं ज्यादा 'गंदा' (त्रुटिपूर्ण) होता है।
00:12:37इसलिए, जो लोग शुरुआत से क्वांट ट्रेडिंग करना चाहते हैं,
00:12:41उन्हें डेटा के स्तर पर बहुत सी बाधाओं का सामना करना पड़ता है।
00:12:45ऐसा मुफ्त डेटा बहुत ही खराब और गलतियों से भरा होता है।
00:12:47और डेटा को साफ करने की प्रक्रिया में,
00:12:50जिसे डेटा क्लीनिंग कहते हैं,
00:12:51आपको लग सकता है कि सिर्फ गलतियाँ ढूँढनी हैं,
00:12:54लेकिन इसमें इंसान का व्यक्तिगत निर्णय
00:12:57और पक्षपात (bias) भी शामिल हो जाता है।
00:12:59चलिए एक उदाहरण लेते हैं।
00:13:01मान लीजिए कोई शेयर 41 से 43 डॉलर के बीच ट्रेड हो रहा था
00:13:05और उसी पर बंद हुआ।
00:13:06लेकिन बाजार बंद होने के समय
00:13:08किसी ट्रेडर ने गलती से एक ऑर्डर दे दिया
00:13:11और 28 डॉलर पर एक शेयर का सौदा हो गया।
00:13:14तकनीकी रूप से देखा जाए तो,
00:13:16उस दिन का निचला स्तर (low) 28 डॉलर है।
00:13:18भले ही उस व्यक्ति ने गलती की और नुकसान उठाया,
00:13:21पर रिकॉर्ड में निचला स्तर 28 डॉलर ही दर्ज होना चाहिए।
00:13:24यही हकीकत है।
00:13:25अब सवाल है कि आप 'लो' और 'हाई' कैसे तय करेंगे?
00:13:28अगर आप इसे हटाकर 41 डॉलर को निचला स्तर मानते हैं,
00:13:31तो आप असल में हुए एक ट्रेड
00:13:34यानी वास्तविक निचले स्तर को डेटा से हटा रहे हैं।
00:13:36लेकिन अगर आप इसे नहीं हटाते हैं,
00:13:38और मान लीजिए आपकी रणनीति यह है कि
00:13:40अगर 5 मिनट में कीमत 5% से ज्यादा गिरती है,
00:13:44तो खरीदारी का ऑर्डर देना है।
00:13:45ऐसी रणनीति का बैकटेस्टिंग करते समय,
00:13:47सिस्टम यह मान लेगा कि
00:13:48आपने 28 डॉलर पर शेयर खरीद लिया है।
00:13:51फिर नतीजा यह दिखेगा कि आपने 28 पर खरीदा
00:13:53और 42 डॉलर की क्लोजिंग प्राइस पर
00:13:55उसे तुरंत बेच दिया,
00:13:58जिससे उस रणनीति का मुनाफा
00:13:59बहुत ज्यादा बढ़ा-चढ़ाकर दिखाई देगा।
00:14:01चूंकि यह सिर्फ 1 शेयर था, तो आप इसे हटा सकते हैं,
00:14:03लेकिन अगर उस ट्रेडर की गलती
00:14:0610 शेयर, 100 शेयर या 10,000 शेयरों की होती तो?
00:14:09वास्तव में ऐसे मामले होते हैं।
00:14:11ऐसी गलतियाँ समय-समय पर होती रहती हैं।
00:14:14यहाँ तक कि करोड़ों का नुकसान करने वाले
00:14:17बड़े मामले भी हकीकत में हुए हैं,
00:14:20लेकिन 100 या 1,000 शेयरों वाली गलतियाँ
00:14:21काफी आम हैं।
00:14:23हाल के वर्षों में,
00:14:24चूंकि अब एल्गोरिदम ही
00:14:25ट्रेड्स को एक्जीक्यूट करते हैं,
00:14:27इसलिए सुरक्षा के कई उपाय किए गए हैं।
00:14:29तो अब यह पहले की तरह अक्सर नहीं होता,
00:14:31लेकिन बैकटेस्टिंग के लिए
00:14:33एल्गोरिदम के आने से पहले का डेटा,
00:14:36जैसे कि 2011 या 2005 का डेटा,
00:14:37जब आप इतना पीछे जाते हैं,
00:14:39तो ऐसे मामले आपको अक्सर देखने को मिलेंगे।
00:14:41तो आप उनसे कैसे निपटेंगे?
00:14:43साथ ही, कुछ ऐसी चीजें (products) होती हैं
00:14:44जो कई अलग-अलग एक्सचेंजों पर ट्रेड होती हैं।
00:14:45ऐसी स्थितियों में,
00:14:47क्या उन सभी एक्सचेंजों का डेटा
00:14:49एक साथ मिलाकर,
00:14:50उनके हाई, लो,
00:14:52वॉल्यूम आदि को सही तरीके से
00:14:53साफ करके एकीकृत (integrate) किया गया है?
00:14:56या फिर
00:14:57सिर्फ कुछ ही एक्सचेंजों का डेटा लेकर
00:14:59अधूरे डेटा के आधार पर
00:15:01बैकटेस्टिंग की जा रही है?
00:15:02अगर डेटा की कीमत कम है,
00:15:04तो इसकी संभावना काफी ज्यादा होती है।
00:15:05और MDD (Maximum Drawdown) की गणना करते समय,
00:15:07क्या आप क्लोजिंग प्राइस के बजाय लो प्राइस का इस्तेमाल करते हैं?
00:15:09उदाहरण के लिए, हर महीने
00:15:11रीबैलेंसिंग करने वाली रणनीतियों का
00:15:13बैकटेस्टिंग करते समय,
00:15:14डेली डेटा का उपयोग करते हुए
00:15:15सिर्फ क्लोजिंग प्राइस का इस्तेमाल किया जाता है।
00:15:17लेकिन वास्तव में,
00:15:18सटीक गिरावट (drawdown) मापने के लिए,
00:15:20आपको दिन के दौरान होने वाली गिरावट (intra-day drawdown)
00:15:21भी देखनी चाहिए।
00:15:22ऐसी छोटी-छोटी बातें,
00:15:24या फ्यूचर्स (futures) में बैकटेस्टिंग करते समय,
00:15:26यदि वह एक्सपायरी वाला प्रोडक्ट है,
00:15:27तो उसे 'रोलओवर' कैसे किया जा रहा है?
00:15:29अक्सर बैकटेस्टिंग में,
00:15:31लगातार आने वाली फ्यूचर्स एक्सपायरी को जोड़कर
00:15:33एक डेटा सेट बनाया जाता है,
00:15:34जिस पर टेस्टिंग होती है।
00:15:35लेकिन उस एक्सपायरी रोलओवर को
00:15:37किस तरह से हैंडल किया जा रहा है?
00:15:38इस तरह की समस्याएँ
00:15:39और इनके अलावा भी बहुत सी समस्याएँ होती हैं।
00:15:40तो क्या आपने इन डेटा समस्याओं के बारे में
00:15:42कभी सोचा है?
00:15:44या अगर आप किसी बैकटेस्टिंग सेवा का उपयोग कर रहे हैं,
00:15:47तो क्या आप बस यह मान लेते हैं कि कंपनी ने डेटा ठीक ही दिया होगा?
00:15:51इन चीजों की जांच करना बहुत जरूरी है,
00:15:53क्योंकि डेटा की वजह से बहुत सारी गलतियाँ होती हैं
00:15:57और अक्सर बैकटेस्टिंग के परिणाम
00:15:59पूरी तरह से गलत या भ्रामक हो जाते हैं।
00:16:01डेटा से जुड़ी एक और बड़ी समस्या है
00:16:04'सर्वाइवरशिप बायस' (Survivorship Bias)।
00:16:06यह बैकटेस्टिंग की सबसे आम गलतियों में से एक है।
00:16:08यह जो तस्वीर आप देख रहे हैं,
00:16:10पता नहीं यह पहले विश्व युद्ध की है या दूसरे की,
00:16:12लेकिन वायु सेना अपने विमानों को मजबूत बनाना चाहती थी।
00:16:16उन्हें यह तय करना था कि विमान के किस हिस्से पर
00:16:18ज्यादा सुरक्षा कवच या कवच की परत लगानी चाहिए।
00:16:20इसे समझने के लिए,
00:16:21इंजीनियरों ने युद्ध से
00:16:24वापस लौटे विमानों का निरीक्षण किया और
00:16:26यह देखा कि उन पर सबसे ज्यादा गोलियाँ कहाँ लगी हैं।
00:16:28उन्होंने उस हिस्से की पहचान की।
00:16:29उन्होंने सोचा कि इन हिस्सों पर सबसे ज्यादा गोलियाँ लग रही हैं,
00:16:33इसलिए हमें यहाँ
00:16:34लोहे की चादर को और मोटा करना चाहिए,
00:16:36और उन्होंने यही निष्कर्ष निकाला।
00:16:38लेकिन यह एक बहुत बड़ी गलती थी।
00:16:40क्योंकि असल में, इस हिस्से,
00:16:42इस हिस्से,
00:16:42या इन हिस्सों पर
00:16:44जिन विमानों को गोलियाँ लगी थीं,
00:16:46वे सभी क्रैश हो गए और कभी वापस नहीं लौटे।
00:16:49तो सिर्फ उपलब्ध डेटा के आधार पर
00:16:50दिए गए डेटा के आधार पर निष्कर्ष निकालना कितना खतरनाक हो सकता है,
00:16:52यह उसका एक बहुत अच्छा उदाहरण है।
00:16:54अब, अगर हम शेयर बाजार में 'सर्वाइवरशिप बायस' (survival bias) की बात करें,
00:16:56तो उदाहरण के लिए,
00:16:57अभी देखने पर ऐसा लगता है कि,
00:16:59अगर हमने 80 के दशक में एप्पल और माइक्रोसॉफ्ट खरीदा होता,
00:17:02तो किस्मत चमक गई होती।
00:17:03ऐसा सोचकर,
00:17:05मान लीजिए कि हम वैसी ही टेक कंपनियों के शेयर खरीदने की रणनीति बनाते हैं।
00:17:08लेकिन वास्तव में, उस समय 80 के दशक में,
00:17:10एप्पल या माइक्रोसॉफ्ट जितनी ही होनहार कंपनियां,
00:17:13उस समय 30 से भी ज्यादा थीं।
00:17:14और उनमें से 28 कंपनियां खत्म हो गईं।
00:17:17यानी सिर्फ दो कंपनियां ही बची रहीं।
00:17:19तो चूँकि सिर्फ ये दो ही बचीं,
00:17:22इन्हें देखते हुए हम सोचते हैं कि,
00:17:23अरे, अगर हम अभी वैसे निवेश करेंगे तो मालामाल हो जाएंगे।
00:17:27इस तरह, केवल आज जीवित बची कंपनियों को ही,
00:17:30बैकटेस्टिंग (backtesting) का आधार बनाकर,
00:17:32जब आप टेस्टिंग करते हैं, तो मुनाफा बढ़ा-चढ़ाकर ही दिखेगा।
00:17:35और जाहिर है, बैकटेस्टिंग की अवधि जितनी लंबी होगी,
00:17:38यह समस्या उतनी ही बढ़ती जाएगी।
00:17:40क्योंकि उस लंबी अवधि के दौरान,
00:17:41निश्चित रूप से ऐसी कई कंपनियां रही होंगी जो शुरुआत में तो थीं,
00:17:43पर बाद में गायब हो गईं।
00:17:45लेकिन हैरानी की बात है कि कई नए निवेशक,
00:17:47जब इस तरह की बैकटेस्टिंग शुरू करते हैं,
00:17:48तो सबसे पहले 'स्टॉक यूनिवर्स' (stock universe) तय करते हैं।
00:17:51यानी किन शेयरों पर टेस्टिंग करनी है,
00:17:54उसका दायरा तय करते समय,
00:17:55वे आज मौजूद कंपनियों को ही उसमें शामिल करते हैं।
00:17:58और फिर उसी दायरे के भीतर,
00:17:59विभिन्न पैमानों पर बैकटेस्टिंग करके,
00:18:02यह तय करने की कोशिश करते हैं कि उनमें से अच्छी कंपनियां कैसे चुनें।
00:18:05जब वे इस तरह से फैसला लेते हैं,
00:18:07तो इसका मतलब यह है कि,
00:18:08टेस्टिंग की शुरुआत से लेकर अब तक,
00:18:11दिवालिया हो चुकी सभी कंपनियां बाहर हो जाती हैं।
00:18:13यह मानकर बैकटेस्टिंग की जा रही है,
00:18:16जैसे आपके पास भविष्य देख लेने की कोई दैवीय शक्ति हो।
00:18:18ऐसे में मुनाफा तो असलियत से ज्यादा बढ़ा-चढ़ाकर दिखेगा ही।
00:18:21इसलिए बैकटेस्टिंग करते समय,
00:18:23अगर यह 20 साल की टेस्टिंग है,
00:18:25तो साल 2001 में मौजूद कंपनियों के साथ,
00:18:29इसकी शुरुआत करनी चाहिए और,
00:18:30उन्हीं को अपना आधार बनाना चाहिए।
00:18:32मैं यह बात कहना चाहता हूँ।
00:18:33एक और बात,
00:18:34यूट्यूब पर दिखने वाले 'सुपर इन्वेस्टर्स' (super investors) के मामले में भी,
00:18:37सर्वाइवरशिप बायस की समस्या होने की संभावना हो सकती है।
00:18:40निश्चित रूप से कई लोग अपनी काबिलियत से सुपर इन्वेस्टर बने हैं,
00:18:43लेकिन कुछ ऐसे भी हो सकते हैं जिन्होंने बहुत बड़ा जोखिम लिया,
00:18:45किसी एक शेयर में बहुत बड़ी हिस्सेदारी खरीदी,
00:18:48और जब उसकी किस्मत चमक गई,
00:18:49तो वे सुपर इन्वेस्टर बन गए।
00:18:51लेकिन ऐसा ही जोखिम उठाने वाले,
00:18:5330 या 50 और लोग भी रहे होंगे।
00:18:55पर उस तरह का बड़ा जोखिम लेने वाले उन 50 लोगों में से,
00:18:58केवल एक ही बच पाया,
00:18:59और दर्शक केवल उसी सफल व्यक्ति को देख रहे हैं।
00:19:02तो यह भी शायद सर्वाइवरशिप बायस का ही एक मामला हो सकता है।
00:19:05इसलिए इस समय,
00:19:06अगर आप बहुत बड़ा जोखिम भरा निवेश करते हैं,
00:19:08If you make such an incredibly high-risk investment,
00:19:11तो इसकी कोई गारंटी नहीं है कि आप सफल होंगे,
00:19:13बल्कि 50 में से एक खुशकिस्मत व्यक्ति होने पर ही ऐसा संभव है।
00:19:17तो इन पूर्वाग्रहों (biases) के प्रति जागरूक रहने मात्र से ही,
00:19:20आप काफी तर्कसंगत और समझदारी भरा निवेश कर सकते हैं।
00:19:22इसलिए बैकटेस्टिंग प्लेटफॉर्म का उपयोग करते समय,
00:19:24डेटा से जुड़ी वे समस्याएं जिनके बारे में मैंने पहले बताया,
00:19:27या सर्वाइवरशिप बायस की समस्या,
00:19:28लोग अक्सर सब कुछ उस प्लेटफॉर्म प्रदाता पर ही छोड़ देते हैं।
00:19:31बहुत ही सहजता से।
00:19:32लेकिन क्या वाकई उस कंपनी ने,
00:19:33इन चीजों या डेटा की उन समस्याओं पर,
00:19:35सच में बहुत बारीकी से काम किया होगा?
00:19:37क्या उन्होंने उपयोगकर्ताओं के मुनाफे और,
00:19:39उनके वास्तविक रिटर्न की चिंता करते हुए,
00:19:41इतना सारा पैसा लगाकर,
00:19:43डेटा को बिल्कुल सटीक और साफ बनाया होगा?
00:19:45इस बात की जांच आपको जरूर करनी चाहिए।
00:19:48इसके बाद, दूसरी सावधानी बरतने वाली बात है,
00:19:50“लुक-अहेड बायस” (look-ahead bias),
00:19:52यानी भविष्य को पहले से न देखना।
00:19:54To give look-ahead bias a rough name,
00:19:57तो इसे 'भविष्य दर्शन पूर्वाग्रह' कह सकते हैं?
00:19:58शायद इसे इस तरह से भी समझा जा सकता है।
00:20:00ट्रेडिंग के समय जो जानकारी उपलब्ध नहीं होनी चाहिए,
00:20:03चूँकि बैकटेस्टिंग पिछले डेटा पर की जाती है,
00:20:05तो समय के हिसाब से,
00:20:07ऐसी जानकारी जो पिछले साल उपलब्ध नहीं थी,
00:20:09पर पिछले साल की ट्रेडिंग में उस जानकारी का संदर्भ लेकर,
00:20:12ट्रेडिंग करने का लॉजिक (logic) तैयार करना,
00:20:14ऐसी गलतियाँ अक्सर देखने को मिलती हैं।
00:20:15इसी को लुक-अहेड बायस कहा जाता है।
00:20:18इसका एक बहुत ही आम उदाहरण यह है कि,
00:20:21मान लीजिए, इस महीने सितंबर 2021 के हिसाब से,
00:20:24सभी कोरियाई शेयरों की बैकटेस्टिंग करना मुश्किल है,
00:20:27तो चलिए सिर्फ 100 शेयरों पर करते हैं।
00:20:29उपयोगकर्ता ऐसा सोचता है।
00:20:30तो वह कोस्पी (KOSPI) की मार्केट कैप वाली टॉप 100 कंपनियों को चुनता है,
00:20:34और उन पर बैकटेस्टिंग करता है।
00:20:35जैसे कि PER (मूल्य-आय अनुपात) इतना हो तो खरीदने की रणनीति।
00:20:38इस तरह से,
00:20:3910 साल की बैकटेस्टिंग करने पर,
00:20:41मुनाफा बहुत अच्छा दिखता है।
00:20:42पर यहाँ गलत क्या हुआ?
00:20:44आपने सितंबर 2021 के हिसाब से टॉप 100 कंपनियों को चुना,
00:20:50सिर्फ उन्हीं को छांटा,
00:20:51लेकिन जब आप 2011 से 10 साल की बैकटेस्टिंग कर रहे हैं,
00:20:55तो यह तो वैसा ही हुआ जैसे 2011 में ही आपको पता हो,
00:20:59कि 2021 में कौन सी कंपनियां टॉप 100 में होंगी।
00:21:01मार्केट कैप में ऊपर होने का मतलब असल में यह है कि,
00:21:03उस शेयर की कीमत लगातार बढ़ती रही है।
00:21:06लोग भले ही इन चीजों पर ध्यान न दें,
00:21:08पर मार्केट कैप के आधार पर सीमा तय करके,
00:21:11कि चलो बस कुछ सौ कंपनियां ही लेते हैं,
00:21:12जब वे ऐसा सोचते हैं,
00:21:14तो वे बहुत बड़ी गलती कर रहे होते हैं।
00:21:15और एक और उदाहरण यह है कि,
00:21:17कंपनी के वित्तीय विवरणों (financial statements) के डेटा पर बैकटेस्टिंग करते समय,
00:21:21हर तिमाही में हर कंपनी द्वारा नतीजे घोषित करने की,
00:21:24तारीखें अलग-अलग होती हैं।
00:21:26लेकिन उन कंपनियों के नतीजे घोषित करने के बाद,
00:21:29क्या उसके बाद पोर्टफोलियो में बदलाव (rebalancing) या,
00:21:31ट्रेडिंग की जा रही है?
00:21:33मान लीजिए अगले महीने की शुरुआत में कंपनी ने नतीजे दिए,
00:21:36पर उस जानकारी का पता होने के बावजूद, उससे कुछ दिन पहले ही,
00:21:40महीने के अंत में पोर्टफोलियो बदल दिया गया।
00:21:41यह तो भविष्य जानकर पहले ही ट्रेड करने जैसा हो गया।
00:21:44ऐसी चीजें बैकटेस्टिंग में घुल-मिल सकती हैं।
00:21:46और एक अन्य उदाहरण यह है,
00:21:48मान लीजिए कि आप क्लोजिंग प्राइस (closing price) पर ट्रेड करते हैं।
00:21:50ऐसा मानकर,
00:21:52आप रोज़ाना पोर्टफोलियो रीबैलेंस करते हैं,
00:21:54पर क्लोजिंग प्राइस तो दिन खत्म होने के बाद ही पता चलता है।
00:21:57लेकिन अगर ऑर्डर को बाजार बंद होने से,
00:22:005 मिनट पहले निष्पादित करने की बैकटेस्टिंग की जाती है,
00:22:03तो इस तरह से समय के अंतराल में,
00:22:05भविष्य को पहले से जान लेने का,
00:22:07पूर्वाग्रह पैदा हो सकता है।
00:22:09अब, इसके बाद तीसरी बात बहुत ही ज्यादा महत्वपूर्ण है।
00:22:11ओवर-ऑप्टिमाइज़ेशन (over-optimization) से बचना।
00:22:13इस बात पर जितना भी ज़ोर दिया जाए, कम है।
00:22:16ओवर-ऑप्टिमाइज़ेशन का मतलब है कि,
00:22:18दिए गए केवल सैंपल डेटा (sample data) पर ही,
00:22:19मॉडल को बहुत ज्यादा सटीक या प्रभावी बनाना।
00:22:23उदाहरण के लिए, अभी हमारे पास यह सैंपल है।
00:22:25तो हम जो जानना चाहते हैं,
00:22:27वह इसके पीछे की पूरी 'पॉपुलेशन' (population) है।
00:22:29पूरी वास्तविक स्थिति को,
00:22:32हम आंकना चाहते हैं।
00:22:34अगर कोई पॉपुलेशन का मतलब नहीं जानता,
00:22:36तो मैं संक्षेप में समझा देता हूँ।
00:22:38जैसे हम चुनाव परिणामों के लिए,
00:22:40जनमत सर्वेक्षण (survey) करते हैं।
00:22:41अगर हम पूरे देश के लोगों का सर्वे करें,
00:22:44तो वह एक सटीक और संपूर्ण सर्वेक्षण होगा।
00:22:46जिसकी सटीकता 100% होगी।
00:22:48पर पूरे देश का सर्वे करना संभव नहीं है,
00:22:50इसलिए पूरे देश में से कुछ 'सैंपल' चुने जाते हैं।
00:22:53सिर्फ कुछ लोगों को चुनकर, यह माना जाता है कि वह सैंपल पूरी आबादी का प्रतिनिधित्व करता है।
00:22:58यानी वह प्रतिनिधि (representative) है।
00:22:59यह मानकर हम अनुमान लगाते हैं।
00:23:02तो इस तरह के डेटा में भी, वास्तव में इसके पीछे की आबादी का डेटा,
00:23:06कुछ इस तरह फैला होगा,
00:23:08और उनमें से हम कुछ सैंपल चुनते हैं,
00:23:10और उन सैंपल्स के ज़रिए यह अंदाज़ा लगाते हैं कि पूरी आबादी का डेटा कैसा दिखेगा।
00:23:16तो यह उस आकार के हिसाब से मॉडल को 'फिट' (fit) करने की कोशिश है।
00:23:20पर मॉडल को फिट करने का मतलब है कि,
00:23:22इस सैंपल और मॉडल की 'ट्रेंड लाइन' (trend line) के बीच,
00:23:25हमें वह रेखा ढूंढनी होगी जहाँ अंतर (error) कम से कम हो।
00:23:30ऐसी रेखाएं।
00:23:30लेकिन अगर आप यहाँ दिख रहे इस टेढ़े-मेढ़े,
00:23:34जटिल मॉडल को फिट करते हैं,
00:23:37तो इस सैंपल डेटा के हिसाब से अंतर 'जीरो' है।
00:23:39यह हर एक बिंदु को छू रहा है।
00:23:41तो इस सैंपल के लिए यह बिना किसी त्रुटि वाला,
00:23:44जीरो एरर मॉडल है।
00:23:47पर क्या वाकई यह पीछे की पूरी आबादी को सही से दर्शाता है?
00:23:51शायद नहीं, है ना?
00:23:51अगर आप नए सैंपल लेंगे, तो यह अंतर बहुत बढ़ जाएगा।
00:23:54इसलिए आपको इसे सही तरीके से फिट करना चाहिए,
00:23:58ताकि जब नए सैंपल आएं,
00:24:00तो उन गलतियों का कुल जोड़ कम रहे।
00:24:03दूसरी ओर, अगर आप एक बहुत ही साधारण सीधी रेखा को,
00:24:06इस तरह फिट कर देते हैं,
00:24:08तो इसे 'अंडर-फिट' (underfit) कहेंगे, यानी कम ऑप्टिमाइज़ेशन।
00:24:10तो सैंपल में ही अंतर (error) बहुत ज्यादा हो जाएगा।
00:24:13इसलिए किसी भी मॉडलिंग में सबसे ज़रूरी बात यह है कि,
00:24:16उसे सही ढंग से ऑप्टिमाइज़ किया जाए।
00:24:18लेकिन बहुत से लोग जब बैकटेस्टिंग करते हैं,
00:24:20तो वे पिछले डेटा को, जो एक तरह से सैंपल डेटा ही है,
00:24:24उस सैंपल डेटा के साथ इस तरह काम करते हैं कि,
00:24:26बस उस सैंपल के भीतर मुनाफा ज्यादा से ज्यादा दिखे,
00:24:29और इसके लिए वे उसमें दुनिया भर के नियम डाल देते हैं,
00:24:32ताकि रिटर्न अधिकतम हो सके।
00:24:35उदाहरण के लिए, 2015 से 2021 तक के डेटा पर बैकटेस्टिंग करने पर पता चला कि,
00:24:39अगर PER 13.75 से ज्यादा और 17.23 से कम हो,
00:24:43और मार्केट कैप 51.7 अरब से ज्यादा और 62.3 अरब से कम हो,
00:24:46अगर आप PBR 1.17 से कम वाले शेयर खरीदते हैं,
00:24:50तो सालाना 70% रिटर्न संभव है।
00:24:52इस तरह के बैकटेस्टिंग परिणाम सामने आए हैं।
00:24:54इसे देखकर ही पता चलता है कि यह पूरी तरह से ओवरफिटिंग है।
00:24:57यह अत्यधिक अनुकूलन (Over-optimization) का मामला है।
00:24:58जैसे कि कोई कंपनी जिसका PER 17.24 था लेकिन उसका प्रदर्शन बहुत खराब था,
00:25:04शायद वह इस डेटा में शामिल थी।
00:25:05या फिर मार्केट कैप लगभग 51.5 अरब था,
00:25:09लेकिन वह एक बहुत ही बुरा उदाहरण था, इसलिए उन्होंने ऐसा सेट किया।
00:25:12इस तरह से सिर्फ उस सैंपल डेटा या पुराने डेटा को देखकर बहुत बारीकी से,
00:25:16अगर आप किसी भी तरह से रिटर्न को अधिकतम करने की कोशिश करते हैं,
00:25:19तो इस तरह का मॉडल तैयार होता है।
00:25:21और फिर भविष्य में अगर उस वितरण से वास्तव में डेटा सामने आता है,
00:25:25तो त्रुटि की गुंजाइश (margin of error) बढ़ जाती है।
00:25:27यह वही बात है,
00:25:28चलिए इसे थोड़ा और विस्तार से देखते हैं।
00:25:29यह भी अत्यधिक अनुकूलन (over-optimization) का एक उदाहरण है।
00:25:31हम लाल और नीले रंग को अच्छी तरह से विभाजित करने वाली,
00:25:34एक रेखा सीखना चाहते हैं।
00:25:36वैसा एक रेखा मॉडल।
00:25:37लेकिन यहाँ यह काली रेखा बिल्कुल सही तरीके से सीखी गई है,
00:25:40जबकि यह हरी टेढ़ी-मेढ़ी रेखा,
00:25:42दिखाई देने वाले नीले और लाल बिंदुओं के आधार पर,
00:25:46उन्हें पूरी तरह से विभाजित कर रही है।
00:25:48तो इस सैंपल डेटा के हिसाब से,
00:25:50यह शून्य त्रुटि वाली एक आदर्श रेखा है,
00:25:52लेकिन वास्तव में इसके पीछे की जनसंख्या में,
00:25:55नीले बिंदु कहीं भी आ सकते हैं,
00:25:57और लाल बिंदु भी कहीं से भी निकल सकते हैं,
00:25:59तो भविष्य में जब वास्तव में नया डेटा आएगा,
00:26:03तो इस हरी रेखा में बहुत सारी त्रुटियाँ होंगी।
00:26:05ऐसा हम अनुमान लगा सकते हैं।
00:26:07इसलिए अगर आप पुराने डेटा में बहुत बारीकी से फिट बैठते हैं,
00:26:10तो वह भविष्य में लागू नहीं होगा।
00:26:11यह भी कुछ वैसा ही उदाहरण है,
00:26:13स्कूल में पढ़ने वाले 100 छात्रों की व्यक्तिगत जानकारी का,
00:26:15विस्तृत डेटा एकत्र किया गया।
00:26:16इसके आधार पर, इस वर्ष के 100 छात्रों में से,
00:26:19यह पहचानें कि किन छात्रों के अंक अच्छे होंगे।
00:26:20तब आप कहेंगे कि जिनका उपनाम 'संग' है,
00:26:22या जिनकी लंबाई इतनी है,
00:26:23Just like that, in the data of last year's top students,
00:26:26अत्यधिक अनुकूलन (over-optimize) करके,
00:26:28अगर आप ऐसे पहचान के नियम तय करते हैं,
00:26:30और इसे इस साल के छात्रों पर लागू करते हैं,
00:26:32तो यह पूरी तरह से बेतुका हो सकता है।
00:26:34इसके बजाय, अगर आप नियम बनाते हैं कि जो छात्र,
00:26:37इतने घंटों से ज्यादा पढ़ाई करते हैं,
00:26:39और इसे पिछले साल के छात्रों के डेटा पर लागू करते हैं,
00:26:42तो यह इतनी बारीकी वाले नियम की तुलना में,
00:26:44इसकी सटीकता कम हो सकती है।
00:26:45लेकिन भले ही सटीकता थोड़ी कम हो,
00:26:47अगर इसे वास्तव में इस साल के छात्रों पर आजमाया जाए,
00:26:49तो इसकी सटीकता उतनी ही अच्छी रहने की संभावना अधिक है।
00:26:53तो फिर, हम इस ओवर-ऑप्टिमाइजेशन की समस्या को कैसे कम कर सकते हैं?
00:26:56हर बैकटेस्टिंग में किसी न किसी हद तक ओवर-ऑप्टिमाइजेशन की समस्या होती है,
00:27:00और इसे पूरी तरह से खत्म करना असंभव है।
00:27:01तो, उदाहरण के लिए, पिछले 5 वर्षों के डेटा पर बैकटेस्ट की गई रणनीति का रिटर्न,
00:27:06भविष्य के 3 वर्षों में प्रभावी होगा या नहीं, यह हमें कैसे पता चलेगा?
00:27:08उस सवाल का सही जवाब तो,
00:27:11बस 3 साल तक ट्रेडिंग करके देखना ही है, है ना?
00:27:12लेकिन यह तो बाद की बात है,
00:27:15अगर आपने 3 साल तक ट्रेडिंग की और नुकसान हुआ,
00:27:17तो यह बेमतलब होगा, है ना?
00:27:17इसलिए एक तरीका है,
00:27:19जिसे “आउट ऑफ सैंपल डेटा” (Out of Sample Data) कहते हैं,
00:27:21यानी सैंपल के बाहर के डेटा का उपयोग करना।
00:27:23मुझे नहीं पता कि यह अनुवाद सही है या नहीं,
00:27:25लेकिन इसे आमतौर पर OOS डेटा कहा जाता है।
00:27:27तो उदाहरण के लिए,
00:27:28सितंबर 2015 से सितंबर 2021 तक,
00:27:31यानी 6 साल के डेटा में,
00:27:33अच्छे रिटर्न वाली रणनीति ढूँढना और,
00:27:34अक्टूबर 2021 से ट्रेडिंग शुरू करना सही नहीं होगा।
00:27:38ऐसा करने के बजाय,
00:27:39सितंबर 2014 से सितंबर 2020 तक,
00:27:426 साल के डेटा का उपयोग करके,
00:27:44एक अच्छी रणनीति ढूँढें और फिर,
00:27:46उसे अक्टूबर 2020 से लेकर,
00:27:49सितंबर 2021 तक के डेटा पर एक बार फिर बैकटेस्ट करें।
00:27:52यानी 2014 से 6 साल के डेटा पर,
00:27:55बैकटेस्टिंग करते समय एक अच्छी रणनीति ढूँढने के बाद,
00:27:57यह कल्पना करें कि आप वास्तव में अक्टूबर 2020 से ट्रेडिंग कर रहे हैं,
00:28:02और 1 साल के लिए उसका बैकटेस्ट करें।
00:28:04अगर उसका परिणाम अच्छा आता है,
00:28:06तो अक्टूबर 2021 से वास्तविक ट्रेडिंग शुरू करें।
00:28:09बेशक, इस तरह से विभाजित करने पर,
00:28:10एक दूसरी समस्या भी पैदा होती है,
00:28:12लेकिन हम उस पर थोड़ी देर बाद चर्चा करेंगे।
00:28:13अभी मैं जो बात पहुँचाना चाहता हूँ वह यह है कि,
00:28:16अगर आपके पास इतना सैंपल डेटा है,
00:28:18तो इसमें से एक हिस्सा अलग कर दें।
00:28:19उसे अलग रखकर,
00:28:21बाकी डेटा पर रणनीति ढूँढने के लिए कड़ी मेहनत करें,
00:28:23खूब बैकटेस्टिंग करें,
00:28:24और इसे यहाँ ऑप्टिमाइज़ करने के बाद,
00:28:26सीधे वास्तविक निवेश में न जाएँ,
00:28:28बल्कि रणनीति बनाने के लिए,
00:28:30जिस डेटा का उपयोग नहीं किया गया था,
00:28:31यह कल्पना करते हुए कि यह अब असली खेल है,
00:28:33उस पर इसे आजमाएँ।
00:28:34इसे ही सैंपल के बाहर का डेटा,
00:28:35या OOS डेटा का उपयोग करना कहते हैं।
00:28:38डेटा साइंस में,
00:28:39ट्रेनिंग डेटा, वैलिडेशन डेटा,
00:28:41ट्रेन डेटा, टेस्ट डेटा,
00:28:42या डेवलपमेंट डेटा जैसे,
00:28:44शब्द इतने महत्वपूर्ण नहीं हैं।
00:28:45तो, चौथा बिंदु तीसरे से जुड़ा है,
00:28:46सत्यापन (validation) का मौका केवल एक बार मिलता है।
00:28:48यह बहुत, बहुत, बहुत महत्वपूर्ण है।
00:28:50इस पर जितना भी जोर दिया जाए कम है,
00:28:53यह वास्तव में एक अत्यंत महत्वपूर्ण वाक्य है,
00:28:58चलिए इस आउट-ऑफ-सैंपल डेटा टेस्टिंग के बारे में,
00:29:01थोड़ा और विस्तार से बात करते हैं।
00:29:03अब, सैंपल डेटा और आउट-ऑफ-सैंपल डेटा के,
00:29:04कई अलग-अलग नाम हैं,
00:29:06लेकिन इस वीडियो में,
00:29:08हम इन्हें ट्रेनिंग डेटा और वैलिडेशन डेटा के रूप में,
00:29:09एकसमान नाम देंगे।
00:29:11पिछले उदाहरण में आपने देखा,
00:29:122014 से 2020 तक का,
00:29:13डेटा ट्रेनिंग डेटा है,
00:29:16ट्रेनिंग डेटा का मतलब है,
00:29:18वह डेटा जिसका उपयोग रणनीति खोजने के लिए किया गया था,
00:29:19और रणनीति खोजने के बाद,
00:29:20उसे सत्यापित (validate) करना,
00:29:22यानी उस आखिरी 1 साल के,
00:29:24डेटा पर जो बैकटेस्टिंग की गई,
00:29:26उसे हम वैलिडेशन डेटा कहेंगे।
00:29:28तो, यह ग्राफ क्या दिखाता है?
00:29:30नियम या मॉडल कितना जटिल है,
00:29:32जैसे-जैसे हम दाईं ओर बढ़ते हैं,
00:29:35मॉडल उतना ही जटिल होता जाता है।
00:29:36जैसे कि 173cm से लेकर,
00:29:38173.25cm तक,
00:29:40इस तरह से अगर आप नियम तय करते हैं,
00:29:42तो जैसे-जैसे आप ऐसा करेंगे,
00:29:44जटिलता बढ़ती जाएगी।
00:29:45और यह 'पूर्वानुमान त्रुटि' (prediction error) है,
00:29:47यानी जब इसे असलियत में लागू किया जाता है,
00:29:49तो त्रुटि कितनी बड़ी होती है,
00:29:50यहाँ आप देख सकते हैं कि,
00:29:52ट्रेनिंग सैंपल,
00:29:53यानी ट्रेनिंग डेटा में,
00:29:54आप जितना जटिल मॉडल उपयोग करेंगे,
00:29:55त्रुटि उतनी ही कम होती जाएगी।
00:29:58जैसा कि पहले बताया गया था, जहाँ कई सैंपल्स हैं,
00:29:59वहाँ आप उसे टेढ़ा-मेढ़ा करके,
00:30:02जितना जटिल बनाएंगे,
00:30:03उस सैंपल डेटा के भीतर,
00:30:05आप त्रुटि को शून्य तक ला सकते थे।
00:30:06इसलिए मॉडल को जितना अधिक जटिल बनाएंगे,
00:30:08त्रुटि उतनी ही शून्य की ओर बढ़ेगी;
00:30:12लेकिन इस तरह से सीखे गए मॉडल को,
00:30:14जब आप अलग रखे गए वैलिडेशन डेटा पर,
00:30:16आजमा कर देखते हैं,
00:30:18तो देखते हैं कि त्रुटि कितनी आती है।
00:30:19शुरू में जब मॉडल बहुत सरल होता है,
00:30:21जैसे कि एक सीधी रेखा,
00:30:23या जब वह 'अंडरफिट' होता है,
00:30:24तो त्रुटि लगभग समान रहती है।
00:30:26लेकिन जैसे-जैसे मॉडल या नियम जटिल होते जाते हैं,
00:30:28इस ट्रेनिंग डेटा के सैंपल में,
00:30:31त्रुटि कम होती रहती है,
00:30:33लेकिन इस वैलिडेशन डेटा में,
00:30:35एक न्यूनतम स्तर (bottom) पर पहुँचने के बाद,
00:30:37अत्यधिक जटिल होने लगते ही त्रुटि बढ़ने लगती है।
00:30:40निवेश के बैकटेस्टिंग के संदर्भ में कहें तो,
00:30:42अगर आप बहुत अधिक बैकटेस्टिंग चलाते हैं,
00:30:45और बहुत बारीक नियम तय करते हैं,
00:30:47बार-बार बैकटेस्ट करते हैं,
00:30:51और बहुत बारीकी से,
00:30:52पैरामीटर्स सेट करते हैं,
00:30:55जैसे कि PER का मान कितना होना चाहिए,
00:30:56जितना अधिक आप इसे बारीक और जटिल बनाएंगे,
00:30:59पुराने डेटा पर रिटर्न उतना ही बढ़ता जाएगा।
00:31:02चूँकि यह त्रुटि का ग्राफ है, इसलिए जितना कम हो उतना अच्छा है।
00:31:05मतलब, पुराने डेटा पर बहुत अधिक फिट किया गया बैकटेस्ट,
00:31:08जितना अधिक आप फिट करेंगे, रिटर्न उतना ही बेहतर दिखेगा,
00:31:12लेकिन जब इसे वास्तविकता में लागू किया जाता है,
00:31:15तो बहुत अधिक जटिलता की स्थिति में,
00:31:17नियम जितना जटिल होगा,
00:31:18वास्तविक रिटर्न उतना ही कम होता जाएगा।
00:31:21यह कुछ इस तरह काम करता है।
00:31:23अभी मैंने कम त्रुटि का मतलब,
00:31:24बेहतर रिटर्न बताया,
00:31:26और अधिक त्रुटि का मतलब खराब रिटर्न,
00:31:28इस तरह से मैंने इसे व्यक्त किया है;
00:31:31लेकिन तकनीकी रूप से देखा जाए तो,
00:31:32त्रुटि बढ़ने का मतलब केवल,
00:31:33रिटर्न कम होना नहीं है।
00:31:34मतलब, आप बैकटेस्टिंग को जितना गलत करेंगे,
00:31:37और जितना अधिक ओवरफिट करेंगे,
00:31:39बैकटेस्टिंग रिटर्न और भविष्य के रिटर्न के बीच का अंतर,
00:31:42यानी त्रुटि उतनी ही बड़ी होती जाएगी।
00:31:45वह त्रुटि संयोग से,
00:31:47ज़्यादा भी हो सकती है,
00:31:49या कम भी हो सकती है।
00:31:50लेकिन आम तौर पर जब ऐसी त्रुटि होती है,
00:31:51लेकिन आम तौर पर, अगर ऐसी कोई गलती होती है,
00:31:53तो वास्तविक दुनिया में मुनाफा कम हो जाता है।
00:31:55ऐसा इसलिए है क्योंकि पिछले डेटा के साथ फिट करते समय,
00:31:57हमने मुनाफे को जितना हो सके बढ़ाने के लिए
00:31:59जबरदस्ती डेटा को एडजस्ट किया होता है,
00:32:00इसलिए जब उस मुनाफे के आंकड़े में कोई अंतर आता है,
00:32:02तो वह आमतौर पर नीचे की ओर ही होता है।
00:32:03तो फिर, हम ट्रेनिंग डेटा और वैलिडेशन डेटा को
00:32:06बैकटेस्टिंग के लिए कैसे विभाजित करें?
00:32:08उदाहरण के लिए, 2011 से 2021 तक के
00:32:1111 साल के डेटा पर ट्रेनिंग करके अगले साल से उसे लागू करना,
00:32:15इसका मतलब है कि आप अलग से वैलिडेशन डेटा का उपयोग नहीं कर रहे हैं।
00:32:18आप पूरे डेटा को ट्रेनिंग के लिए इस्तेमाल करके उसे लागू कर रहे हैं,
00:32:21और मैं इसकी सलाह नहीं देता।
00:32:22जैसा कि मैंने पहले बताया, विभाजन करने का
00:32:25एक तरीका यह है कि 10 साल के डेटा को ट्रेनिंग डेटा मानकर सीखें,
00:32:28फिर 2021 के आखिरी 1 साल पर उसे वैलिडेट करें,
00:32:31और फिर 2022 से उसे लागू करें।
00:32:34लेकिन जैसा कि मैं थोड़ी देर में बताऊंगा,
00:32:36यह भी बहुत अच्छा तरीका नहीं है।
00:32:38इसके अलावा कुछ और बेहतर तरीके क्या हैं?
00:32:40एक तरीका है जिसे 'वॉक-फॉरवर्ड टेस्टिंग' कहते हैं,
00:32:43इसमें क्या होता है कि,
00:32:44उदाहरण के लिए, 1999 से 3 साल के डेटा पर
00:32:46ट्रेनिंग करके पैरामीटर्स को ऑप्टिमाइज़ किया जाता है,
00:32:49और उसके आधार पर 1 साल के लिए वैलिडेशन किया जाता है,
00:32:52और फिर इसे 'रोलिंग' तरीके से आगे बढ़ाया जाता है।
00:32:55इस तरह से अगर आप अपनी रणनीति तैयार करते हैं,
00:32:58तो मान लीजिए कि एक बहुत ही सरल मॉडल है,
00:33:01वैसे तो मुझे लगता है कि सिर्फ PER के आधार पर बैकटेस्टिंग करना
00:33:04बेतुका है,
00:33:05पर मान लेते हैं कि एक निश्चित स्तर से कम PER वाले शेयर खरीदने की रणनीति है।
00:33:08तो 10 साल के डेटा के आधार पर
00:33:11अगर आप PER को ऑप्टिमाइज़ करते हैं,
00:33:13तो हर साल के लिए सबसे अच्छे PER मानक अलग-अलग होंगे,
00:33:17लेकिन आप उनमें से एक औसत स्तर चुनेंगे जो आम तौर पर ठीक हो।
00:33:20लेकिन अगर आप इस दायरे को थोड़ा छोटा करें,
00:33:22तो पिछले 3 सालों के आधार पर PER वैल्यू तय करके ट्रेड करें,
00:33:26और इस तरह से टेस्टिंग करें,
00:33:28तो आप इन पैरामीटर्स को समय के साथ
00:33:30ज्यादा लचीले ढंग से एडजस्ट कर पाएंगे।
00:33:32यह टेस्टिंग का एक तरीका है,
00:33:35आप इस तरह से भी टेस्ट कर सकते हैं,
00:33:37और इसके बाद आता है K-Fold CV,
00:33:38जिसे क्रॉस वैलिडेशन कहा जाता है।
00:33:39यह कैसे काम करता है कि,
00:33:41यहाँ K का मतलब है कि आप डेटा को कितने हिस्सों में बांटते हैं।
00:33:45अगर आप चित्र देखें, तो K की वैल्यू 5 होगी।
00:33:47अगर K को 5 तय किया जाए, तो डेटा के 5 बराबर हिस्से किए जाते हैं,
00:33:50और 4 साल के डेटा पर मॉडल को ट्रेन करने के बाद,
00:33:531 साल के वैलिडेशन डेटा पर मुनाफे की जांच की जाती है।
00:33:56फिर किन्हीं अन्य 4 हिस्सों पर ट्रेनिंग दी जाती है,
00:33:59और बचे हुए एक साल पर उसकी जांच की जाती है।
00:34:01इस तरह से प्रक्रिया दोहराने के बाद, सभी मुनाफे का औसत निकाला जाता है।
00:34:05यानी, इन सभी परिणामों का मीन (औसत) लिया जाता है।
00:34:09माना जाता है कि यह आपके अपेक्षित मुनाफे के काफी करीब होगा।
00:34:12यही इसके पीछे की सोच है।
00:34:13इसके अलावा, मान लीजिए आप पिछले 10 सालों का डेटा इस्तेमाल कर रहे हैं।
00:34:16तो कुछ लोग सम (even) वर्षों के डेटा पर ट्रेनिंग करते हैं
00:34:19और विषम (odd) वर्षों के डेटा पर वैलिडेशन करते हैं।
00:34:22इन सभी तरीकों के अपने फायदे और नुकसान हैं,
00:34:23लेकिन अगर मैं इस तरीके का फायदा बताऊं,
00:34:26तो यह 'मार्केट रिजीम चेंज' के प्रति पैरामीटर्स को स्थिर रखता है।
00:34:30इसका मतलब यह है कि,
00:34:31जब वित्तीय संकट या कोरोना जैसी स्थिति आती है,
00:34:33तो बाजार का स्वभाव बदल जाता है।
00:34:35उदाहरण के लिए, 2008 में वित्तीय संकट आया,
00:34:39लेकिन अगर आपने 1998 से 2007 तक के डेटा पर ट्रेनिंग करके
00:34:43सबसे अच्छा मुनाफा देने वाली रणनीति खोजी,
00:34:45और फिर उसे वैलिडेट किया,
00:34:46तो चूंकि बाजार का स्वभाव पूरी तरह बदल चुका है,
00:34:49डेटा का वितरण (distribution) भी बदल जाएगा,
00:34:51और बाद की बाजार स्थितियों में
00:34:52पिछले पैटर्न काम नहीं आएंगे।
00:34:55लेकिन अगर आप डेटा को इस (क्रॉस वैलिडेशन) तरीके से बांटते हैं,
00:34:57तो किसी बड़ी घटना के कारण
00:35:00बाजार के स्वभाव और पैटर्न में आने वाले बदलावों के बावजूद
00:35:02आप ज्यादा मजबूती से वैलिडेशन कर सकते हैं।
00:35:06इसलिए इस पद्धति का भी उपयोग किया जाता है,
00:35:08पर ऐसा करते समय 'भविष्य को देखने' (look-ahead bias) वाली बात का
00:35:11बहुत ध्यान रखना पड़ता है।
00:35:13क्योंकि आपके ट्रेडिंग साइकिल के आधार पर,
00:35:16अगर आप मासिक आधार पर ट्रेड कर रहे हैं,
00:35:18और आपके ट्रेनिंग डेटा में
00:35:192014 का डेटा शामिल है,
00:35:22तो 2013 के नियमों या डेटा के उपयोग के आधार पर,
00:35:26ऐसी जानकारी जो केवल 2014 में ही पता चल सकती थी,
00:35:28वह गलती से वैलिडेशन डेटा में मिल सकती है।
00:35:30इससे वैलिडेशन डेटा का मुनाफा बढ़ा-चढ़ाकर दिखने लगेगा,
00:35:34क्योंकि आपने अनजाने में भविष्य की जानकारी के साथ ट्रेनिंग कर ली है।
00:35:36इसलिए आपको इस हिस्से को लेकर बहुत सावधान रहना चाहिए।
00:35:39मैंने इसे बहुत मोटे तौर पर समझाया है,
00:35:41लेकिन मशीन लर्निंग जैसे क्षेत्रों में,
00:35:44'हाइपर-पैरामीटर्स' जैसी चीजें होती हैं।
00:35:46आम तौर पर 'पैरामीटर्स' वे होते हैं जिन्हें मॉडल खुद
00:35:50सैंपल डेटा की गलती को कम करने के लिए एडजस्ट करता है,
00:35:54लेकिन 'हाइपर-पैरामीटर्स' इंसान को खुद तय करने पड़ते हैं।
00:35:57उदाहरण के लिए, अगर आप 'रिग्रेशन एनालिसिस' कर रहे हैं,
00:35:59तो आप सीधी रेखा (linear) का उपयोग करेंगे या वक्र (curve) का,
00:36:03यानी आपका मॉडल समीकरण कितना जटिल होगा,
00:36:07यह निर्णय
00:36:09एक इंसान लेता है।
00:36:11तो इन पैरामीटर्स की संख्या जैसी चीजें 'हाइपर-पैरामीटर्स' हैं।
00:36:15एक बार जब आप इन्हें तय कर लेते हैं, तो डेटा के आधार पर,
00:36:18डेटा की त्रुटि (error) को कम करने की दिशा में
00:36:22मॉडल उस लाइन को फिट करता है।
00:36:23इसमें जो ढलान (slope) या इंटरसेप्ट (intercept) होते हैं,
00:36:28जो डेटा के अनुसार सीखे जाते हैं, उन्हें 'पैरामीटर्स' कहा जाता है।
00:36:33आपको विभिन्न हाइपर-पैरामीटर्स को भी आज़माकर देखना चाहिए।
00:36:36इसलिए डेटा को केवल ट्रेन और टेस्ट में बांटने के बजाय,
00:36:40एक और हिस्सा अलग किया जाता है जिसे 'डेव (Dev) डेटा' कहते हैं।
00:36:42वहाँ ऑप्टिमाइज़ेशन करने के बाद,
00:36:45हाइपर-पैरामीटर्स को वहां सेट किया जाता है,
00:36:48और फिर टेस्ट डेटा से उसकी अंतिम पुष्टि की जाती है।
00:36:51जो लोग मशीन लर्निंग जानते हैं, वे इसे समझ गए होंगे,
00:36:55और जो नहीं जानते, वे शायद इतने संक्षिप्त विवरण से नहीं समझ पाएंगे,
00:36:58इसलिए चलिए आगे बढ़ते हैं।
00:37:00लेकिन इस काम को करते समय एक बहुत ही,
00:37:04बहुत ही महत्वपूर्ण बात है जिस पर जितना जोर दिया जाए कम है।
00:37:08वह है 'वैलिडेशन डेटा'।
00:37:10वैलिडेशन डेटा के परिणामों को कभी भी, कभी भी दोबारा नहीं देखना चाहिए।
00:37:15इसके परिणाम को...
00:37:16हम ट्रेनिंग डेटा पर बार-बार बैकटेस्टिंग करके एक बेहतरीन रणनीति खोजते हैं, है ना?
00:37:22तो ट्रेनिंग डेटा पर तो हमें एक अच्छी मुनाफे वाली रणनीति मिल गई,
00:37:26लेकिन क्या वह असली दुनिया में भी उतनी ही अच्छी होगी, यह जांचने के लिए
00:37:31हम उस समय या डेटा का उपयोग करते हैं जो ट्रेनिंग में शामिल नहीं था।
00:37:38लेकिन इसे कभी भी दो बार नहीं चलाना चाहिए।
00:37:41इसे सिर्फ एक बार चलाएं, और अगर उस एक बार में मुनाफा खराब आता है,
00:37:45तो चाहे आपने सालों मेहनत की हो या उस रणनीति को बनाने में जान लगा दी हो,
00:37:50आपको उस पूरी रणनीति को छोड़ देना चाहिए।
00:37:52क्यों? क्योंकि वास्तविक बाजार में उस रणनीति को लागू करने का मौका भी सिर्फ एक बार मिलता है।
00:37:57आप समय को पीछे तो नहीं मोड़ सकते।
00:37:58इसके बावजूद, लोग अक्सर पछतावे में आकर, जब वैलिडेशन डेटा खराब निकलता है,
00:38:03तो फिर से ट्रेनिंग डेटा में पैरामीटर्स को थोड़ा बदलते हैं और
00:38:07जब तक वैलिडेशन डेटा में अच्छा मुनाफा न दिखे, उसे दोहराते हैं।
00:38:10जैसे ही आप ऐसा करते हैं, वह वैलिडेशन डेटा अब वैलिडेशन डेटा नहीं रह जाता,
00:38:14बल्कि वह ट्रेनिंग डेटा का ही हिस्सा बन जाता है।
00:38:16क्योंकि आपने उस डेटा को शामिल करके ही पैरामीटर्स को ऑप्टिमाइज़ किया है।
00:38:21इसलिए यह रणनीति असली बाजार में कैसा प्रदर्शन करेगी,
00:38:26इसकी हम कोई गारंटी नहीं दे सकते।
00:38:29इसीलिए वह हिस्सा बहुत महत्वपूर्ण है।
00:38:31बैकटेस्टिंग करते समय एक और महत्वपूर्ण बिंदु, जो इसी से जुड़ा है,
00:38:34वह है 'मार्केट रिजीम' का विचार और यह कि समय बदलता रहता है।
00:38:37मैं आपसे एक सवाल पूछता हूँ।
00:38:3920 साल की बैकटेस्टिंग और 3 साल की बैकटेस्टिंग में से,
00:38:42कौन सी ज्यादा सार्थक है?
00:38:44मैंने पहले ही शीर्षक ऐसा दिया है कि जवाब साफ है,
00:38:47लेकिन कई नए निवेशक सोचते हैं कि बैकटेस्टिंग जितनी लंबी होगी,
00:38:50या डेटा जितना ज्यादा होगा, उतना ही अच्छा है।
00:38:54लेकिन अगर मुझे इन दोनों में से चुनना हो,
00:38:57तो हालांकि यह आपके समय के नजरिए और ट्रेडिंग की फ्रीक्वेंसी पर निर्भर करता है,
00:39:00लेकिन फिर भी...
00:39:01ज्यादातर मामलों में, मैं 3 साल वाला विकल्प चुनूँगा।
00:39:03डेटा की मात्रा जितनी अधिक हो, उतना ही अच्छा है।
00:39:06लेकिन वह डेटा एक ही 'डिस्ट्रीब्यूशन' (वितरण) से आना चाहिए।
00:39:09डेटा का ज्यादा होना हमेशा अच्छा है,
00:39:11लेकिन अगर उसमें ऐसा डेटा मिल जाए जहां माहौल पूरी तरह बदल चुका था, तो वह अच्छा नहीं है।
00:39:17लंबे समय की बैकटेस्टिंग में जो समस्या आती है,
00:39:20वह यह है कि बाजार का स्वभाव बदल जाता है।
00:39:22यह शायद वास्तविक ब्याज दर का ग्राफ है या...
00:39:26खैर, यह ब्याज दरों से संबंधित ग्राफ है,
00:39:28और आप देख सकते हैं कि समय के साथ 'उचित ब्याज दर' की अवधारणा,
00:39:33हालांकि इसमें उतार-चढ़ाव होता है,
00:39:34पर उस व्यवस्था के तहत ब्याज दर का स्तर अचानक बदल जाता है।
00:39:38इस समय यह यहाँ था, शायद यह ऑयल शॉक का समय था,
00:39:41खैर, उस घटना के बाद यह यहाँ पहुँच गया,
00:39:45और फिर 80 के दशक के बाद से,
00:39:47यह स्तर सामान्य ब्याज दर के रूप में माना जाने लगा।
00:39:51अब मान लीजिए आप बॉन्ड ट्रेडिंग कर रहे हैं,
00:39:53और आपने इस कालखंड के डेटा से ट्रेडिंग रणनीति सीखी है,
00:39:57ताकि आप उसे यहाँ इस्तेमाल कर सकें।
00:39:59लेकिन अगर इस बीच 'मार्केट रिजीम' बदल गया,
00:40:02तो उस पुराने डेटा से बनी मुनाफे वाली रणनीति,
00:40:07यहाँ काम नहीं करेगी।
00:40:08इसे ही 'मार्केट रिजीम चेंज' कहा जाता है।
00:40:11बाजार के स्वभाव, उसकी व्यवस्था या तंत्र में बदलाव।
00:40:14बाजार का यह स्वभाव बदलाव
00:40:17बाजार में भाग लेने वाले खिलाड़ियों (players) के बदलने से भी होता है।
00:40:20जैसे कोरोना के बाद, रिटेल निवेशकों की भारी आमद हुई,
00:40:23जिससे 'गेमस्टॉप' जैसी घटनाएं हुईं।
00:40:25कोरोना से पहले,
00:40:27वे शॉर्ट-सेलिंग रणनीतियां,
00:40:30और शॉर्ट-सेलिंग के विशेषज्ञ हेज फंड भी थे,
00:40:32उनकी रणनीतियां बहुत कारगर थीं,
00:40:34लेकिन बाजार के स्वभाव में आए इस अचानक बदलाव से,
00:40:37कुछ तो दिवालिया होने की कगार पर पहुँच गए।
00:40:39इसके अलावा, कानूनों और नियमों में बदलाव, जैसे वित्तीय संकट के बाद,
00:40:43इन्वेस्टमेंट बैंकों के लिए प्रॉप (prop) ट्रेडिंग प्रतिबंधित कर दी गई,
00:40:45और डेरिवेटिव मार्केट में कई नए नियमों ने बाजार को बदल दिया।
00:40:49तो वित्तीय संकट से पहले के डेटा पर
00:40:50आधारित जो रणनीतियां थीं,
00:40:52वे बाद में उतनी प्रभावी नहीं रहीं।
00:40:54फिर आती हैं बाहरी घटनाएं,
00:40:55जैसे ऑयल शॉक जैसी कोई बड़ी घटना
00:40:57जो पूरे बाजार को हिला देती है,
00:40:59कोई बड़ी मैक्रो-इकोनॉमिक घटना।
00:41:01और साथ ही व्यापक आर्थिक बदलाव,
00:41:03जैसे-जैसे कर्ज का अनुपात धीरे-धीरे बढ़ता गया,
00:41:06तो ब्याज दरें, जो पहले इस स्तर पर थीं,
00:41:08अब बेहद कम ब्याज दर के युग में पहुँच गई हैं।
00:41:11इसी के साथ, मात्रात्मक सहजता (QE) ने भी
00:41:13ऐसी कम ब्याज दरों को बनाए रखने में मदद की,
00:41:15और इस कारण पिछले 10 वर्षों में
00:41:17ग्रोथ स्टॉक ने जबरदस्त प्रदर्शन किया है।
00:41:19लेकिन अगर आपने मात्रात्मक सहजता से पहले के डेटा से
00:41:22एक ऐसी रणनीति बनाई जो बहुत लाभदायक दिखती थी,
00:41:24जैसे कि वैल्यू स्टॉक खरीदना आदि,
00:41:25तो जाहिर है कि अगले 10 वर्षों के लिए
00:41:27वह रणनीति बहुत खराब रही होगी।
00:41:28इसके अलावा नई तकनीकों का आगमन
00:41:30या औद्योगिक संरचना में बदलाव
00:41:32जैसे अन्य कारक भी होते हैं।
00:41:33इसलिए 20 साल का बैकटेस्टिंग करते समय,
00:41:35क्या 2001 का डेटा वाकई मायने रखता है?
00:41:38बेशक, “मार्केट रेजिम चेंज” का मतलब
00:41:40इस बात पर निर्भर करता है कि
00:41:42आप किन कारकों पर ध्यान दे रहे हैं।
00:41:43अंततः, रणनीति का लॉजिक,
00:41:45नियम या मॉडल
00:41:47किन तत्वों को देख रहे हैं
00:41:49और किस तरह के डेटा का उपयोग कर रहे हैं,
00:41:51उसके आधार पर
00:41:52आपको उस डेटा के रेजिम में
00:41:53होने वाले बदलावों को देखना होगा।
00:41:55इसलिए, कुछ डेटा ऐसे हो सकते हैं
00:41:56जिनकी प्रकृति मासिक आधार पर
00:41:58बहुत तेज़ी से बदलती है,
00:41:59जबकि कुछ अन्य डेटा
00:42:0110 या 15 वर्षों तक बहुत स्थिर हो सकते हैं।
00:42:03चूंकि कोरोना जैसे चक्र भी अलग-अलग होते हैं,
00:42:05तो सामान्य तौर पर यह कहना
00:42:07कि सिर्फ कोरोना आने की वजह से
00:42:09उससे पहले के सभी पैटर्न
00:42:09बेकार हो गए हैं, ऐसा नहीं है।
00:42:12लेकिन फिर भी, अगर आप
00:42:1420 साल पुराना डेटा इस्तेमाल करते हैं,
00:42:15तो निश्चित रूप से इसमें कुछ समस्या है।
00:42:17आप इसे इस तरह देख सकते हैं,
00:42:18कि यदि आप बहुत पुराने डेटा का
00:42:20उपयोग करके अनुमान लगाने की कोशिश करते हैं,
00:42:22तो हो सकता है कि मार्केट रेजिम
00:42:23बीच में कई बार बदला हो,
00:42:24लेकिन फिर से बदलावों के बाद
00:42:25यदि वह बहुत पुराना डेटा
00:42:29वर्तमान स्थिति को दर्शाता है,
00:42:30तो उसका उपयोग संभव हो सकता है।
00:42:32यही कारण है कि कुछ लोग कहते हैं
00:42:33कि आज का समय 1940 के दशक से मिलता-जुलता है।
00:42:35खैर, यह तो एक अलग बात थी,
00:42:37लेकिन मुद्दे पर वापस आते हैं।
00:42:38तो, क्वांट ट्रेडिंग
00:42:41अब बहुत आम हो गई है
00:42:42और व्यक्तिगत निवेशक भी इसे कर रहे हैं,
00:42:44लेकिन दीर्घकालिक निवेश में
00:42:45क्वांट निवेश की एक बड़ी खामी यह है कि
00:42:47जब आप इन मात्रात्मक तकनीकों को
00:42:49लंबे समय के निवेश पर लागू करते हैं,
00:42:51तो पर्याप्त डेटा तकनीक हासिल करने के साथ-साथ
00:42:53रेजिम चेंज से बचना बहुत मुश्किल होता है।
00:42:55उदाहरण के लिए, मान लें कि हमारे पास
00:42:57मिनट-दर-मिनट डेटा का उपयोग करने वाली एल्गोरिथम रणनीति है।
00:42:59एक मिनट में, नहीं, एक घंटे में
00:43:01डेटा के 60 पॉइंट होते हैं।
00:43:02चूंकि 60 मिनट होते हैं,
00:43:03तो 60 डेटा पॉइंट मिलेंगे।
00:43:04अब मान लीजिए कि
00:43:05यह 24 घंटे चलने वाला कोई फ्यूचर्स मार्केट है।
00:43:08तो अगर हम 24 से गुणा करें,
00:43:09तो 1440 पॉइंट होंगे।
00:43:10क्या यह सही है?
00:43:10हाँ, एक दिन में 1440 डेटा पॉइंट होते हैं।
00:43:12तो अगर एक दिन में 1440 पॉइंट हैं,
00:43:15और साल में 250 ट्रेडिंग दिन हैं
00:43:17(हफ्ते में 5 दिन के हिसाब से),
00:43:20तो एक साल में लगभग 3.5 लाख
00:43:21डेटा पॉइंट के आसपास की संख्या
00:43:23सिर्फ एक साल में हासिल की जा सकती है।
00:43:25सिर्फ एक साल के डेटा से ही
00:43:26आपको 3 लाख से ज्यादा डेटा पॉइंट मिल जाते हैं,
00:43:29इसलिए इतने बड़े डेटा सेट के साथ
00:43:32आप सार्थक जांच कर सकते हैं
00:43:33और अधिक जटिल मॉडल का उपयोग भी
00:43:35आसानी से कर सकते हैं।
00:43:36लेकिन अब मासिक आधार पर होने वाली
00:43:37रिबैलेंसिंग रणनीति की बात करते हैं।
00:43:39एक साल में केवल 12 डेटा पॉइंट होंगे।
00:43:41तो 20 साल के बाद भी
00:43:42आपके पास केवल 240 पॉइंट होंगे।
00:43:44चूंकि आप समय के साथ डेटा की संख्या नहीं बढ़ा सकते,
00:43:47इसलिए लोग विभिन्न शेयरों को देखते हुए
00:43:49डेटा के दायरे को थोड़ा विस्तार देते हैं
00:43:51ताकि सांख्यिकीय महत्व हासिल किया जा सके।
00:43:53लेकिन अंत में, समय के साथ होने वाले
00:43:54रेजिम चेंज से बचना मुश्किल है।
00:43:57तो ये चीज़ें वाकई बहुत चुनौतीपूर्ण हैं।
00:43:58कोरोना महामारी के बाद,
00:44:00बहुत से क्वांट विशेषज्ञों ने—
00:44:02जैसे कि इनिगो फ्रेजर-जेनकिंस,
00:44:05जो एक बहुत प्रसिद्ध कंपनी में क्वांट हेड थे—
00:44:09उन्होंने इस बारे में लिखा कि
00:44:11“मैं अब क्वांट क्यों नहीं रहा?”
00:44:13उनका मूल तर्क यह था कि
00:44:15क्वांट का काम भविष्य की भविष्यवाणी के लिए अतीत के पैटर्न का उपयोग करना है,
00:44:19लेकिन इस तरह से
00:44:20जब कोरोना जैसी घटना होती है, तो पुराने पैटर्न बेकार हो जाते हैं।
00:44:23जब मार्केट रेजिम में बदलाव आता है,
00:44:25तो क्वांट बहुत ही कम कुछ कर पाते हैं।
00:44:28यही वजह है कि क्वांट विशेषज्ञों के लिए
00:44:30एक अस्तित्वगत संकट की बात की जा रही है।
00:44:31और पिछला साल क्वांट के लिए बहुत बुरा था।
00:44:34हालाँकि कुछ क्वांट अच्छा करने में सफल रहे,
00:44:36लेकिन औसत तौर पर यह बहुत, बहुत खराब रहा।
00:44:38मुझे लगता है कि हम अब आधे रास्ते पर पहुँच गए हैं,
00:44:40लेकिन डेढ़ घंटा पहले ही बीत चुका है,
00:44:43इसलिए पहला भाग यहीं समाप्त करते हैं।
00:44:45कल दूसरे भाग में, हम बिंदु 6 से 10 तक चर्चा करेंगे,
00:44:49इसके फायदों और सीमाओं को देखेंगे,
00:44:50और फिर क्वांट के अध्ययन के लिए पाठ्यक्रम
00:44:52के बारे में बात करेंगे।
00:44:54तो, आपसे दूसरे भाग में मिलते हैं।
00:44:55धन्यवाद।