[월가아재]퀀트 투자의 허와 실 - 제 2부: 백테스팅은 다다익선이 아니다! (오징어 게임 스포 주의)

日本語Bahasa Indonesia 한국어 Português Русский

월월가아재의 과학적 투자

주식 투자자격증/평생교육초보 재테크컴퓨터/소프트웨어

Transcript

00:00:00こんにちは、ウォール街です。

00:00:01本日は「クオンツ投資の虚と実」第2部

00:00:03バックテストは多ければいいというものではない

00:00:05これについてお話ししていきます。

00:00:07第1部ではここまで扱いまして

00:00:09第2部では6番から解説していきます。

00:00:12第2部に入る前に

00:00:14動画の目的について改めて強調しておきますと

00:00:17私はクオンツ売買自体が悪いと言っているわけではありません。

00:00:19世界は結局、計量化される方向に流れていますし

00:00:23株式市場においてもクオンツ、計量化といった

00:00:26流れは必然的なものだと考えています。

00:00:28ただ、私はク온ツ投資に対する

00:00:31誇張された希望や盲信

00:00:33そういった部分を警戒しようという

00:00:35趣旨でこの動画を制作しました。

00:00:37統計的推論の基礎が身についていない方であれば

00:00:41こういった部分をしっかり勉強してから手をつけるべきですし

00:00:45視聴者の方のコメントを見ると

00:00:47「勘でやるよりはクオンツ投資の方がマシだ」

00:00:50そう考える方もいらっしゃいますが

00:00:52私はそうは思いません。

00:00:54もちろん勘でやるのも良い結果を得るのは難しいです。

00:00:57しかし、クオンツ投資を誤った方法で

00:01:00つまり、統計的な有意性が全くない

00:01:02そんなバックテストで行ってしまうと

00:01:04第一に、追加で時間を浪費することになりますし

00:01:07また、実際には統計的に何の意味もないバックテストなのに

00:01:11自分は検証を行った

00:01:13何か科学的な検証をしたという錯覚に陥ることで

00:01:16必要以上のリスクを負ってしまう可能性があるからです。

00:01:18実はあまりお話ししたくなかったのですが

00:01:21メールで購読者の方々から、損失を出したという相談をかなり多く受けます。

00:01:27この話は前回も少ししましたが

00:01:29その中に、クオンツ投資で大きな損失を出された方が数名いらっしゃいます。

00:01:34先週メールをくださった方は

00:01:36具体的な金額はプライバシーに関わるので言えませんが

00:01:39家庭不和が生じるほど

00:01:43大きな金額をクオンツ投資で失われました。

00:01:46どのような手法を使ったのかメールでやり取りしながら

00:01:50伺ってみたところ

00:01:51私がこの動画で扱っている内容と相反する

00:01:54統計的に全く意味のないバックテストを何度も繰り返してきた方でした。

00:01:59MDDが15%程度の戦略があったのですが

00:02:04昨年一年の収益率が好調だったので

00:02:07今年に入って多額の借金をして

00:02:10そこに投入されたそうです。

00:02:12韓国総合株価指数（KOSPI）が10%程度下落した際

00:02:15その方のポートフォリオは20%以上下落したのですが

00:02:19借金などを利用して

00:02:22レバレッジが3倍程度かかっていたため

00:02:2460〜70%ほど失うことになったというケースもありました。

00:02:28そういった方々と話をしてみると

00:02:30クオンツ投資のバックテストを過信しており

00:02:34ベンチマークについてもあまり考えていらっしゃらないようでした。

00:02:38昨年一年の収益率が非常に良かったのは

00:02:42実はKOSPIが底値から

00:02:43100%以上上昇した年だったからです。

00:02:45本来なら指数と比較すべきなのですが

00:02:47自分のバックテスト戦略が複利で40%出ていて

00:02:52昨年一年で70%出たからと

00:02:54完全に信じ込んで借金までして投入されたわけです。

00:03:00それを見て非常に残念に思いましたし

00:03:02そんな折に、クオンツ投資に関する議論などを観察していると

00:03:08一度こうした動画を制作する必要があると感じました。

00:03:11そうした考えからこの動画を作ったのですが

00:03:14私が今動画で説明している部分が

00:03:17全く理解できないのであれば

00:03:20そもそも手を出すべきではありませんし

00:03:22あるいは統計的な基礎をしっかり固めて

00:03:25中級者へ進もうとしている方であれば

00:03:2710の注意点に気をつけて慎重にアプローチしてほしいです。

00:03:33すでに中・上級者であれば、ご自身の判断で進めてください。

00:03:36私がとやかく言うことではありませんし

00:03:39正しい方法で構築されたクオンツ戦略は

00:03:43それ自体が非常に優れたエッジを持っています。

00:03:46私はただ「この世にタダ飯はない」という

00:03:49極めて常識的な話をしたいだけなのです。

00:03:52昨年はこうした常識よりも、近道や追い越し車線といった

00:03:57議論が少し行き過ぎていたように感じたので

00:04:01その点で動画を制作したに過ぎません。

00:04:04クオンツが悪いのではなく

00:04:05努力して基本を身につけて行うべきだ

00:04:08という意味で受け取っていただければ幸いです。

00:04:10それでは、クオンツ売買をする際に

00:04:12銘記すべき10のポイントのうち、6番目。

00:04:15クオンツも自制が必要である。

00:04:17これは本当に多くの方が誤解している部分なのですが

00:04:20専門家と自称する方々ですら

00:04:23「バックテストは回せば回すほど良い」

00:04:25という錯覚をしているケースが多いようです。

00:04:28しかし、決してそんなことはありません。

00:04:30バックテストは「多々益々弁ず」ではなく、クオンツも自制を知らなければなりません。

00:04:35これは論文から引用したものですが

00:04:37バックテストを繰り返せば繰り返すほど、過学習の問題

00:04:40つまりオーバーフィッティングの問題が深刻化します。

00:04:44この部分は数学的にも証明されていますし

00:04:47クオンティピアンのユーザーデータや実証的な面から確認しても

00:04:51バックテストを多く回したユーザーのアルゴリズムほど

00:04:55テスト時の収益と、その後の実運用での収益率の差が

00:05:00大きくなることが示されています。

00:05:01その理由は、バックテストを回しすぎると

00:05:04単なるランダムな動きの中からパターンやシグナルを拾ってしまうからです。

00:05:09実際、ある論文では完全にランダムウォーク

00:05:12つまり、無作為に動く株価をシミュレーションして大量に生成し

00:05:18それに対してバックテストを行う実験をしました。

00:05:21すると、完全にランダムな動きの中でもバックテストを繰り返すと

00:05:26シャープレシオが1や2を超えるような戦略が発見され

00:05:29学習データだけでなく検証データでも通用する戦略がいくつか現れ始めたのです。

00:05:36これは他の多くの学問分野でも問題視されている現象で

00:05:40「p値ハッキング（p-value hacking）」と呼ばれます。

00:05:42このp値について、統計学を専攻された方は

00:05:46厳密でない定義を嫌うかもしれませんが

00:05:48初心者の方のために直感的にわかりやすく説明しますと

00:05:52科学者が実験を行う際、その結果が実際に背後にある

00:05:57母集団（サンプルから推測したい全体像）を反映しているのか考えます。

00:06:02例えば大統領選の世論調査なら、国民全体から一部を抽出して支持率を測りますが

00:06:10実際には母集団がそうではないのに、偶然抽出されたサンプルが

00:06:20研究の方向に都合よく偏ってしまい、良い結果が出た確率、それがp値だと考えてください。

00:06:25分野によって基準は異なりますが、一般的には5%未満であれば

00:06:31統計的に有意であると言われます。

00:06:34例えば「候補者Aの支持率が50%以上か」を検証したいとします。

00:06:42サンプルを抽出した結果、55%という数字が出ました。

00:06:47実際には母集団が50%なのに、偶然Aの支持者が多く含まれて55%になる確率は何か。

00:06:57p値が0.2なら、それが単なる偶然である確率が20%あるということです。

00:07:03しかしサンプルで70%という結果が出たなら

00:07:10実際には母集団が50%しかないのに、運良くAの支持者ばかりが

00:07:17サンプルに選ばれて70%になる確率は、1%程度しかないでしょう。

00:07:21これがp値です。

00:07:2255%でp値が0.2の場合

00:07:27「候補者Aが50%ではない」と

00:07:31結論づけることはできません。

00:07:33統計的な有意性が確保されていないと言うわけです。

00:07:38逆に70%出てp値が1%程度なら、基準の5%よりずっと低いので

00:07:46「候補者Aの支持率は50%ではない」と統計的に有意な自信を持って言える

00:07:57という意味になります。これがp値です。

00:08:00p値を良く見せるために実験を繰り返すことをp値ハッキングと言います。

00:08:06例えば、支持率60%でp値が0.05になったとしましょう。

00:08:15これは、実際には母集団の支持率が50%だったとしても

00:08:21100回くらいサンプルを引き直せば、一度くらいは60%になるサンプルが出るということです。

00:08:29科学実験などでも、サンプルを取り直して論文のテーマに合うか確認し

00:08:3520回ほど繰り返してp値0.05を満たして出版するといった事例があり

00:08:43それは非常に悪い学問的態度であり、pハッキングと呼ばれます。

00:08:48これが同様にバックテストにも適用されるのです。

00:08:51統計的なパターンが全く存在しない、ランダムな株価データを使って

00:08:58コイン投げのように動く銘柄でも、学習データから収益の良いものを探し出し

00:09:06これを繰り返せば、検証データでも偶然収益が良く見えるものがいくつか出てきてしまうのです。

00:09:13第1部で過学習についてお話しした通り、学習データで収益を最適化して

00:09:20検証データで回したり、ペーパートレードを行ったりしても

00:09:23バックテストを過度に行いすぎると

00:09:29実質的な未来予測力も有意なパターンもなく

00:09:34何の役にも立たない過去のパターンを拾っただけなのに

00:09:39検証データまで収益が良く出るケースが偶然現れる可能性があります。

00:09:44そのため、7番目の「非クオンツ的な言語で戦略を説明する」ことが重要になります。

00:09:51なぜ非クオンツ的な言葉で説明することが重要なのか。

00:09:54まずはデータ数の重要性について見ていきましょう。

00:09:58「シンプルなモデル」と「柔軟なモデル」があると仮定します。

00:10:02この図で、青い線は非常に柔軟性の高いモデルで

00:10:06黒い線は非常にシンプルなモデルです。

00:10:09モデルが柔軟であるほど、与えられたサンプルには完璧に誤差なく合わせることができます。

00:10:15しかし、実際の分布が別にある場合、新しいデータが入ってくると

00:10:21この柔軟な青い線は大きな間違いを犯すことになります。

00:10:23これについては第1部でも話しましたが、データが非常に膨大な場合

00:10:28数千、数万とあれば。昔はデータの収集が非常に困難でした。

00:10:32そのため、小さなサンプルから巨大な母集団の分布を推定したり予測したりしていました。

00:10:39最近は分野によりますが、母集団そのものを測定したり、テラバイト級のデータを集めたりできるため

00:10:50それほどデータが多い場合には、柔軟なモデルを使ってもこれほど過学習は起きません。

00:10:57実際、この青い線をこれほど多くのデータに適用してみると、多少うねりはあっても

00:11:04概ねフィッティングされ、新しい検証データが入ってきても

00:11:09誤差はそれほど大きくならないでしょう。しかし、トレードの文脈で見ると

00:11:15秒・分単位から日・月・年単位へ行くほど、データ数は少なくなります。

00:11:20結局、財務諸表などを用いるクオンツ投資では、データ数が少なくなります。

00:11:28これは第1部の繰り返しになりますが、ではデータが少ない時にどう過学習を避けるべきか。

00:11:35その場合は、モデルの柔軟性に制限を設けることでオーバーフィッティングを防げます。

00:11:41「構造を強制する（imposing a structure）」、あるいは

00:11:45「正則化（regularization）」という手法で、柔軟性を制限して過学習を緩和します。

00:11:53フィッティングの際にモデルを制限したり、正則化を使ったりするのも一つの手ですが

00:11:59バックテストに関してもう一つの方法は、経済学的、あるいはトレーダーとしての

00:12:09常識的に意味のある戦略だけを実装・テストすることで、過学習を制限する効果が得られます。

00:12:15ランダムなデータであちこちテストして

00:12:19何の意味もなく数万回のバックテストを繰り返していると

00:12:23このように偶然きれいに並んだパターンを見つけてしまいます。

00:12:29「PERがダメならPBRだ」と、むやみにパラメータを変えて

00:12:33闇雲にバックテストを回し続けるのではなく

00:12:39投資家やトレーダーとして市場を観察し

00:12:43経済学的に意味のある投資アイデアやトレードアイデア

00:12:47それを絞り込んでテストすることで、無意味なランダムパターンを拾い

00:12:53検証データまで偶然良く見えてしまうリスクを回避できるのです。

00:12:59「ビッグデータ」や「パターン認識」といった大げさな言葉ではなく

00:13:03日常的な言葉で、自分の戦略がなぜ経済学的に指数を上回る収益を出せるのか

00:13:10それをきちんと説明できないのであれば、単にデータを「拷問（data snooping）」している可能性が高いです。

00:13:16データスヌーピングとは、望む結果が出るまで

00:13:23ひたすらデータを回し続けることを意味しますが

00:13:28私はこれが非常に重要だと考えています。

00:13:31もちろん例外はあります。例えばディープラーニングを使う場合です。

00:13:35正則化やドロップアウトなどの技術を駆使し

00:13:40専門家が適切に最適化してAI投資モデルを作る場合などは別です。

00:13:49ディープラーニングで各重みがどう選ばれたかを経済学的に説明するのは困難です。

00:13:56実際に韓国でも優れたクオンツの方々がこうした戦略を研究されていますが

00:14:04そうしたものは厳密に科学的なアプローチがなされています。

00:14:08そうしたことを感じ取れるかと思いますが

00:14:10今ここでお話ししているのは、一般的な個人投資家がバックテストツールを利用する場合のことです

00:14:17データスヌーピングを避けたいなら、データから始めて無理やり結果を絞り出そうとせず

00:14:24投資アイデアやトレードの着想、経済的な論理からスタートしてバックテストに進むべきだということです

00:14:31私がこうしてお話ししている内容は、主に投資初心者の方々に向けたものなので

00:14:40強化学習でパラメータを決めたりディープラーニングを使ったりする専門家の方は、ご自身の判断で進めてください

00:14:47次に8番目、これも非常に重要ですが

00:14:50自分自身を、本当にあらゆる角度から疑ってみる必要があります

00:14:53ここで言う「自分」とは、自分の作った戦略のことです

00:14:56バックテストを行い、学習データ以外の

00:15:01検証データもパスし、フォワードテスト（ペーパートレーディング）も通ったとしましょう

00:15:06そうした検証段階を経て生き残った戦略は、「収益性が高いと証明された戦略」ではなく

00:15:12「収益性が低いとはまだ証明されていない戦略」に過ぎません

00:15:15言葉遊びのように聞こえるかもしれませんが、この微妙な態度の差が大きな違いを生みます

00:15:21バックテストを通ったからといって盲信するのではなく

00:15:24「まだダメだとは証明されていないだけだ」と考えるべきなのです

00:15:29では、どのような多角的な視点で疑うべきでしょうか

00:15:31まず、結果が良すぎる場合は、おそらくそれは「本物」ではありません

00:15:35例えば、HFT（高頻度売買）ではない

00:15:37単一の戦略でシャープレシオが2を超えたら、少し疑うべきですし

00:15:423以上というのは、ほぼ不可能だと考えたほうがいいでしょう

00:15:44シャープレシオが1前後の複数の戦略を分散させたポートフォリオを組み

00:15:49長期にわたって3以上を維持できれば、それはもう伝説級です

00:15:54「マーケットの魔術師」シリーズに載るレベルと言えます

00:15:56ですから、こうした数値には注意が必要です

00:15:59高頻度売買（HFT）の場合は少し事情が異なります

00:16:02取引頻度が非常に高いため、シャープレシオが3や4になることもありますが

00:16:06HFTの場合はその代わりに

00:16:09莫大なインフラ費用が固定費としてかかるため、文脈が少し違います

00:16:14一般的にクオンツ運用やバックテストを個人でされる方の場合は

00:16:17シャープレシオが2を超えたら、まず疑ってみてください

00:16:20ルックアヘッド・バイアス（先読み偏向）があるのではないか

00:16:22あるいは、過剰適合（オーバーフィッティング）をしていないか

00:16:24バックテストを何度もやりすぎて

00:16:26p値ハッキング（偶然を必然に見せる操作）が起きていないか

00:16:28といった部分を疑う必要があります

00:16:30そして、バックテストを通過した戦略があったとしても

00:16:32継続的にあらゆる側面から細かくチェックし続けなければなりません

00:16:34例えば、コストに関する仮定を調整してみるなどです

00:16:39単純な売買手数料だけでなく

00:16:42出来高や流動性に関する仮定をより厳しく設定して

00:16:46スリッページコストを少し上乗せしてみたり

00:16:48あるいは、戦略のパラメータを変化させてみて

00:16:51パラメータを少し動かしたとしても

00:16:54依然として収益性が高く安定しているか

00:16:56その点を確認する必要があります

00:16:58例えば、PER（株価収益率）に関する戦略だとしましょう

00:17:01結果が次のどちらのケースに当てはまるかを見てください

00:17:04バックテストでPER14が最適だという結果が出た時

00:17:0813.5、14、15、16と値を振ってみて

00:17:13収益がその周辺で少し変化する程度で

00:17:15安定したパラメータの傾向（ロバスト性）を示しているか

00:17:19あるいは、PER14の時は素晴らしい結果だったのに

00:17:2413に減らした途端にガクンと落ち

00:17:2612の時にはマイナスになってしまうといった

00:17:28不安定な

00:17:31パラメータ値が出るのかを確認します

00:17:32後者の場合は、ほとんどが

00:17:34過剰適合である確率が高いです

00:17:36次に、売買のタイミングを少しずつ変えてみてください

00:17:39例えば

00:17:40時間単位で売買するような戦略であれば

00:17:43エントリーや決済の時間を5分、10分とずらしてみたり

00:17:46月単位でリバランスするクオンツ投資戦略であれば

00:17:50通常、月初や月末にリバランスを行いますよね

00:17:54その特定の日に行うと仮定してテストをするわけですが

00:17:56その日の代わりに28日にしたり、月初なら3日や4日にしたりして

00:18:01数日タイミングをずらしてみても

00:18:04収益率がほぼ同じように安定して出るかを見ます

00:18:08月次のリバランスであれば、本来

00:18:11前日にやろうが翌日にやろうが、1〜2日の差で大きな違いは出ないはずです

00:18:14しかし、このように1〜2日変えただけで

00:18:16年利15％だったものが7％にまで落ち込むなら

00:18:20その戦略には問題があるということです

00:18:22その他にも、様々な仮定を追加してみることです

00:18:24外生的イベントの影響や、期間を少し変えてみるなど

00:18:28ただ、外生的イベントなどは実際

00:18:30ご自身のシミュレーションやバックテストの

00:18:34ツールでは再現が難しい場合もあります

00:18:36他にも、統計的なノイズを少し加えてみたりします

00:18:39こうした手法は統計学では一般的に

00:18:42「ブートストラップ法（Bootstrapping）」と呼ばれますが

00:18:44株式市場の変数を、その分布の範囲内で

00:18:48わずかにランダムに変化させてみるのです

00:18:50それでも結果が安定して出るかを確認します

00:18:54とにかく、こうして最大限あらゆる角度から徹底的に検証し

00:18:57その後、一般的には

00:19:00検証データやペーパートレーディングで確認を行った上で

00:19:03ようやく実戦に投入するようにしてください

00:19:06それがお伝えしたいことです

00:19:07また、先ほども少し触れましたが

00:19:10ベンチマークを正しく設定する必要があります

00:19:12実際、あるケースでは

00:19:14「半年間で30％の利益を出した」と

00:19:17自分のクオンツ戦略を自慢していた方がいました

00:19:20ですが、その戦略は買い（ロング）戦略だったのですが

00:19:22昨年、同時期の韓国総合株価指数（KOSPI）は40％上昇していたのです

00:19:25このように、ベンチマークを設定する際も

00:19:28自分の戦略に適したベンチマークを選ぶ必要があります

00:19:31例えば、テック株を中心に戦略を組んだのであれば

00:19:36ナスダックと比較すべきであって

00:19:38S&P500やラッセル指数などと比較してはいけません

00:19:41戦略の収益率に関して言えば

00:19:43例えば、同じ6年間という期間でも

00:19:462011年から17年までに13％出した戦略と

00:19:492015年から21年までに17％出した戦略、どちらが優れているでしょうか

00:19:53普通は17％の方が良いと思うでしょうが

00:19:56その期間に、その戦略のベンチマークがどう動いたかによって

00:20:00どちらが良いかは変わってきます

00:20:02絶好調な相場で17％しか出せなかったのと

00:20:06マイナス成長だったある国の市場で

00:20:0813％の利益を出した戦略では、価値が全く異なりますから

00:20:11しかし、こうしたベンチマークとの比較をせずに

00:20:14自分の絶対的な収益率の数値だけを

00:20:16重視する方々が意外と多いのです

00:20:19ですから、常にベンチマークに対して

00:20:20相対的に自分の戦略を評価しなければなりません

00:20:23では、自分の戦略のベンチマークを設定する際

00:20:25どのような要素を考慮すべきでしょうか

00:20:27ボラティリティ・リスク、あるいはバリュー株かグロース株か

00:20:30これらに関連するインデックスはそれぞれ別に存在します

00:20:33例えば、ご自身の戦略が

00:20:35ハイテク成長株だけに範囲を絞って

00:20:38その中から銘柄を選ぶクオンツ戦略であれば

00:20:41ハイテク成長株関連の指数を基準に

00:20:45ベンチマークとして比較すべきです

00:20:48次に、オプションを使用する場合です

00:20:50現物株を買うポートフォリオですが

00:20:52オプションでヘッジをかけているとします

00:20:53このようにオプションを使っているのに

00:20:54それをS&P500指数と比較していいかというと

00:20:56ダメです

00:20:57絶対にダメです

00:20:58これはオプションヘッジされた適切なベンチマークと

00:21:00比較して、戦略を評価しなければなりません

00:21:03また、買い（ロング）だけなのか

00:21:05あるいは買いと空売り

00:21:06両方を行うロング・ショート戦略なのか

00:21:08空売りも行う戦略なのに

00:21:10買いだけの指数を使ってはいけません

00:21:13このように

00:21:14自分の戦略にふさわしいベンチマークを設定し

00:21:17そのベンチマークの収益率と比較して

00:21:19自分の戦略のパフォーマンスを評価すべきだという点です

00:21:22実は非常に基本的なことなのですが

00:21:24あまりにも多くの投資初心者の方々が

00:21:27ここを素通りしてしまい

00:21:28ただ絶対的な収益率だけを見てしまいます

00:21:30そして最後になりますが

00:21:31戦略を分散させること

00:21:33どれほど、どれほど心血を注いで

00:21:35バックテストを慎重に行い

00:21:37科学的に厳密に作り上げたとしても

00:21:39実際の収益率は（テストとは）異なって現れます

00:21:41ですから、戦略を分散投資すれば

00:21:43収益率を下げずに

00:21:45リスクを軽減する効果

00:21:47いわゆる分散効果を享受することができます

00:21:49もちろんケースバイケースではありますが

00:21:51全体として、シャープレシオの観点からは

00:21:54間違いなく分散投資をするのが得策です

00:21:56この観点で見ると

00:21:58既に保有している戦略と似たような戦略は

00:22:01追加する価値がさほどないという意味にもなります

00:22:03例えば、自分のポートフォリオの中に

00:22:05特定の財務諸表データを使った

00:22:07戦略があるとします

00:22:08それと似たような内容で

00:22:10少しだけ条件を変えて

00:22:11バックテストを行い

00:22:12それを組み込もうとするのは

00:22:14あまり意味がありません

00:22:16そうお伝えしたいです

00:22:17以上、クオンツ投資

00:22:18クオンツ売買で注意すべき

00:22:2010のポイントです

00:22:21データを疑うこと

00:22:22未来を先取りして見ないこと

00:22:23過剰適合を避けること

00:22:25検証のチャンスは一度きりだということ

00:22:27時代は変わるということ

00:22:28マーケット・レジームの変化

00:22:29そしてクオンツであっても

00:22:30自分を律する必要があるということ

00:22:31過度に、何の

00:22:33投資アイデアもないまま

00:22:34ただバックテストだけを

00:22:35ひたすら回し続けてはいけないということ

00:22:36そうした観点から

00:22:38非クオンツ的な言葉で

00:22:39戦略を説明できなければならないということ

00:22:40もちろん例外はあります

00:22:42ディープラーニングや

00:22:43強化学習といった分野では例外もありますが

00:22:44次に、バックテストを通過しても

00:22:46本当に多角的な視点から疑い

00:22:48少しずつ環境条件を調整しながら

00:22:50パラメータによる収益が安定しているか

00:22:52その点を確認すること

00:22:54そしてベンチマークを正しく設定すること

00:22:56次に、戦略を分散すること

00:22:58ですので、この10点さえ肝に銘じておけば

00:23:00間違ったバックテストによって

00:23:02クオンツ投資やクオンツトレードをしながら

00:23:04時間を無駄にしたり

00:23:06また、こうした誤ったバックテストから生じる損失は

00:23:09避けることができます

00:23:10そうお伝えしたいです

00:23:11ただ、誤ったバックテストによる損失を避けるだけであって

00:23:14正しいバックテストをしたからといって

00:23:16収益が保証されるわけではありません

00:23:18しかし、少なくともバックテストのミスによる損失は防げます

00:23:22では、まとめとして

00:23:23クオンツの長所と限界について少しお話しします

00:23:26動画の冒頭でも強調したように

00:23:28クオンツ投資が悪いというわけではなく

00:23:30計量化された思考を持つことは、投資家として非常に望ましいです

00:23:34しかし、過大広告に惑わされて

00:23:36生半可なバックテストをすることは、むしろ毒になり

00:23:38時間やお金を失うだけでなく

00:23:40「自分は科学的に投資している」という

00:23:42間違った幻想を抱いて

00:23:44過度なリスクを取ってしまう可能性があります

00:23:46実際に損失を出した事例を見て、本当に心苦しく思います

00:23:50問題なのは

00:23:52ずさんなバックテストを行い

00:23:54統計的に無意味な行動ばかりに基づいて

00:23:56戦略を立てたとしても

00:23:58株式市場のランダム性のせいで

00:24:00そんな適当なテストでも利益が出てしまう場合があることです

00:24:03バックテストを間違えたからといって

00:24:05必ずしもテスト結果より

00:24:07悪い結果が出るとは限りません

00:24:09テスト結果と実戦での収益に

00:24:11大きな乖離が生じるという意味なのです

00:24:13その誤差は上振れすることもあれば

00:24:15下振れすることもあります

00:24:17ただ、一般的にバックテストは過去のデータで

00:24:19収益率を最大化させるものなので

00:24:21普通、誤差が出れば下方へ

00:24:23つまり、より悪い結果として現れるのですが

00:24:26統計的に何の意味もないバックテストをした場合

00:24:30つまり、完全に運任せだったり

00:24:32単に実戦に投入した時の

00:24:35市場環境が非常に良くて

00:24:37テスト通りの利益が出たり

00:24:39あるいはそれ以上の利益が出ることもあります

00:24:41これが一歩間違えると

00:24:43「ビギナーズラック」になってしまうのです

00:24:45これはクオンツ投資に限らず

00:24:47カジノや裁量トレード、チャート分析など

00:24:50お金を賭けるような

00:24:53確率論的な世界でよく起こることですが

00:24:56人は最初にお金を手にすると

00:24:59自信を持ってさらにお金を注ぎ込み

00:25:01借金までしてしまい

00:25:02結果としてさらに大きな損失を招くケースがあります

00:25:05ですので、こうした部分には注意が必要です

00:25:07繰り返しますが

00:25:08バックテストで収益性が高いと

00:25:11証明されるわけではありません

00:25:12何度も検証してみた結果

00:25:14「特に収益性が悪いとは証明されなかった」

00:25:17そのような状態の戦略が

00:25:19実戦に投入されるのであって

00:25:21利益が保証されたり

00:25:22有望だと証明されたわけではないのです

00:25:24そのことを改めて強調しておきます

00:25:27それから、実際にある

00:25:29少し批判的な方々が

00:25:31私に言ってくることなのですが

00:25:32「こいつはいつも

00:25:34何でも難しいとばかり言う」と

00:25:36「バリュー投資も難しい」

00:25:37「チャート分析も難しい」

00:25:38「インデックス投資も右肩上がりが

00:25:40必ずしも絶対ではない」

00:25:41「クオンツ投資までもが難しいと言うなら」

00:25:44「一体何をしろと言うんだ？」と

00:25:46こんな話も耳にしました

00:25:47「金融業界にいるからといって

00:25:49プロぶっているのか？」

00:25:51「素人はインデックス投資でもしてろと

00:25:53バカにしているのか？」と

00:25:54しかし、そうではありません

00:25:55そもそも他人より稼ぐこと自体、難しいことなのです

00:26:00正直なところ、このように

00:26:01間違ったクオンツ投資をする人が

00:26:03多ければ多いほど、私には利益になります

00:26:05そういう方々が市場の非効率性を生み出し

00:26:08そういう方々がいてこそ

00:26:10誰かが超過収益を得られるからです

00:26:12あえて「間違った方法でやっていますよ」と

00:26:14教えてあげる義理はないわけです

00:26:15ですから、私がこれらすべてを「難しい」と言うのは

00:26:18「皆さんはやめておきなさい」とか

00:26:20「専門家でなければインデックス投資でもしてろ」と

00:26:23言っているのではなく

00:26:24他人より多く稼ぐのは元々難しいことなので

00:26:28より多く稼ぎたいのであれば

00:26:30正しい方法で努力をし

00:26:32勉強して実力をつけ

00:26:34経験を積んで

00:26:35そういう方向性を持って

00:26:36バリュー投資であれ

00:26:37クオンツ投資であれ

00:26:39あるいはインデックス投資であれ、取り組んでください

00:26:41という意味なのです

00:26:42しかし、こうした常識的な話が

00:26:44なぜなかなか通じないのでしょうか

00:26:45「〇〇を使えば簡単に稼げる」

00:26:48「簡単に年利20%出せる」

00:26:50というような話は、実は

00:26:5110年前、20年前、30年前

00:26:53100年前からずっとあったはずです

00:26:55毎回こうした噂が広まり

00:26:57新しい投資手法が登場すれば

00:26:59そこでもまた同じような話が出て

00:27:01また新しい金融商品が出れば

00:27:03そこでもまた繰り返されます

00:27:05それなのに、なぜ毎回このように

00:27:06被害者が繰り返し

00:27:08歴史が繰り返されるように現れるのでしょうか

00:27:10私の考えでは

00:27:12間違った方法を通じても

00:27:14実際に成功してしまうケースが

00:27:16出てくるからだと思います

00:27:18カジノでも大金を手にする人はいます

00:27:20また、ずさんなバックテストでも

00:27:21稼ぐ人が実際に存在します

00:27:24そのため、根底にある実質的な分布が

00:27:26隠されてしまうのです

00:27:27つまり、世の中や人生には

00:27:29ある種のランダム性が存在するため

00:27:31その変動性が実際には

00:27:33平均値を覆い隠してしまうのです

00:27:35そこで、このような図を考えてみました

00:27:37その人が将来お金を稼げるかどうかは

00:27:41確定的なものではなく

00:27:43確率的なものだと考えています

00:27:45今、X軸がどれだけ金持ちになるか

00:27:48つまり右に行くほど富を築ける

00:27:50そう考えてみましょう

00:27:51すると、例えば公務員の方や

00:27:54定年退職が保障されている方

00:27:56あるいは誠実に生きて貯金をする方

00:27:58そうした方々がこれくらいの富を築くと

00:28:01仮定してみると

00:28:02こうした方々は安定的に預金などで運用し

00:28:05非常に慎重に行動されるので

00:28:07富の変動性はそれほど高くありません

00:28:09多少の支出があったり

00:28:11預金利息を受け取ったりしても

00:28:13その周辺で動くだけです

00:28:15しかし、ここで株式投資を始めると

00:28:17人生における変動性が増します

00:28:20株で損をすることもあれば

00:28:22利益を得ることもありますし

00:28:24金融危機が起きて

00:28:26ガクンと下がることもあるでしょう

00:28:27ただ、この図で少し違うのは

00:28:29単に直線で描かれていますが

00:28:31このようにリスクテイクを増やすと

00:28:34つまり株式投資をすれば

00:28:35変動性が増える代わりに

00:28:37期待値は少し右へと移動します

00:28:39実際にはこのようになります

00:28:42安定した人生よりも

00:28:43リスクを取る代わりに

00:28:45その報酬として

00:28:46平均的には右側（プラス）へ行くようになっています

00:28:48そう考えてください

00:28:50そして、より極端な人生を追求する人は

00:28:54先物、派生商品、仮想通貨などをすると

00:28:57黄色い線のように変動性が大きくなります

00:28:59また、同じ株式投資をする人でも

00:29:02さらに実力をつければ

00:29:04こちら側の確率分布を持つことができ

00:29:06さらに磨けば、もっと右へ行けるかもしれません

00:29:08しかし、間違った方法で投資をする人々

00:29:10カジノでギャンブルをしたり

00:29:12投機に走ったり

00:29:14あるいは違法な投資勧誘や相場操縦をするグループに入ったり

00:29:18今日お話ししたような誤ったバックテストをしたり

00:29:21噂話だけを信じて一点買いをしたりする場合

00:29:23これも本来はもっと変動性を大きく描くべきですが

00:29:26要旨としては、期待値は左側へと移動します

00:29:29ですが問題なのは

00:29:31そういうことをしている人たちの中でも

00:29:33あくまでこれは確率的な分布なので

00:29:351,000人、1万人に1人は

00:29:38大成功を収めることがあり得るのです

00:29:40カジノでジャックポットを当てたり

00:29:43仮想通貨の一点買いで大儲けしたり

00:29:45こうした人が数万人に1人は必ず出てくるものです

00:29:48しかし、こうした事例を「生存者バイアス」だと捉え

00:29:51確率分布においてこうしたケースも

00:29:551万人に1人は起こり得ると理解できず

00:29:57そうしたマインドを持てないまま

00:29:59周りに流されて、せっかく誠実に生きていたのに

00:30:03そうなると、高い確率で資産は減っていくことになります

00:30:07もちろん、細かく言えば分布をもっと右に寄せるべきだとか

00:30:11あるいは、もっと平坦な形にすべきだといった

00:30:13議論はあるかと思いますが、それはさておき

00:30:15私が今お伝えしたいのは

00:30:17資産形成や財テク、あるいは株式市場というものは

00:30:20確定的な決定論の世界ではなく

00:30:25このように分布によって成り立つ、確率的な世界だということです

00:30:28たとえ正しく適切な方法で株式投資を行っても

00:30:31相場が悪かったり、不運なイベントが重なったりして

00:30:35結果が下振れすることもありますし

00:30:37カジノのような間違ったギャンブルをしても

00:30:39本当にたまたま、その人が行った時に

00:30:41誰かしらには当たりが出るようになっているので

00:30:43ジャックポットを当てる可能性もあるわけです

00:30:45このように、世界は「確率的優位のない行動」をしたからといって

00:30:49すぐに結果が固定されてしまうものではなく

00:30:51確率的な分布の中で生きていくことになるので

00:30:55間違った行動をしても成功する場合もあれば

00:30:57正しく生きようとしても失敗する場合もある、そういうものなのです

00:30:59そういうことなのです

00:31:00しかし、こうした行動を繰り返していけば、結局のところ

00:31:03正しい人はこちら側に収束し

00:31:04間違った人はあちら側に収束していくことになります

00:31:06その考えを持ってさえいれば

00:31:08極端な例の人が騒いでいたり

00:31:10あるいは、そういった類の話に誘惑されたとしても

00:31:13自分を保つ助けになるのではないかと思い

00:31:16この図を準備してみました

00:31:19では、クオンツの話に戻りますが

00:31:21クオンツの限界は、実のところ過去のデータに依存している点です

00:31:25過去のパターンが繰り返されるという仮定の下で行うバックテストなので

00:31:29そこがクオンツの限界であり

00:31:31第1部で申し上げた「マーケット・レジーム」

00:31:33つまりコロナ禍のようなイベントが発生した際

00:31:35市場の体制や性質そのものが変わってしまい

00:31:38過去のパターンが全く通用しなくなるのです

00:31:41実際、昨年のコロナ発生後のデータを見ると

00:31:43これが米国の一般的なミューチュアル・ファンドの収益率

00:31:46これが一般的なヘッジファンドの収益率

00:31:48そしてこれがクオンツのミューチュアル・ファンド

00:31:50さらにこれがクオンツのヘッジファンド

00:31:52そしてラッセル指数となっていますが

00:31:54クオンツの方が明らかにアンダーパフォームしていますよね

00:31:57また、ファクターの中でもモメンタム以外は

00:32:00（これは夜間の米国株式市場ですが）

00:32:02他のファクターはすべて市場全体を下回る結果となりました

00:32:06こうしたファクター投資の他にも

00:32:08アルファを探そうとする試みにおいて

00:32:10最近は「オルタナティブ・データ」などが話題になっていますが

00:32:14実は、この分野もクオンツたちのデータ費用が莫大になっており

00:32:18真のアルファを見つけるためのコストは、ますます増加しています

00:32:22まるで冷戦時代の軍拡競争のように

00:32:24本当に斬新なアイデアや

00:32:26まだ発見されていない、収益性の高い

00:32:28超過収益をもたらし続けるパターンを

00:32:30見つけるのはどんどん困難になっていますが

00:32:32それを探すためのコストは膨れ上がっているのです

00:32:34投入コストに対する限界超過収益は減少しており

00:32:38クオンツヘッジファンドなどにいる知人に話を聞くと

00:32:42以前は、超過収益を生む非常に優れた戦略を

00:32:46徹底的なリサーチによって発見すれば

00:32:48例えば、1年くらいはその効果が持続したそうです

00:32:52それから徐々に収益性が悪化し

00:32:54調整が必要になるといった流れでしたが

00:32:56今ではその期間が4か月から6か月に短縮されたと言っていました

00:33:00なぜなら、クオンツ同士の競争が激化しており

00:33:04さらに、クオンツが転職を繰り返すことで

00:33:06戦略が平準化されてしまったり

00:33:08また、Quantopian（クアントピアン）は閉鎖されましたが

00:33:11他にもバックテスト用のプラットフォームが数多く存在します

00:33:14今や数十種類はあるかと思いますが

00:33:16個人投資家も参入してきたことで

00:33:18市場で独占的なアルファを掴み

00:33:22圧倒的な超過収益を出すことが難しくなっています

00:33:25このように、レッドオーシャン化しているわけです

00:33:27その点、クオンツと対比される「人間の判断」の

00:33:30長所は、少ないデータからでも推論が可能だということです

00:33:34例えばコロナ禍などは

00:33:35まさに唯一無二のイベントと言えます

00:33:38過去にコロナのような

00:33:40パンデミックが起きたケースは非常に少ないため

00:33:43過去のデータからパターンを見つけるのは不可能です

00:33:46しかし、そのような一度きりのケースであっても

00:33:49人間は1920年代のスペイン風邪を分析したり

00:33:53あるいは様々な人生の知恵をもとに

00:33:56合理的な推論をすることが可能です

00:33:58そのため、株式市場において

00:34:00計量化、クオンツ化が進む傾向を見てみると

00:34:03データ数が分・秒単位で非常に膨大かつ詳細な

00:34:07「高頻度取引（HFT）」から自動化が始まり

00:34:09短期売買を行うトレーダーは次第に追い込まれ、姿を消しています

00:34:13その一方で、まだ年単位のデータ数が少ない

00:34:16長期投資の分野では、依然として人間が推論する余地が大きく

00:34:21ヘッジファンドも、長期投資を行う側は

00:34:24最近は「クオンタメンタル」なども導入していますが

00:34:26やはりファンドマネージャーによる裁量的な判断が大きな割合を占めます

00:34:31そういった側面があります

00:34:32歴史の流れがクオンツの側にあるのは間違いなく

00:34:35今後ますます計量化が進んでいくでしょうが

00:34:38「汎用人工知能」、つまり学習したタスク以外の

00:34:42新しい問題に直面した時

00:34:44他のタスクでの経験などを

00:34:47推論に用いて新しい課題をこなせるような

00:34:49人工知能が登場するには、少なくとも数十年はかかります

00:34:52ワンショット学習やメタ学習の研究は進んでいますが

00:34:55私はいまだ遠い未来の話だと考えているので

00:34:58株式市場においても、人間を完全に代替することはまだできません

00:35:02そう考えています

00:35:03しかし、それでもやはり歴史の流れは

00:35:06計量化、クオンツ化へと向かっていることは否定できません

00:35:09マーケット・レジームやパラダイムの変化に弱い面があるとはいえ

00:35:12何の原則も復習もなく、その場の雰囲気で売買したり

00:35:15感情に振り回される人間よりは、はるかに優れたパフォーマンスを出します

00:35:19ですから、本気でトレーダーを職業として成功させたいのであれば

00:35:23私が見るに、およそ3つの方法があります

00:35:261つ目は、個人の判断でトレードをする場合

00:35:29様々な計量的分析やセンチメント・モデルなどの

00:35:33補助をある程度受けながら

00:35:36ニュースや市況分析、あるいはシナリオ分析といった

00:35:39クオンツアルゴリズムが苦手とする

00:35:41新しいイベントに対する分析やリサーチを加え

00:35:43それらを統合して判断することです

00:35:45あまりに頻繁な高頻度取引ではなく

00:35:48デイトレードからスイングトレードの間くらいに

00:35:51腰を据えて売買を行うトレーダーです

00:35:54私は個人売買において、こうした道を歩んでいます

00:35:57例えば、オプションの売買データをすべて処理し

00:36:00そこに機械学習を適用して

00:36:03シグナルをある程度算出させます

00:36:05また、ニュースデータをすべてスクレイピングして

00:36:07センチメント・モデルを学習させ

00:36:09そのシグナルを確認したりします

00:36:11それらを使って自動売買をするのではなく

00:36:13自分の判断において、それらの要素を参考にしつつ

00:36:16現在の市況やFRBの動向など

00:36:19様々な情報を総合的に加味して

00:36:21最終的な売買判断を下すという

00:36:23形式が1つあります

00:36:242つ目は、理系を専攻している

00:36:26学生の方などであれば

00:36:28もし機関投資家でクオンツをしたいなら

00:36:31本格的に理系の博士課程で学び

00:36:34機関投資家の専門クオンツになる道もあります

00:36:363つ目は、現在クオンツ売買をされている方のうち

00:36:39機関投資家が手を出さない「ニッチ」な領域があります

00:36:42そこを攻略する個人クオンツとして売買を行うか

00:36:46おおよそこの3つの方法があるのではないかと思います

00:36:49機関が手を出さないニッチの例としては

00:36:52運用キャパシティが数億円未満の戦略です

00:36:55こうした戦略に機関投資家はリソースを割きません

00:36:58この「キャパシティ」とは、投入資金を増やせば増やすほど

00:37:01どれくらい収益率が低下するかという指標で

00:37:03取引コストやスリッページなどの要因もあれば

00:37:05流動性の問題などもあります

00:37:07そういった部分なのですが

00:37:08だいたい5億円から10億円あたりが境界線ではないか

00:37:11そう考えています

00:37:12言い換えれば、その程度の規模でキャパシティが限界に達する

00:37:15戦略には、機関投資家は手を出しません

00:37:18そこに労力を注いでも、得られる利益が少ないからです

00:37:21しかし、個人の立場からすれば、5億から10億まで

00:37:24資金を増やしても収益率が落ちないのであれば

00:37:27実のところ、それで十分ですよね

00:37:29ですから、そうしたニッチな領域をうまく見つけ

00:37:31市場の歪み（非効率性）を探し出し

00:37:33利益を出していけばよいのです

00:37:34では、どうすれば正しく勉強できるでしょうか

00:37:38クオンツ売買やアルゴリズム売買に関連して

00:37:40どのようなカリキュラムを組むべきか

00:37:42概略をお話ししますと

00:37:44実際には多様なルートがありますが

00:37:45大まかにまとめてみましょう

00:37:47まず、コーディングは絶対に学ぶべきだと思います

00:37:50コードが書けずにExcelを使っているクオンツは、もはやクオンツではありません

00:37:53いくらExcelに関数が豊富だとしても

00:37:56根本的に制限の多いツールであり

00:37:59扱えるデータ数も、少し多くなれば

00:38:01Excelはフリーズしてしまいます

00:38:02最低限、Pythonくらいは勉強する必要があります

00:38:05誰もが手軽にバックテストを回せるような

00:38:08財務諸表の指標やテクニカル指標を使い

00:38:11既に出尽くしたような戦略に

00:38:14しがみついて過剰最適化（オーバーフィッティング）をするのでなければ

00:38:17自分自身の斬新なアイデアを戦略に落とし込み

00:38:20真のブルーオーシャンやニッチを探し出し

00:38:23超過収益を出そうとするなら、必ずコーディングができなければ

00:38:26そうしたアイデアを柔軟に形にすることはできません

00:38:29そうお伝えしたいです

00:38:30次に、当然のことながら

00:38:31統計の基礎をしっかりと固める必要があります

00:38:33これは本当に最低限ですが、学部レベルの統計学や

00:38:37ベイズ統計学

00:38:38このあたりは、少なくとも1つや2つは

00:38:40授業を受けたりして習得すべきです

00:38:42それから、時系列分析について

00:38:44ARIMA、コインテグレーション、カルマンフィルタといった

00:38:46手法も学びますが

00:38:48全般的に「時系列」というデータを扱う際に

00:38:51どのような点に注意すべきか、どのように処理すべきかといった知識も必要です

00:38:52どのように処理すべきかといった部分です

00:38:55次に、最近は機械学習ですね

00:38:57回帰分析も、厳密に言えば機械学習の一つですし

00:39:00機械学習、マシンラーニングには

00:39:02SVMやランダムフォレスト

00:39:05あるいはアダブーストなど

00:39:07非常に多くのアルゴリズムがあります

00:39:09勉強する時間があればすべて学んでもいいですが

00:39:12個人的には回帰分析

00:39:14LightGBM

00:39:15あるいはXGBoost

00:39:16それからディープラーニング

00:39:17次に非階層学習

00:39:18クラスタリングなどの部分ですね

00:39:20そして自然言語処理

00:39:22加えて強化学習も、最近はトレードに適用する傾向にあります

00:39:26このあたりを勉強すればいいでしょう

00:39:28次に、非常に重要なのが英語です

00:39:30クオンツ関連の韓国語資料は、まだ非常に乏しいのが現状です

00:39:33決して韓国のクオンツがアメリカに比べて劣っている

00:39:37という意味ではありません

00:39:38韓国にも本当に素晴らしいクオンツは大勢います

00:39:40ただ、そうした優秀な方々は皆、英語の資料に精通しているので

00:39:46あえてそれらを韓国語に訳したりはしないんです

00:39:49そのため、大半のクオンツ資料は英語で構成されています

00:39:53韓国語のクオンツ学習資料があるとしても

00:39:58私が見てきた限りでは、非常に基礎的で大衆的なレベルのものばかりです

00:40:03少し深く踏み込むと韓国語資料は乏しいので、英語は必須です

00:40:11そして、クオンツ・ファイナンス関連の論文です

00:40:14クオンツ・ヘッジファンドも論文から多くのアイデアを得てテストしているので

00:40:21こうした論文をたくさん読んでみてください

00:40:24「いつこれらを全部勉強するんだ」と思うかもしれませんが

00:40:28すべて終わらせてから始める必要はありません

00:40:32統計の基礎をしっかり固めた後なら

00:40:352、3番目まではそれほど時間はかからないと思います

00:40:39理系ベースのある方なら既知か、半年ほどで習得できます

00:40:442、3番までできれば、新しい手法を学びながら

00:40:48並行して戦略を立てていっても差し支えありません

00:40:52そうお伝えしておきます

00:40:53実際に私が勉強した資料や講義資料を

00:40:57すべてまとめたものがありますが、厚さはこれくらいになります

00:41:00これは両面印刷なのですが

00:41:02A4で500枚から600枚ほどになるかと思います

00:41:07数学、統計、物理といった理系のベースを

00:41:11学部時代に築いた方なら、半年から1年ほど

00:41:15猛勉強すれば可能でしょう

00:41:18理系ベースがない方は、1年から3年は見積もる必要があります

00:41:23それくらいの期間を考えてカリキュラムを組んで勉強すれば

00:41:28実はこうした知識はクオンツ売買だけでなく

00:41:31データサイエンスや開発など、多方面で非常に役立ちます

00:41:36チャート分析ばかりしていても、他の分野ではあまり潰しが利きませんよね

00:41:41もし投資が上手くいかなければ、費やした時間が無駄になってしまいますが

00:41:46こうした勉強は本質的な実力を高め、キャリア面でも非常に有利です

00:41:52次にバックテストツールについて調べていたところ

00:41:57Redditで見つけたこちらのリンクに

00:42:02アルゴリズムトレード関連のサービスやサイトが載っています

00:42:06昔使っていたものにはQuantopianもありましたし

00:42:10QuantConnectも使いましたが、これも良かったです

00:42:13個人だと月8ドルほどかかりますが、なかなか優秀でした

00:42:18広告ではありませんし、他のツールをすべて試したわけではないので

00:42:23手放しでおすすめするという話ではありませんが

00:42:26国内ではbacktest.krやGenPortといったサービスがあるようです

00:42:32実際に使ったことがないので評価は控えますが

00:42:36国内のツールもどんどん発展していけばいいですね

00:42:39ただ、特定の機能しかテストできない限定的なサイトよりは

00:42:44インフラが整っていて、様々なプログラミング言語をサポートし

00:42:50自分が書いたコードを拡張機能のように繋いでテストできる

00:42:56そのようなサイトをおすすめします

00:42:58なぜなら、そうした柔軟性があってこそ

00:43:00斬新なアイデアを実際に検証し、具現化して

00:43:03超過収益を上げることができるからです

00:43:07本気でクオンツ売買の道を目指すのであれば

00:43:11必ずコーディングを勉強して

00:43:13戦略部分は自分でコーディングし

00:43:15残りのインフラ部分は構築済みのサービスを

00:43:19活用するのが良いのではないかと思います

00:43:22そうお伝えしておきます

00:43:23ただ、サービスがあまりに多すぎて

00:43:26どれが良いとは一概には言えませんが

00:43:29「コーディングも必要だし

00:43:31やることが多すぎる」

00:43:33と思われたかもしれません

00:43:34「どこかに簡単な方法はないか」と

00:43:36考えたりもするでしょう

00:43:37「魔法の公式」のような戦略は直感的で魅力的ですが

00:43:40この20年間、他の分野と同様に

00:43:42金融界も大きく変化し、発展してきました

00:43:45他のどんな分野においても

00:43:4780年代、90年代の技術を今も使っている分野はありません

00:43:50しかし不思議なことに、株式市場では

00:43:5280～90年代の戦略がいまだに個人投資家の間で

00:43:56流行したりしています

00:43:57そうした現象が見受けられますが

00:43:59世の中にそれほど直感的で簡単に稼げる方法はないと思ってください

00:44:03ただ、株式市場の確率と変動性のせいで

00:44:06努力せず安易な方法を使っても

00:44:09儲かる人が出ることもあれば

00:44:10努力しても損をする人が出ることもあります

00:44:13そうした現象は起こり得ますが

00:44:15そうした表面的な姿を見て

00:44:16惑わされないでください

00:44:17現実を直視し

00:44:18先ほどの確率分布

00:44:20それを念頭に置いて

00:44:22自分はどの確率分布を選択するのか

00:44:25険しくても右側へ行く道を選ぶのか

00:44:28あるいは左側の道だけれど

00:44:29変動性を高めることで

00:44:31そこに到達できるか

00:44:32一度ギャンブルをしてみるのか

00:44:34それを選ばなければなりません

00:44:36そうお伝えしておきます

00:44:37最後に、私も「イカゲーム」を

00:44:40最近楽しく観たのですが

00:44:41オ・イルナムおじいさんが

00:44:42最後に言っていた言葉が

00:44:44とても印象に残っています

00:44:45臨終の間際に

00:44:46「金がまったくない者と

00:44:48金がありすぎる者の共通点が

00:44:50何か分かるか」と言い

00:44:51「それは、楽しくないことだ」と

00:44:52おっしゃるんです

00:44:54私は

00:44:55実際の人生において

00:44:56楽しさや幸せは

00:44:57お金が少ない状態から

00:44:59増えていく過程にあるものであって

00:45:01そうした過程をすべて飛び越えて

00:45:03金持ちになることは

00:45:04あまり意味がないと思うんです

00:45:06そうした道は、実は

00:45:08楽しくて幸せな

00:45:09記憶や

00:45:10経験を

00:45:11すべて省略してしまったのと同じです

00:45:13私も昔、ゲームが

00:45:14大好きでしたし

00:45:15中学生の頃は

00:45:17本当にゲームに狂っていました

00:45:18高校生になってもそうでしたが

00:45:20一人用ゲームが

00:45:21いつから面白くなくなったかというと

00:45:23チートを使い始めた時からです

00:45:26スタークラフトで

00:45:27「Show me the money」と打てば

00:45:28一瞬で金持ちになり

00:45:29簡単に勝てますよね

00:45:30ですが、勝つために

00:45:32ただチートを使うことは

00:45:33ゲーム本来の目的である

00:45:35困難を乗り越える過程の

00:45:37楽しさを、実は

00:45:38すべて捨ててしまい

00:45:39ゲームを退屈にするのと同じです

00:45:41私たちの人生も

00:45:43現実が辛かったりすると

00:45:44「金があればいいのに」

00:45:46と考えますし

00:45:47実際にお金が増えれば

00:45:49幸せにもなります

00:45:50ですが、お金そのもの

00:45:51結果そのものによる

00:45:53幸せは

00:45:54すぐに倦怠感へと変わるだけで

00:45:56その過程こそが

00:45:57真の幸福の核心なのです

00:45:59そんな、ありきたりな話を添えて

00:46:01今日の動画を終えたいと思います

00:46:03それでは

00:46:04また別の動画でお会いしましょう

00:46:06ありがとうございました

Key Takeaway

クオンツ投資の本質は単なる過去データの最適化ではなく、統計的な過ちや錯覚を自制し、論理的根拠に基づいた検証と徹底的な自己疑念を通じて確率的優位性を探求することにあります。

Highlights

バックテストの回数が増えるほど「過学習（オーバーフィッティング）」のリスクが高まり、実運用での収益性が低下する数学的・実証的事実の提示

統計的な有意性を歪める「p値ハッキング」の危険性と、ランダムなデータから偶然に良好なパターンを見つけてしまう錯覚への警告

戦略を構築する際はデータから入るのではなく、経済学的・論理的に説明可能な「非クオンツ的言語」での裏付けが不可欠であるという主張

バックテストを通過した戦略は「収益性が証明された」のではなく「まだダメだと証明されていない」に過ぎないという謙虚な姿勢の重要性

シャープレシオが2や3を超える異常な数値、またはパラメータの微調整で結果が激変する戦略は過学習を疑うべきであるという具体的指針

個人のクオンツ投資家が生き残る道として、機関投資家が扱わない「運用キャパシティが小さいニッチな領域」の攻略を提案

Timeline

イントロダクション：クオンツ投資への誤解とリスク

ウォール街の専門家が、クオンツ投資に対する盲信や誇張された希望に対して警鐘を鳴らすことから始まります。統計的基礎がないまま不適切なバックテストを行うことは、時間の浪費だけでなく、科学的な検証をしたという錯覚から過度なリスクを負うことにつながります。実際に、誤ったバックテストを信じ込んでレバレッジをかけ、多額の損失を出した投資家の事例が紹介され、市場環境の良さを自分の実力と勘違いする危険性が指摘されます。この動画の目的はクオンツを否定することではなく、正しい努力と基本を身につけることの重要性を説くことにあります。初心者は特に、常識的な投資判断よりも「近道」を求める議論に流されないよう注意が必要です。

バックテストの罠：過学習とp値ハッキング

「バックテストは多ければ良い」という誤解を解き、クオンツにおける自制の必要性を数学的観点から解説します。バックテストを繰り返すほど、単なるランダムな動きからパターンを拾ってしまう「過学習」の問題が深刻化し、テスト時と実運用の収益差が拡大します。統計学における「p値ハッキング」という概念を用い、偶然に良い結果が出る確率を操作してしまう学問的に不適切な態度の危険性を説明しています。ランダムウォークの株価データであっても、何度もテストを繰り返せば、シャープレシオが1や2を超える戦略が偶然現れてしまうという実験結果は衝撃的です。検証データで収益が出たとしても、それが実質的な未来予測力を持つとは限らないことを強調しています。

戦略の正当化：非クオンツ的言語による説明

過学習を避けるための具体的な手法として、モデルの柔軟性に制限を設ける「正則化」や「構造の強制」について言及します。特に重要なのは、自分の戦略がなぜ市場を上回る収益を出せるのかを、経済学的な論理や投資アイデアという「日常的な言葉」で説明できることです。闇雲にパラメータを変えてデータを「拷問（データスヌーピング）」するのではなく、市場観察に基づいた論理的な着想からバックテストを開始すべきだと説いています。ディープラーニングなどの専門的な手法を除き、個人投資家がツールを使う場合は、この論理的裏付けがない限りランダムなパターンを拾っている可能性が高いです。データから結果を絞り出すのではなく、投資のロジックからデータを確認するという順序が成功の鍵となります。

徹底的な検証：ロバスト性とベンチマークの重要性

バックテストを通過した戦略に対し、あらゆる角度から疑いの目を向ける「自己疑念」のプロセスを詳しく解説します。シャープレシオが2を超えるような良すぎる結果はまず疑うべきであり、パラメータや売買タイミングを少しずらしても収益が安定するかという「ロバスト性」を確認する必要があります。例えば、リバランスの日を1〜2日ずらしただけで収益が激減するような戦略は、実戦では通用しない脆弱なものと判断されます。また、戦略の評価には適切なベンチマークの設定が不可欠であり、ハイテク株戦略ならナスダックと比較するなど、相対的なパフォーマンスを正しく把握しなければなりません。最後には戦略の分散投資を推奨し、似たような条件の戦略を複数持つことの無意味さと、リスク管理としての分散効果を強調しています。

投資の本質：確率的世界観と生存者バイアス

クオンツ投資の長所と限界をまとめ、投資が「決定論」ではなく「確率論」の世界であることを図解とともに説明します。不適切な方法で投資していても、市場のランダム性によって一時的に利益が出てしまう「ビギナーズラック」が、多くの投資家を誤った道へ誘い込みます。成功者の事例が単なる「生存者バイアス」である可能性を理解し、正しい行動が長期的には期待値の高い分布に収束するという確信を持つことが重要です。クオンツの限界として過去データへの依存があり、コロナ禍のような「マーケット・レジーム」の変化には弱いという事実を統計データで示しています。市場がレッドオーシャン化する中で、真のアルファ（超過収益）を見つけるためのコストと難易度が年々高まっている現状を伝えています。

未来への展望：人間の推論と学習カリキュラム

クオンツ化が進む市場において、人間が持つ「少ないデータからの推論能力」や長期投資における優位性を再評価します。今後生き残るための3つの道として、裁量と計量分析の統合、専門的なクオンツへの道、そして機関が狙わない「ニッチな領域」の攻略を提示しています。正しい学習のためにはPythonによるコーディング、統計学、時系列分析、機械学習、そして英語の資料への精通が必要であり、1〜3年の長期的な努力が求められます。最後に『イカゲーム』やゲームの「チート行為」を例に挙げ、結果だけを求めて過程を省略することの虚しさを語り、困難を乗り越える過程にこそ真の幸福があるという哲学的なメッセージで締めくくります。投資は単なる金儲けの手段ではなく、実力を磨き、確率的優位性を追求する知的な旅であるべきだと説いています。

Community Posts

バックテスト収益率の罠から生き残るための7つの検証戦略

makedream2026년 3월 11일6700

Write about this video