[월가아재]퀀트 투자의 허와 실 - 제 2부: 백테스팅은 다다익선이 아니다! (오징어 게임 스포 주의)

월가아재의 과학적 투자
주식 투자자격증/평생교육초보 재테크컴퓨터/소프트웨어

Transcript

00:00:00こんにちは、ウォール街です。
00:00:01本日は「クオンツ投資の虚と実」第2部
00:00:03バックテストは多ければいいというものではない
00:00:05これについてお話ししていきます。
00:00:07第1部ではここまで扱いまして
00:00:09第2部では6番から解説していきます。
00:00:12第2部に入る前に
00:00:14動画の目的について改めて強調しておきますと
00:00:17私はクオンツ売買自体が悪いと言っているわけではありません。
00:00:19世界は結局、計量化される方向に流れていますし
00:00:23株式市場においてもクオンツ、計量化といった
00:00:26流れは必然的なものだと考えています。
00:00:28ただ、私はク온ツ投資に対する
00:00:31誇張された希望や盲信
00:00:33そういった部分を警戒しようという
00:00:35趣旨でこの動画を制作しました。
00:00:37統計的推論の基礎が身についていない方であれば
00:00:41こういった部分をしっかり勉強してから手をつけるべきですし
00:00:45視聴者の方のコメントを見ると
00:00:47「勘でやるよりはクオンツ投資の方がマシだ」
00:00:50そう考える方もいらっしゃいますが
00:00:52私はそうは思いません。
00:00:54もちろん勘でやるのも良い結果を得るのは難しいです。
00:00:57しかし、クオンツ投資を誤った方法で
00:01:00つまり、統計的な有意性が全くない
00:01:02そんなバックテストで行ってしまうと
00:01:04第一に、追加で時間を浪費することになりますし
00:01:07また、実際には統計的に何の意味もないバックテストなのに
00:01:11自分は検証を行った
00:01:13何か科学的な検証をしたという錯覚に陥ることで
00:01:16必要以上のリスクを負ってしまう可能性があるからです。
00:01:18実はあまりお話ししたくなかったのですが
00:01:21メールで購読者の方々から、損失を出したという相談をかなり多く受けます。
00:01:27この話は前回も少ししましたが
00:01:29その中に、クオンツ投資で大きな損失を出された方が数名いらっしゃいます。
00:01:34先週メールをくださった方は
00:01:36具体的な金額はプライバシーに関わるので言えませんが
00:01:39家庭不和が生じるほど
00:01:43大きな金額をクオンツ投資で失われました。
00:01:46どのような手法を使ったのかメールでやり取りしながら
00:01:50伺ってみたところ
00:01:51私がこの動画で扱っている内容と相反する
00:01:54統計的に全く意味のないバックテストを何度も繰り返してきた方でした。
00:01:59MDDが15%程度の戦略があったのですが
00:02:04昨年一年の収益率が好調だったので
00:02:07今年に入って多額の借金をして
00:02:10そこに投入されたそうです。
00:02:12韓国総合株価指数(KOSPI)が10%程度下落した際
00:02:15その方のポートフォリオは20%以上下落したのですが
00:02:19借金などを利用して
00:02:22レバレッジが3倍程度かかっていたため
00:02:2460〜70%ほど失うことになったというケースもありました。
00:02:28そういった方々と話をしてみると
00:02:30クオンツ投資のバックテストを過信しており
00:02:34ベンチマークについてもあまり考えていらっしゃらないようでした。
00:02:38昨年一年の収益率が非常に良かったのは
00:02:42実はKOSPIが底値から
00:02:43100%以上上昇した年だったからです。
00:02:45本来なら指数と比較すべきなのですが
00:02:47自分のバックテスト戦略が複利で40%出ていて
00:02:52昨年一年で70%出たからと
00:02:54完全に信じ込んで借金までして投入されたわけです。
00:03:00それを見て非常に残念に思いましたし
00:03:02そんな折に、クオンツ投資に関する議論などを観察していると
00:03:08一度こうした動画を制作する必要があると感じました。
00:03:11そうした考えからこの動画を作ったのですが
00:03:14私が今動画で説明している部分が
00:03:17全く理解できないのであれば
00:03:20そもそも手を出すべきではありませんし
00:03:22あるいは統計的な基礎をしっかり固めて
00:03:25中級者へ進もうとしている方であれば
00:03:2710の注意点に気をつけて慎重にアプローチしてほしいです。
00:03:33すでに中・上級者であれば、ご自身の判断で進めてください。
00:03:36私がとやかく言うことではありませんし
00:03:39正しい方法で構築されたクオンツ戦略は
00:03:43それ自体が非常に優れたエッジを持っています。
00:03:46私はただ「この世にタダ飯はない」という
00:03:49極めて常識的な話をしたいだけなのです。
00:03:52昨年はこうした常識よりも、近道や追い越し車線といった
00:03:57議論が少し行き過ぎていたように感じたので
00:04:01その点で動画を制作したに過ぎません。
00:04:04クオンツが悪いのではなく
00:04:05努力して基本を身につけて行うべきだ
00:04:08という意味で受け取っていただければ幸いです。
00:04:10それでは、クオンツ売買をする際に
00:04:12銘記すべき10のポイントのうち、6番目。
00:04:15クオンツも自制が必要である。
00:04:17これは本当に多くの方が誤解している部分なのですが
00:04:20専門家と自称する方々ですら
00:04:23「バックテストは回せば回すほど良い」
00:04:25という錯覚をしているケースが多いようです。
00:04:28しかし、決してそんなことはありません。
00:04:30バックテストは「多々益々弁ず」ではなく、クオンツも自制を知らなければなりません。
00:04:35これは論文から引用したものですが
00:04:37バックテストを繰り返せば繰り返すほど、過学習の問題
00:04:40つまりオーバーフィッティングの問題が深刻化します。
00:04:44この部分は数学的にも証明されていますし
00:04:47クオンティピアンのユーザーデータや実証的な面から確認しても
00:04:51バックテストを多く回したユーザーのアルゴリズムほど
00:04:55テスト時の収益と、その後の実運用での収益率の差が
00:05:00大きくなることが示されています。
00:05:01その理由は、バックテストを回しすぎると
00:05:04単なるランダムな動きの中からパターンやシグナルを拾ってしまうからです。
00:05:09実際、ある論文では完全にランダムウォーク
00:05:12つまり、無作為に動く株価をシミュレーションして大量に生成し
00:05:18それに対してバックテストを行う実験をしました。
00:05:21すると、完全にランダムな動きの中でもバックテストを繰り返すと
00:05:26シャープレシオが1や2を超えるような戦略が発見され
00:05:29学習データだけでなく検証データでも通用する戦略がいくつか現れ始めたのです。
00:05:36これは他の多くの学問分野でも問題視されている現象で
00:05:40「p値ハッキング(p-value hacking)」と呼ばれます。
00:05:42このp値について、統計学を専攻された方は
00:05:46厳密でない定義を嫌うかもしれませんが
00:05:48初心者の方のために直感的にわかりやすく説明しますと
00:05:52科学者が実験を行う際、その結果が実際に背後にある
00:05:57母集団(サンプルから推測したい全体像)を反映しているのか考えます。
00:06:02例えば大統領選の世論調査なら、国民全体から一部を抽出して支持率を測りますが
00:06:10実際には母集団がそうではないのに、偶然抽出されたサンプルが
00:06:20研究の方向に都合よく偏ってしまい、良い結果が出た確率、それがp値だと考えてください。
00:06:25分野によって基準は異なりますが、一般的には5%未満であれば
00:06:31統計的に有意であると言われます。
00:06:34例えば「候補者Aの支持率が50%以上か」を検証したいとします。
00:06:42サンプルを抽出した結果、55%という数字が出ました。
00:06:47実際には母集団が50%なのに、偶然Aの支持者が多く含まれて55%になる確率は何か。
00:06:57p値が0.2なら、それが単なる偶然である確率が20%あるということです。
00:07:03しかしサンプルで70%という結果が出たなら
00:07:10実際には母集団が50%しかないのに、運良くAの支持者ばかりが
00:07:17サンプルに選ばれて70%になる確率は、1%程度しかないでしょう。
00:07:21これがp値です。
00:07:2255%でp値が0.2の場合
00:07:27「候補者Aが50%ではない」と
00:07:31結論づけることはできません。
00:07:33統計的な有意性が確保されていないと言うわけです。
00:07:38逆に70%出てp値が1%程度なら、基準の5%よりずっと低いので
00:07:46「候補者Aの支持率は50%ではない」と統計的に有意な自信を持って言える
00:07:57という意味になります。これがp値です。
00:08:00p値を良く見せるために実験を繰り返すことをp値ハッキングと言います。
00:08:06例えば、支持率60%でp値が0.05になったとしましょう。
00:08:15これは、実際には母集団の支持率が50%だったとしても
00:08:21100回くらいサンプルを引き直せば、一度くらいは60%になるサンプルが出るということです。
00:08:29科学実験などでも、サンプルを取り直して論文のテーマに合うか確認し
00:08:3520回ほど繰り返してp値0.05を満たして出版するといった事例があり
00:08:43それは非常に悪い学問的態度であり、pハッキングと呼ばれます。
00:08:48これが同様にバックテストにも適用されるのです。
00:08:51統計的なパターンが全く存在しない、ランダムな株価データを使って
00:08:58コイン投げのように動く銘柄でも、学習データから収益の良いものを探し出し
00:09:06これを繰り返せば、検証データでも偶然収益が良く見えるものがいくつか出てきてしまうのです。
00:09:13第1部で過学習についてお話しした通り、学習データで収益を最適化して
00:09:20検証データで回したり、ペーパートレードを行ったりしても
00:09:23バックテストを過度に行いすぎると
00:09:29実質的な未来予測力も有意なパターンもなく
00:09:34何の役にも立たない過去のパターンを拾っただけなのに
00:09:39検証データまで収益が良く出るケースが偶然現れる可能性があります。
00:09:44そのため、7番目の「非クオンツ的な言語で戦略を説明する」ことが重要になります。
00:09:51なぜ非クオンツ的な言葉で説明することが重要なのか。
00:09:54まずはデータ数の重要性について見ていきましょう。
00:09:58「シンプルなモデル」と「柔軟なモデル」があると仮定します。
00:10:02この図で、青い線は非常に柔軟性の高いモデルで
00:10:06黒い線は非常にシンプルなモデルです。
00:10:09モデルが柔軟であるほど、与えられたサンプルには完璧に誤差なく合わせることができます。
00:10:15しかし、実際の分布が別にある場合、新しいデータが入ってくると
00:10:21この柔軟な青い線は大きな間違いを犯すことになります。
00:10:23これについては第1部でも話しましたが、データが非常に膨大な場合
00:10:28数千、数万とあれば。昔はデータの収集が非常に困難でした。
00:10:32そのため、小さなサンプルから巨大な母集団の分布を推定したり予測したりしていました。
00:10:39最近は分野によりますが、母集団そのものを測定したり、テラバイト級のデータを集めたりできるため
00:10:50それほどデータが多い場合には、柔軟なモデルを使ってもこれほど過学習は起きません。
00:10:57実際、この青い線をこれほど多くのデータに適用してみると、多少うねりはあっても
00:11:04概ねフィッティングされ、新しい検証データが入ってきても
00:11:09誤差はそれほど大きくならないでしょう。しかし、トレードの文脈で見ると
00:11:15秒・分単位から日・月・年単位へ行くほど、データ数は少なくなります。
00:11:20結局、財務諸表などを用いるクオンツ投資では、データ数が少なくなります。
00:11:28これは第1部の繰り返しになりますが、ではデータが少ない時にどう過学習を避けるべきか。
00:11:35その場合は、モデルの柔軟性に制限を設けることでオーバーフィッティングを防げます。
00:11:41「構造を強制する(imposing a structure)」、あるいは
00:11:45「正則化(regularization)」という手法で、柔軟性を制限して過学習を緩和します。
00:11:53フィッティングの際にモデルを制限したり、正則化を使ったりするのも一つの手ですが
00:11:59バックテストに関してもう一つの方法は、経済学的、あるいはトレーダーとしての
00:12:09常識的に意味のある戦略だけを実装・テストすることで、過学習を制限する効果が得られます。
00:12:15ランダムなデータであちこちテストして
00:12:19何の意味もなく数万回のバックテストを繰り返していると
00:12:23このように偶然きれいに並んだパターンを見つけてしまいます。
00:12:29「PERがダメならPBRだ」と、むやみにパラメータを変えて
00:12:33闇雲にバックテストを回し続けるのではなく
00:12:39投資家やトレーダーとして市場を観察し
00:12:43経済学的に意味のある投資アイデアやトレードアイデア
00:12:47それを絞り込んでテストすることで、無意味なランダムパターンを拾い
00:12:53検証データまで偶然良く見えてしまうリスクを回避できるのです。
00:12:59「ビッグデータ」や「パターン認識」といった大げさな言葉ではなく
00:13:03日常的な言葉で、自分の戦略がなぜ経済学的に指数を上回る収益を出せるのか
00:13:10それをきちんと説明できないのであれば、単にデータを「拷問(data snooping)」している可能性が高いです。
00:13:16データスヌーピングとは、望む結果が出るまで
00:13:23ひたすらデータを回し続けることを意味しますが
00:13:28私はこれが非常に重要だと考えています。
00:13:31もちろん例外はあります。例えばディープラーニングを使う場合です。
00:13:35正則化やドロップアウトなどの技術を駆使し
00:13:40専門家が適切に最適化してAI投資モデルを作る場合などは別です。
00:13:49ディープラーニングで各重みがどう選ばれたかを経済学的に説明するのは困難です。
00:13:56実際に韓国でも優れたクオンツの方々がこうした戦略を研究されていますが
00:14:04そうしたものは厳密に科学的なアプローチがなされています。
00:14:08そうしたことを感じ取れるかと思いますが
00:14:10今ここでお話ししているのは、一般的な個人投資家がバックテストツールを利用する場合のことです
00:14:17データスヌーピングを避けたいなら、データから始めて無理やり結果を絞り出そうとせず
00:14:24投資アイデアやトレードの着想、経済的な論理からスタートしてバックテストに進むべきだということです
00:14:31私がこうしてお話ししている内容は、主に投資初心者の方々に向けたものなので
00:14:40強化学習でパラメータを決めたりディープラーニングを使ったりする専門家の方は、ご自身の判断で進めてください
00:14:47次に8番目、これも非常に重要ですが
00:14:50自分自身を、本当にあらゆる角度から疑ってみる必要があります
00:14:53ここで言う「自分」とは、自分の作った戦略のことです
00:14:56バックテストを行い、学習データ以外の
00:15:01検証データもパスし、フォワードテスト(ペーパートレーディング)も通ったとしましょう
00:15:06そうした検証段階を経て生き残った戦略は、「収益性が高いと証明された戦略」ではなく
00:15:12「収益性が低いとはまだ証明されていない戦略」に過ぎません
00:15:15言葉遊びのように聞こえるかもしれませんが、この微妙な態度の差が大きな違いを生みます
00:15:21バックテストを通ったからといって盲信するのではなく
00:15:24「まだダメだとは証明されていないだけだ」と考えるべきなのです
00:15:29では、どのような多角的な視点で疑うべきでしょうか
00:15:31まず、結果が良すぎる場合は、おそらくそれは「本物」ではありません
00:15:35例えば、HFT(高頻度売買)ではない
00:15:37単一の戦略でシャープレシオが2を超えたら、少し疑うべきですし
00:15:423以上というのは、ほぼ不可能だと考えたほうがいいでしょう
00:15:44シャープレシオが1前後の複数の戦略を分散させたポートフォリオを組み
00:15:49長期にわたって3以上を維持できれば、それはもう伝説級です
00:15:54「マーケットの魔術師」シリーズに載るレベルと言えます
00:15:56ですから、こうした数値には注意が必要です
00:15:59高頻度売買(HFT)の場合は少し事情が異なります
00:16:02取引頻度が非常に高いため、シャープレシオが3や4になることもありますが
00:16:06HFTの場合はその代わりに
00:16:09莫大なインフラ費用が固定費としてかかるため、文脈が少し違います
00:16:14一般的にクオンツ運用やバックテストを個人でされる方の場合は
00:16:17シャープレシオが2を超えたら、まず疑ってみてください
00:16:20ルックアヘッド・バイアス(先読み偏向)があるのではないか
00:16:22あるいは、過剰適合(オーバーフィッティング)をしていないか
00:16:24バックテストを何度もやりすぎて
00:16:26p値ハッキング(偶然を必然に見せる操作)が起きていないか
00:16:28といった部分を疑う必要があります
00:16:30そして、バックテストを通過した戦略があったとしても
00:16:32継続的にあらゆる側面から細かくチェックし続けなければなりません
00:16:34例えば、コストに関する仮定を調整してみるなどです
00:16:39単純な売買手数料だけでなく
00:16:42出来高や流動性に関する仮定をより厳しく設定して
00:16:46スリッページコストを少し上乗せしてみたり
00:16:48あるいは、戦略のパラメータを変化させてみて
00:16:51パラメータを少し動かしたとしても
00:16:54依然として収益性が高く安定しているか
00:16:56その点を確認する必要があります
00:16:58例えば、PER(株価収益率)に関する戦略だとしましょう
00:17:01結果が次のどちらのケースに当てはまるかを見てください
00:17:04バックテストでPER14が最適だという結果が出た時
00:17:0813.5、14、15、16と値を振ってみて
00:17:13収益がその周辺で少し変化する程度で
00:17:15安定したパラメータの傾向(ロバスト性)を示しているか
00:17:19あるいは、PER14の時は素晴らしい結果だったのに
00:17:2413に減らした途端にガクンと落ち
00:17:2612の時にはマイナスになってしまうといった
00:17:28不安定な
00:17:31パラメータ値が出るのかを確認します
00:17:32後者の場合は、ほとんどが
00:17:34過剰適合である確率が高いです
00:17:36次に、売買のタイミングを少しずつ変えてみてください
00:17:39例えば
00:17:40時間単位で売買するような戦略であれば
00:17:43エントリーや決済の時間を5分、10分とずらしてみたり
00:17:46月単位でリバランスするクオンツ投資戦略であれば
00:17:50通常、月初や月末にリバランスを行いますよね
00:17:54その特定の日に行うと仮定してテストをするわけですが
00:17:56その日の代わりに28日にしたり、月初なら3日や4日にしたりして
00:18:01数日タイミングをずらしてみても
00:18:04収益率がほぼ同じように安定して出るかを見ます
00:18:08月次のリバランスであれば、本来
00:18:11前日にやろうが翌日にやろうが、1〜2日の差で大きな違いは出ないはずです
00:18:14しかし、このように1〜2日変えただけで
00:18:16年利15%だったものが7%にまで落ち込むなら
00:18:20その戦略には問題があるということです
00:18:22その他にも、様々な仮定を追加してみることです
00:18:24外生的イベントの影響や、期間を少し変えてみるなど
00:18:28ただ、外生的イベントなどは実際
00:18:30ご自身のシミュレーションやバックテストの
00:18:34ツールでは再現が難しい場合もあります
00:18:36他にも、統計的なノイズを少し加えてみたりします
00:18:39こうした手法は統計学では一般的に
00:18:42「ブートストラップ法(Bootstrapping)」と呼ばれますが
00:18:44株式市場の変数を、その分布の範囲内で
00:18:48わずかにランダムに変化させてみるのです
00:18:50それでも結果が安定して出るかを確認します
00:18:54とにかく、こうして最大限あらゆる角度から徹底的に検証し
00:18:57その後、一般的には
00:19:00検証データやペーパートレーディングで確認を行った上で
00:19:03ようやく実戦に投入するようにしてください
00:19:06それがお伝えしたいことです
00:19:07また、先ほども少し触れましたが
00:19:10ベンチマークを正しく設定する必要があります
00:19:12実際、あるケースでは
00:19:14「半年間で30%の利益を出した」と
00:19:17自分のクオンツ戦略を自慢していた方がいました
00:19:20ですが、その戦略は買い(ロング)戦略だったのですが
00:19:22昨年、同時期の韓国総合株価指数(KOSPI)は40%上昇していたのです
00:19:25このように、ベンチマークを設定する際も
00:19:28自分の戦略に適したベンチマークを選ぶ必要があります
00:19:31例えば、テック株を中心に戦略を組んだのであれば
00:19:36ナスダックと比較すべきであって
00:19:38S&P500やラッセル指数などと比較してはいけません
00:19:41戦略の収益率に関して言えば
00:19:43例えば、同じ6年間という期間でも
00:19:462011年から17年までに13%出した戦略と
00:19:492015年から21年までに17%出した戦略、どちらが優れているでしょうか
00:19:53普通は17%の方が良いと思うでしょうが
00:19:56その期間に、その戦略のベンチマークがどう動いたかによって
00:20:00どちらが良いかは変わってきます
00:20:02絶好調な相場で17%しか出せなかったのと
00:20:06マイナス成長だったある国の市場で
00:20:0813%の利益を出した戦略では、価値が全く異なりますから
00:20:11しかし、こうしたベンチマークとの比較をせずに
00:20:14自分の絶対的な収益率の数値だけを
00:20:16重視する方々が意外と多いのです
00:20:19ですから、常にベンチマークに対して
00:20:20相対的に自分の戦略を評価しなければなりません
00:20:23では、自分の戦略のベンチマークを設定する際
00:20:25どのような要素を考慮すべきでしょうか
00:20:27ボラティリティ・リスク、あるいはバリュー株かグロース株か
00:20:30これらに関連するインデックスはそれぞれ別に存在します
00:20:33例えば、ご自身の戦略が
00:20:35ハイテク成長株だけに範囲を絞って
00:20:38その中から銘柄を選ぶクオンツ戦略であれば
00:20:41ハイテク成長株関連の指数を基準に
00:20:45ベンチマークとして比較すべきです
00:20:48次に、オプションを使用する場合です
00:20:50現物株を買うポートフォリオですが
00:20:52オプションでヘッジをかけているとします
00:20:53このようにオプションを使っているのに
00:20:54それをS&P500指数と比較していいかというと
00:20:56ダメです
00:20:57絶対にダメです
00:20:58これはオプションヘッジされた適切なベンチマークと
00:21:00比較して、戦略を評価しなければなりません
00:21:03また、買い(ロング)だけなのか
00:21:05あるいは買いと空売り
00:21:06両方を行うロング・ショート戦略なのか
00:21:08空売りも行う戦略なのに
00:21:10買いだけの指数を使ってはいけません
00:21:13このように
00:21:14自分の戦略にふさわしいベンチマークを設定し
00:21:17そのベンチマークの収益率と比較して
00:21:19自分の戦略のパフォーマンスを評価すべきだという点です
00:21:22実は非常に基本的なことなのですが
00:21:24あまりにも多くの投資初心者の方々が
00:21:27ここを素通りしてしまい
00:21:28ただ絶対的な収益率だけを見てしまいます
00:21:30そして最後になりますが
00:21:31戦略を分散させること
00:21:33どれほど、どれほど心血を注いで
00:21:35バックテストを慎重に行い
00:21:37科学的に厳密に作り上げたとしても
00:21:39実際の収益率は(テストとは)異なって現れます
00:21:41ですから、戦略を分散投資すれば
00:21:43収益率を下げずに
00:21:45リスクを軽減する効果
00:21:47いわゆる分散効果を享受することができます
00:21:49もちろんケースバイケースではありますが
00:21:51全体として、シャープレシオの観点からは
00:21:54間違いなく分散投資をするのが得策です
00:21:56この観点で見ると
00:21:58既に保有している戦略と似たような戦略は
00:22:01追加する価値がさほどないという意味にもなります
00:22:03例えば、自分のポートフォリオの中に
00:22:05特定の財務諸表データを使った
00:22:07戦略があるとします
00:22:08それと似たような内容で
00:22:10少しだけ条件を変えて
00:22:11バックテストを行い
00:22:12それを組み込もうとするのは
00:22:14あまり意味がありません
00:22:16そうお伝えしたいです
00:22:17以上、クオンツ投資
00:22:18クオンツ売買で注意すべき
00:22:2010のポイントです
00:22:21データを疑うこと
00:22:22未来を先取りして見ないこと
00:22:23過剰適合を避けること
00:22:25検証のチャンスは一度きりだということ
00:22:27時代は変わるということ
00:22:28マーケット・レジームの変化
00:22:29そしてクオンツであっても
00:22:30自分を律する必要があるということ
00:22:31過度に、何の
00:22:33投資アイデアもないまま
00:22:34ただバックテストだけを
00:22:35ひたすら回し続けてはいけないということ
00:22:36そうした観点から
00:22:38非クオンツ的な言葉で
00:22:39戦略を説明できなければならないということ
00:22:40もちろん例外はあります
00:22:42ディープラーニングや
00:22:43強化学習といった分野では例外もありますが
00:22:44次に、バックテストを通過しても
00:22:46本当に多角的な視点から疑い
00:22:48少しずつ環境条件を調整しながら
00:22:50パラメータによる収益が安定しているか
00:22:52その点を確認すること
00:22:54そしてベンチマークを正しく設定すること
00:22:56次に、戦略を分散すること
00:22:58ですので、この10点さえ肝に銘じておけば
00:23:00間違ったバックテストによって
00:23:02クオンツ投資やクオンツトレードをしながら
00:23:04時間を無駄にしたり
00:23:06また、こうした誤ったバックテストから生じる損失は
00:23:09避けることができます
00:23:10そうお伝えしたいです
00:23:11ただ、誤ったバックテストによる損失を避けるだけであって
00:23:14正しいバックテストをしたからといって
00:23:16収益が保証されるわけではありません
00:23:18しかし、少なくともバックテストのミスによる損失は防げます
00:23:22では、まとめとして
00:23:23クオンツの長所と限界について少しお話しします
00:23:26動画の冒頭でも強調したように
00:23:28クオンツ投資が悪いというわけではなく
00:23:30計量化された思考を持つことは、投資家として非常に望ましいです
00:23:34しかし、過大広告に惑わされて
00:23:36生半可なバックテストをすることは、むしろ毒になり
00:23:38時間やお金を失うだけでなく
00:23:40「自分は科学的に投資している」という
00:23:42間違った幻想を抱いて
00:23:44過度なリスクを取ってしまう可能性があります
00:23:46実際に損失を出した事例を見て、本当に心苦しく思います
00:23:50問題なのは
00:23:52ずさんなバックテストを行い
00:23:54統計的に無意味な行動ばかりに基づいて
00:23:56戦略を立てたとしても
00:23:58株式市場のランダム性のせいで
00:24:00そんな適当なテストでも利益が出てしまう場合があることです
00:24:03バックテストを間違えたからといって
00:24:05必ずしもテスト結果より
00:24:07悪い結果が出るとは限りません
00:24:09テスト結果と実戦での収益に
00:24:11大きな乖離が生じるという意味なのです
00:24:13その誤差は上振れすることもあれば
00:24:15下振れすることもあります
00:24:17ただ、一般的にバックテストは過去のデータで
00:24:19収益率を最大化させるものなので
00:24:21普通、誤差が出れば下方へ
00:24:23つまり、より悪い結果として現れるのですが
00:24:26統計的に何の意味もないバックテストをした場合
00:24:30つまり、完全に運任せだったり
00:24:32単に実戦に投入した時の
00:24:35市場環境が非常に良くて
00:24:37テスト通りの利益が出たり
00:24:39あるいはそれ以上の利益が出ることもあります
00:24:41これが一歩間違えると
00:24:43「ビギナーズラック」になってしまうのです
00:24:45これはクオンツ投資に限らず
00:24:47カジノや裁量トレード、チャート分析など
00:24:50お金を賭けるような
00:24:53確率論的な世界でよく起こることですが
00:24:56人は最初にお金を手にすると
00:24:59自信を持ってさらにお金を注ぎ込み
00:25:01借金までしてしまい
00:25:02結果としてさらに大きな損失を招くケースがあります
00:25:05ですので、こうした部分には注意が必要です
00:25:07繰り返しますが
00:25:08バックテストで収益性が高いと
00:25:11証明されるわけではありません
00:25:12何度も検証してみた結果
00:25:14「特に収益性が悪いとは証明されなかった」
00:25:17そのような状態の戦略が
00:25:19実戦に投入されるのであって
00:25:21利益が保証されたり
00:25:22有望だと証明されたわけではないのです
00:25:24そのことを改めて強調しておきます
00:25:27それから、実際にある
00:25:29少し批判的な方々が
00:25:31私に言ってくることなのですが
00:25:32「こいつはいつも
00:25:34何でも難しいとばかり言う」と
00:25:36「バリュー投資も難しい」
00:25:37「チャート分析も難しい」
00:25:38「インデックス投資も右肩上がりが
00:25:40必ずしも絶対ではない」
00:25:41「クオンツ投資までもが難しいと言うなら」
00:25:44「一体何をしろと言うんだ?」と
00:25:46こんな話も耳にしました
00:25:47「金融業界にいるからといって
00:25:49プロぶっているのか?」
00:25:51「素人はインデックス投資でもしてろと
00:25:53バカにしているのか?」と
00:25:54しかし、そうではありません
00:25:55そもそも他人より稼ぐこと自体、難しいことなのです
00:26:00正直なところ、このように
00:26:01間違ったクオンツ投資をする人が
00:26:03多ければ多いほど、私には利益になります
00:26:05そういう方々が市場の非効率性を生み出し
00:26:08そういう方々がいてこそ
00:26:10誰かが超過収益を得られるからです
00:26:12あえて「間違った方法でやっていますよ」と
00:26:14教えてあげる義理はないわけです
00:26:15ですから、私がこれらすべてを「難しい」と言うのは
00:26:18「皆さんはやめておきなさい」とか
00:26:20「専門家でなければインデックス投資でもしてろ」と
00:26:23言っているのではなく
00:26:24他人より多く稼ぐのは元々難しいことなので
00:26:28より多く稼ぎたいのであれば
00:26:30正しい方法で努力をし
00:26:32勉強して実力をつけ
00:26:34経験を積んで
00:26:35そういう方向性を持って
00:26:36バリュー投資であれ
00:26:37クオンツ投資であれ
00:26:39あるいはインデックス投資であれ、取り組んでください
00:26:41という意味なのです
00:26:42しかし、こうした常識的な話が
00:26:44なぜなかなか通じないのでしょうか
00:26:45「〇〇を使えば簡単に稼げる」
00:26:48「簡単に年利20%出せる」
00:26:50というような話は、実は
00:26:5110年前、20年前、30年前
00:26:53100年前からずっとあったはずです
00:26:55毎回こうした噂が広まり
00:26:57新しい投資手法が登場すれば
00:26:59そこでもまた同じような話が出て
00:27:01また新しい金融商品が出れば
00:27:03そこでもまた繰り返されます
00:27:05それなのに、なぜ毎回このように
00:27:06被害者が繰り返し
00:27:08歴史が繰り返されるように現れるのでしょうか
00:27:10私の考えでは
00:27:12間違った方法を通じても
00:27:14実際に成功してしまうケースが
00:27:16出てくるからだと思います
00:27:18カジノでも大金を手にする人はいます
00:27:20また、ずさんなバックテストでも
00:27:21稼ぐ人が実際に存在します
00:27:24そのため、根底にある実質的な分布が
00:27:26隠されてしまうのです
00:27:27つまり、世の中や人生には
00:27:29ある種のランダム性が存在するため
00:27:31その変動性が実際には
00:27:33平均値を覆い隠してしまうのです
00:27:35そこで、このような図を考えてみました
00:27:37その人が将来お金を稼げるかどうかは
00:27:41確定的なものではなく
00:27:43確率的なものだと考えています
00:27:45今、X軸がどれだけ金持ちになるか
00:27:48つまり右に行くほど富を築ける
00:27:50そう考えてみましょう
00:27:51すると、例えば公務員の方や
00:27:54定年退職が保障されている方
00:27:56あるいは誠実に生きて貯金をする方
00:27:58そうした方々がこれくらいの富を築くと
00:28:01仮定してみると
00:28:02こうした方々は安定的に預金などで運用し
00:28:05非常に慎重に行動されるので
00:28:07富の変動性はそれほど高くありません
00:28:09多少の支出があったり
00:28:11預金利息を受け取ったりしても
00:28:13その周辺で動くだけです
00:28:15しかし、ここで株式投資を始めると
00:28:17人生における変動性が増します
00:28:20株で損をすることもあれば
00:28:22利益を得ることもありますし
00:28:24金融危機が起きて
00:28:26ガクンと下がることもあるでしょう
00:28:27ただ、この図で少し違うのは
00:28:29単に直線で描かれていますが
00:28:31このようにリスクテイクを増やすと
00:28:34つまり株式投資をすれば
00:28:35変動性が増える代わりに
00:28:37期待値は少し右へと移動します
00:28:39実際にはこのようになります
00:28:42安定した人生よりも
00:28:43リスクを取る代わりに
00:28:45その報酬として
00:28:46平均的には右側(プラス)へ行くようになっています
00:28:48そう考えてください
00:28:50そして、より極端な人生を追求する人は
00:28:54先物、派生商品、仮想通貨などをすると
00:28:57黄色い線のように変動性が大きくなります
00:28:59また、同じ株式投資をする人でも
00:29:02さらに実力をつければ
00:29:04こちら側の確率分布を持つことができ
00:29:06さらに磨けば、もっと右へ行けるかもしれません
00:29:08しかし、間違った方法で投資をする人々
00:29:10カジノでギャンブルをしたり
00:29:12投機に走ったり
00:29:14あるいは違法な投資勧誘や相場操縦をするグループに入ったり
00:29:18今日お話ししたような誤ったバックテストをしたり
00:29:21噂話だけを信じて一点買いをしたりする場合
00:29:23これも本来はもっと変動性を大きく描くべきですが
00:29:26要旨としては、期待値は左側へと移動します
00:29:29ですが問題なのは
00:29:31そういうことをしている人たちの中でも
00:29:33あくまでこれは確率的な分布なので
00:29:351,000人、1万人に1人は
00:29:38大成功を収めることがあり得るのです
00:29:40カジノでジャックポットを当てたり
00:29:43仮想通貨の一点買いで大儲けしたり
00:29:45こうした人が数万人に1人は必ず出てくるものです
00:29:48しかし、こうした事例を「生存者バイアス」だと捉え
00:29:51確率分布においてこうしたケースも
00:29:551万人に1人は起こり得ると理解できず
00:29:57そうしたマインドを持てないまま
00:29:59周りに流されて、せっかく誠実に生きていたのに
00:30:03そうなると、高い確率で資産は減っていくことになります
00:30:07もちろん、細かく言えば分布をもっと右に寄せるべきだとか
00:30:11あるいは、もっと平坦な形にすべきだといった
00:30:13議論はあるかと思いますが、それはさておき
00:30:15私が今お伝えしたいのは
00:30:17資産形成や財テク、あるいは株式市場というものは
00:30:20確定的な決定論の世界ではなく
00:30:25このように分布によって成り立つ、確率的な世界だということです
00:30:28たとえ正しく適切な方法で株式投資を行っても
00:30:31相場が悪かったり、不運なイベントが重なったりして
00:30:35結果が下振れすることもありますし
00:30:37カジノのような間違ったギャンブルをしても
00:30:39本当にたまたま、その人が行った時に
00:30:41誰かしらには当たりが出るようになっているので
00:30:43ジャックポットを当てる可能性もあるわけです
00:30:45このように、世界は「確率的優位のない行動」をしたからといって
00:30:49すぐに結果が固定されてしまうものではなく
00:30:51確率的な分布の中で生きていくことになるので
00:30:55間違った行動をしても成功する場合もあれば
00:30:57正しく生きようとしても失敗する場合もある、そういうものなのです
00:30:59そういうことなのです
00:31:00しかし、こうした行動を繰り返していけば、結局のところ
00:31:03正しい人はこちら側に収束し
00:31:04間違った人はあちら側に収束していくことになります
00:31:06その考えを持ってさえいれば
00:31:08極端な例の人が騒いでいたり
00:31:10あるいは、そういった類の話に誘惑されたとしても
00:31:13自分を保つ助けになるのではないかと思い
00:31:16この図を準備してみました
00:31:19では、クオンツの話に戻りますが
00:31:21クオンツの限界は、実のところ過去のデータに依存している点です
00:31:25過去のパターンが繰り返されるという仮定の下で行うバックテストなので
00:31:29そこがクオンツの限界であり
00:31:31第1部で申し上げた「マーケット・レジーム」
00:31:33つまりコロナ禍のようなイベントが発生した際
00:31:35市場の体制や性質そのものが変わってしまい
00:31:38過去のパターンが全く通用しなくなるのです
00:31:41実際、昨年のコロナ発生後のデータを見ると
00:31:43これが米国の一般的なミューチュアル・ファンドの収益率
00:31:46これが一般的なヘッジファンドの収益率
00:31:48そしてこれがクオンツのミューチュアル・ファンド
00:31:50さらにこれがクオンツのヘッジファンド
00:31:52そしてラッセル指数となっていますが
00:31:54クオンツの方が明らかにアンダーパフォームしていますよね
00:31:57また、ファクターの中でもモメンタム以外は
00:32:00(これは夜間の米国株式市場ですが)
00:32:02他のファクターはすべて市場全体を下回る結果となりました
00:32:06こうしたファクター投資の他にも
00:32:08アルファを探そうとする試みにおいて
00:32:10最近は「オルタナティブ・データ」などが話題になっていますが
00:32:14実は、この分野もクオンツたちのデータ費用が莫大になっており
00:32:18真のアルファを見つけるためのコストは、ますます増加しています
00:32:22まるで冷戦時代の軍拡競争のように
00:32:24本当に斬新なアイデアや
00:32:26まだ発見されていない、収益性の高い
00:32:28超過収益をもたらし続けるパターンを
00:32:30見つけるのはどんどん困難になっていますが
00:32:32それを探すためのコストは膨れ上がっているのです
00:32:34投入コストに対する限界超過収益は減少しており
00:32:38クオンツヘッジファンドなどにいる知人に話を聞くと
00:32:42以前は、超過収益を生む非常に優れた戦略を
00:32:46徹底的なリサーチによって発見すれば
00:32:48例えば、1年くらいはその効果が持続したそうです
00:32:52それから徐々に収益性が悪化し
00:32:54調整が必要になるといった流れでしたが
00:32:56今ではその期間が4か月から6か月に短縮されたと言っていました
00:33:00なぜなら、クオンツ同士の競争が激化しており
00:33:04さらに、クオンツが転職を繰り返すことで
00:33:06戦略が平準化されてしまったり
00:33:08また、Quantopian(クアントピアン)は閉鎖されましたが
00:33:11他にもバックテスト用のプラットフォームが数多く存在します
00:33:14今や数十種類はあるかと思いますが
00:33:16個人投資家も参入してきたことで
00:33:18市場で独占的なアルファを掴み
00:33:22圧倒的な超過収益を出すことが難しくなっています
00:33:25このように、レッドオーシャン化しているわけです
00:33:27その点、クオンツと対比される「人間の判断」の
00:33:30長所は、少ないデータからでも推論が可能だということです
00:33:34例えばコロナ禍などは
00:33:35まさに唯一無二のイベントと言えます
00:33:38過去にコロナのような
00:33:40パンデミックが起きたケースは非常に少ないため
00:33:43過去のデータからパターンを見つけるのは不可能です
00:33:46しかし、そのような一度きりのケースであっても
00:33:49人間は1920年代のスペイン風邪を分析したり
00:33:53あるいは様々な人生の知恵をもとに
00:33:56合理的な推論をすることが可能です
00:33:58そのため、株式市場において
00:34:00計量化、クオンツ化が進む傾向を見てみると
00:34:03データ数が分・秒単位で非常に膨大かつ詳細な
00:34:07「高頻度取引(HFT)」から自動化が始まり
00:34:09短期売買を行うトレーダーは次第に追い込まれ、姿を消しています
00:34:13その一方で、まだ年単位のデータ数が少ない
00:34:16長期投資の分野では、依然として人間が推論する余地が大きく
00:34:21ヘッジファンドも、長期投資を行う側は
00:34:24最近は「クオンタメンタル」なども導入していますが
00:34:26やはりファンドマネージャーによる裁量的な判断が大きな割合を占めます
00:34:31そういった側面があります
00:34:32歴史の流れがクオンツの側にあるのは間違いなく
00:34:35今後ますます計量化が進んでいくでしょうが
00:34:38「汎用人工知能」、つまり学習したタスク以外の
00:34:42新しい問題に直面した時
00:34:44他のタスクでの経験などを
00:34:47推論に用いて新しい課題をこなせるような
00:34:49人工知能が登場するには、少なくとも数十年はかかります
00:34:52ワンショット学習やメタ学習の研究は進んでいますが
00:34:55私はいまだ遠い未来の話だと考えているので
00:34:58株式市場においても、人間を完全に代替することはまだできません
00:35:02そう考えています
00:35:03しかし、それでもやはり歴史の流れは
00:35:06計量化、クオンツ化へと向かっていることは否定できません
00:35:09マーケット・レジームやパラダイムの変化に弱い面があるとはいえ
00:35:12何の原則も復習もなく、その場の雰囲気で売買したり
00:35:15感情に振り回される人間よりは、はるかに優れたパフォーマンスを出します
00:35:19ですから、本気でトレーダーを職業として成功させたいのであれば
00:35:23私が見るに、およそ3つの方法があります
00:35:261つ目は、個人の判断でトレードをする場合
00:35:29様々な計量的分析やセンチメント・モデルなどの
00:35:33補助をある程度受けながら
00:35:36ニュースや市況分析、あるいはシナリオ分析といった
00:35:39クオンツアルゴリズムが苦手とする
00:35:41新しいイベントに対する分析やリサーチを加え
00:35:43それらを統合して判断することです
00:35:45あまりに頻繁な高頻度取引ではなく
00:35:48デイトレードからスイングトレードの間くらいに
00:35:51腰を据えて売買を行うトレーダーです
00:35:54私は個人売買において、こうした道を歩んでいます
00:35:57例えば、オプションの売買データをすべて処理し
00:36:00そこに機械学習を適用して
00:36:03シグナルをある程度算出させます
00:36:05また、ニュースデータをすべてスクレイピングして
00:36:07センチメント・モデルを学習させ
00:36:09そのシグナルを確認したりします
00:36:11それらを使って自動売買をするのではなく
00:36:13自分の判断において、それらの要素を参考にしつつ
00:36:16現在の市況やFRBの動向など
00:36:19様々な情報を総合的に加味して
00:36:21最終的な売買判断を下すという
00:36:23形式が1つあります
00:36:242つ目は、理系を専攻している
00:36:26学生の方などであれば
00:36:28もし機関投資家でクオンツをしたいなら
00:36:31本格的に理系の博士課程で学び
00:36:34機関投資家の専門クオンツになる道もあります
00:36:363つ目は、現在クオンツ売買をされている方のうち
00:36:39機関投資家が手を出さない「ニッチ」な領域があります
00:36:42そこを攻略する個人クオンツとして売買を行うか
00:36:46おおよそこの3つの方法があるのではないかと思います
00:36:49機関が手を出さないニッチの例としては
00:36:52運用キャパシティが数億円未満の戦略です
00:36:55こうした戦略に機関投資家はリソースを割きません
00:36:58この「キャパシティ」とは、投入資金を増やせば増やすほど
00:37:01どれくらい収益率が低下するかという指標で
00:37:03取引コストやスリッページなどの要因もあれば
00:37:05流動性の問題などもあります
00:37:07そういった部分なのですが
00:37:08だいたい5億円から10億円あたりが境界線ではないか
00:37:11そう考えています
00:37:12言い換えれば、その程度の規模でキャパシティが限界に達する
00:37:15戦略には、機関投資家は手を出しません
00:37:18そこに労力を注いでも、得られる利益が少ないからです
00:37:21しかし、個人の立場からすれば、5億から10億まで
00:37:24資金を増やしても収益率が落ちないのであれば
00:37:27実のところ、それで十分ですよね
00:37:29ですから、そうしたニッチな領域をうまく見つけ
00:37:31市場の歪み(非効率性)を探し出し
00:37:33利益を出していけばよいのです
00:37:34では、どうすれば正しく勉強できるでしょうか
00:37:38クオンツ売買やアルゴリズム売買に関連して
00:37:40どのようなカリキュラムを組むべきか
00:37:42概略をお話ししますと
00:37:44実際には多様なルートがありますが
00:37:45大まかにまとめてみましょう
00:37:47まず、コーディングは絶対に学ぶべきだと思います
00:37:50コードが書けずにExcelを使っているクオンツは、もはやクオンツではありません
00:37:53いくらExcelに関数が豊富だとしても
00:37:56根本的に制限の多いツールであり
00:37:59扱えるデータ数も、少し多くなれば
00:38:01Excelはフリーズしてしまいます
00:38:02最低限、Pythonくらいは勉強する必要があります
00:38:05誰もが手軽にバックテストを回せるような
00:38:08財務諸表の指標やテクニカル指標を使い
00:38:11既に出尽くしたような戦略に
00:38:14しがみついて過剰最適化(オーバーフィッティング)をするのでなければ
00:38:17自分自身の斬新なアイデアを戦略に落とし込み
00:38:20真のブルーオーシャンやニッチを探し出し
00:38:23超過収益を出そうとするなら、必ずコーディングができなければ
00:38:26そうしたアイデアを柔軟に形にすることはできません
00:38:29そうお伝えしたいです
00:38:30次に、当然のことながら
00:38:31統計の基礎をしっかりと固める必要があります
00:38:33これは本当に最低限ですが、学部レベルの統計学や
00:38:37ベイズ統計学
00:38:38このあたりは、少なくとも1つや2つは
00:38:40授業を受けたりして習得すべきです
00:38:42それから、時系列分析について
00:38:44ARIMA、コインテグレーション、カルマンフィルタといった
00:38:46手法も学びますが
00:38:48全般的に「時系列」というデータを扱う際に
00:38:51どのような点に注意すべきか、どのように処理すべきかといった知識も必要です
00:38:52どのように処理すべきかといった部分です
00:38:55次に、最近は機械学習ですね
00:38:57回帰分析も、厳密に言えば機械学習の一つですし
00:39:00機械学習、マシンラーニングには
00:39:02SVMやランダムフォレスト
00:39:05あるいはアダブーストなど
00:39:07非常に多くのアルゴリズムがあります
00:39:09勉強する時間があればすべて学んでもいいですが
00:39:12個人的には回帰分析
00:39:14LightGBM
00:39:15あるいはXGBoost
00:39:16それからディープラーニング
00:39:17次に非階層学習
00:39:18クラスタリングなどの部分ですね
00:39:20そして自然言語処理
00:39:22加えて強化学習も、最近はトレードに適用する傾向にあります
00:39:26このあたりを勉強すればいいでしょう
00:39:28次に、非常に重要なのが英語です
00:39:30クオンツ関連の韓国語資料は、まだ非常に乏しいのが現状です
00:39:33決して韓国のクオンツがアメリカに比べて劣っている
00:39:37という意味ではありません
00:39:38韓国にも本当に素晴らしいクオンツは大勢います
00:39:40ただ、そうした優秀な方々は皆、英語の資料に精通しているので
00:39:46あえてそれらを韓国語に訳したりはしないんです
00:39:49そのため、大半のクオンツ資料は英語で構成されています
00:39:53韓国語のクオンツ学習資料があるとしても
00:39:58私が見てきた限りでは、非常に基礎的で大衆的なレベルのものばかりです
00:40:03少し深く踏み込むと韓国語資料は乏しいので、英語は必須です
00:40:11そして、クオンツ・ファイナンス関連の論文です
00:40:14クオンツ・ヘッジファンドも論文から多くのアイデアを得てテストしているので
00:40:21こうした論文をたくさん読んでみてください
00:40:24「いつこれらを全部勉強するんだ」と思うかもしれませんが
00:40:28すべて終わらせてから始める必要はありません
00:40:32統計の基礎をしっかり固めた後なら
00:40:352、3番目まではそれほど時間はかからないと思います
00:40:39理系ベースのある方なら既知か、半年ほどで習得できます
00:40:442、3番までできれば、新しい手法を学びながら
00:40:48並行して戦略を立てていっても差し支えありません
00:40:52そうお伝えしておきます
00:40:53実際に私が勉強した資料や講義資料を
00:40:57すべてまとめたものがありますが、厚さはこれくらいになります
00:41:00これは両面印刷なのですが
00:41:02A4で500枚から600枚ほどになるかと思います
00:41:07数学、統計、物理といった理系のベースを
00:41:11学部時代に築いた方なら、半年から1年ほど
00:41:15猛勉強すれば可能でしょう
00:41:18理系ベースがない方は、1年から3年は見積もる必要があります
00:41:23それくらいの期間を考えてカリキュラムを組んで勉強すれば
00:41:28実はこうした知識はクオンツ売買だけでなく
00:41:31データサイエンスや開発など、多方面で非常に役立ちます
00:41:36チャート分析ばかりしていても、他の分野ではあまり潰しが利きませんよね
00:41:41もし投資が上手くいかなければ、費やした時間が無駄になってしまいますが
00:41:46こうした勉強は本質的な実力を高め、キャリア面でも非常に有利です
00:41:52次にバックテストツールについて調べていたところ
00:41:57Redditで見つけたこちらのリンクに
00:42:02アルゴリズムトレード関連のサービスやサイトが載っています
00:42:06昔使っていたものにはQuantopianもありましたし
00:42:10QuantConnectも使いましたが、これも良かったです
00:42:13個人だと月8ドルほどかかりますが、なかなか優秀でした
00:42:18広告ではありませんし、他のツールをすべて試したわけではないので
00:42:23手放しでおすすめするという話ではありませんが
00:42:26国内ではbacktest.krやGenPortといったサービスがあるようです
00:42:32実際に使ったことがないので評価は控えますが
00:42:36国内のツールもどんどん発展していけばいいですね
00:42:39ただ、特定の機能しかテストできない限定的なサイトよりは
00:42:44インフラが整っていて、様々なプログラミング言語をサポートし
00:42:50自分が書いたコードを拡張機能のように繋いでテストできる
00:42:56そのようなサイトをおすすめします
00:42:58なぜなら、そうした柔軟性があってこそ
00:43:00斬新なアイデアを実際に検証し、具現化して
00:43:03超過収益を上げることができるからです
00:43:07本気でクオンツ売買の道を目指すのであれば
00:43:11必ずコーディングを勉強して
00:43:13戦略部分は自分でコーディングし
00:43:15残りのインフラ部分は構築済みのサービスを
00:43:19活用するのが良いのではないかと思います
00:43:22そうお伝えしておきます
00:43:23ただ、サービスがあまりに多すぎて
00:43:26どれが良いとは一概には言えませんが
00:43:29「コーディングも必要だし
00:43:31やることが多すぎる」
00:43:33と思われたかもしれません
00:43:34「どこかに簡単な方法はないか」と
00:43:36考えたりもするでしょう
00:43:37「魔法の公式」のような戦略は直感的で魅力的ですが
00:43:40この20年間、他の分野と同様に
00:43:42金融界も大きく変化し、発展してきました
00:43:45他のどんな分野においても
00:43:4780年代、90年代の技術を今も使っている分野はありません
00:43:50しかし不思議なことに、株式市場では
00:43:5280~90年代の戦略がいまだに個人投資家の間で
00:43:56流行したりしています
00:43:57そうした現象が見受けられますが
00:43:59世の中にそれほど直感的で簡単に稼げる方法はないと思ってください
00:44:03ただ、株式市場の確率と変動性のせいで
00:44:06努力せず安易な方法を使っても
00:44:09儲かる人が出ることもあれば
00:44:10努力しても損をする人が出ることもあります
00:44:13そうした現象は起こり得ますが
00:44:15そうした表面的な姿を見て
00:44:16惑わされないでください
00:44:17現実を直視し
00:44:18先ほどの確率分布
00:44:20それを念頭に置いて
00:44:22自分はどの確率分布を選択するのか
00:44:25険しくても右側へ行く道を選ぶのか
00:44:28あるいは左側の道だけれど
00:44:29変動性を高めることで
00:44:31そこに到達できるか
00:44:32一度ギャンブルをしてみるのか
00:44:34それを選ばなければなりません
00:44:36そうお伝えしておきます
00:44:37最後に、私も「イカゲーム」を
00:44:40最近楽しく観たのですが
00:44:41オ・イルナムおじいさんが
00:44:42最後に言っていた言葉が
00:44:44とても印象に残っています
00:44:45臨終の間際に
00:44:46「金がまったくない者と
00:44:48金がありすぎる者の共通点が
00:44:50何か分かるか」と言い
00:44:51「それは、楽しくないことだ」と
00:44:52おっしゃるんです
00:44:54私は
00:44:55実際の人生において
00:44:56楽しさや幸せは
00:44:57お金が少ない状態から
00:44:59増えていく過程にあるものであって
00:45:01そうした過程をすべて飛び越えて
00:45:03金持ちになることは
00:45:04あまり意味がないと思うんです
00:45:06そうした道は、実は
00:45:08楽しくて幸せな
00:45:09記憶や
00:45:10経験を
00:45:11すべて省略してしまったのと同じです
00:45:13私も昔、ゲームが
00:45:14大好きでしたし
00:45:15中学生の頃は
00:45:17本当にゲームに狂っていました
00:45:18高校生になってもそうでしたが
00:45:20一人用ゲームが
00:45:21いつから面白くなくなったかというと
00:45:23チートを使い始めた時からです
00:45:26スタークラフトで
00:45:27「Show me the money」と打てば
00:45:28一瞬で金持ちになり
00:45:29簡単に勝てますよね
00:45:30ですが、勝つために
00:45:32ただチートを使うことは
00:45:33ゲーム本来の目的である
00:45:35困難を乗り越える過程の
00:45:37楽しさを、実は
00:45:38すべて捨ててしまい
00:45:39ゲームを退屈にするのと同じです
00:45:41私たちの人生も
00:45:43現実が辛かったりすると
00:45:44「金があればいいのに」
00:45:46と考えますし
00:45:47実際にお金が増えれば
00:45:49幸せにもなります
00:45:50ですが、お金そのもの
00:45:51結果そのものによる
00:45:53幸せは
00:45:54すぐに倦怠感へと変わるだけで
00:45:56その過程こそが
00:45:57真の幸福の核心なのです
00:45:59そんな、ありきたりな話を添えて
00:46:01今日の動画を終えたいと思います
00:46:03それでは
00:46:04また別の動画でお会いしましょう
00:46:06ありがとうございました

Key Takeaway

クオンツ投資の本質は単なる過去データの最適化ではなく、統計的な過ちや錯覚を自制し、論理的根拠に基づいた検証と徹底的な自己疑念を通じて確率的優位性を探求することにあります。

Highlights

バックテストの回数が増えるほど「過学習(オーバーフィッティング)」のリスクが高まり、実運用での収益性が低下する数学的・実証的事実の提示

統計的な有意性を歪める「p値ハッキング」の危険性と、ランダムなデータから偶然に良好なパターンを見つけてしまう錯覚への警告

戦略を構築する際はデータから入るのではなく、経済学的・論理的に説明可能な「非クオンツ的言語」での裏付けが不可欠であるという主張

バックテストを通過した戦略は「収益性が証明された」のではなく「まだダメだと証明されていない」に過ぎないという謙虚な姿勢の重要性

シャープレシオが2や3を超える異常な数値、またはパラメータの微調整で結果が激変する戦略は過学習を疑うべきであるという具体的指針

個人のクオンツ投資家が生き残る道として、機関投資家が扱わない「運用キャパシティが小さいニッチな領域」の攻略を提案

Timeline

イントロダクション:クオンツ投資への誤解とリスク

ウォール街の専門家が、クオンツ投資に対する盲信や誇張された希望に対して警鐘を鳴らすことから始まります。統計的基礎がないまま不適切なバックテストを行うことは、時間の浪費だけでなく、科学的な検証をしたという錯覚から過度なリスクを負うことにつながります。実際に、誤ったバックテストを信じ込んでレバレッジをかけ、多額の損失を出した投資家の事例が紹介され、市場環境の良さを自分の実力と勘違いする危険性が指摘されます。この動画の目的はクオンツを否定することではなく、正しい努力と基本を身につけることの重要性を説くことにあります。初心者は特に、常識的な投資判断よりも「近道」を求める議論に流されないよう注意が必要です。

バックテストの罠:過学習とp値ハッキング

「バックテストは多ければ良い」という誤解を解き、クオンツにおける自制の必要性を数学的観点から解説します。バックテストを繰り返すほど、単なるランダムな動きからパターンを拾ってしまう「過学習」の問題が深刻化し、テスト時と実運用の収益差が拡大します。統計学における「p値ハッキング」という概念を用い、偶然に良い結果が出る確率を操作してしまう学問的に不適切な態度の危険性を説明しています。ランダムウォークの株価データであっても、何度もテストを繰り返せば、シャープレシオが1や2を超える戦略が偶然現れてしまうという実験結果は衝撃的です。検証データで収益が出たとしても、それが実質的な未来予測力を持つとは限らないことを強調しています。

戦略の正当化:非クオンツ的言語による説明

過学習を避けるための具体的な手法として、モデルの柔軟性に制限を設ける「正則化」や「構造の強制」について言及します。特に重要なのは、自分の戦略がなぜ市場を上回る収益を出せるのかを、経済学的な論理や投資アイデアという「日常的な言葉」で説明できることです。闇雲にパラメータを変えてデータを「拷問(データスヌーピング)」するのではなく、市場観察に基づいた論理的な着想からバックテストを開始すべきだと説いています。ディープラーニングなどの専門的な手法を除き、個人投資家がツールを使う場合は、この論理的裏付けがない限りランダムなパターンを拾っている可能性が高いです。データから結果を絞り出すのではなく、投資のロジックからデータを確認するという順序が成功の鍵となります。

徹底的な検証:ロバスト性とベンチマークの重要性

バックテストを通過した戦略に対し、あらゆる角度から疑いの目を向ける「自己疑念」のプロセスを詳しく解説します。シャープレシオが2を超えるような良すぎる結果はまず疑うべきであり、パラメータや売買タイミングを少しずらしても収益が安定するかという「ロバスト性」を確認する必要があります。例えば、リバランスの日を1〜2日ずらしただけで収益が激減するような戦略は、実戦では通用しない脆弱なものと判断されます。また、戦略の評価には適切なベンチマークの設定が不可欠であり、ハイテク株戦略ならナスダックと比較するなど、相対的なパフォーマンスを正しく把握しなければなりません。最後には戦略の分散投資を推奨し、似たような条件の戦略を複数持つことの無意味さと、リスク管理としての分散効果を強調しています。

投資の本質:確率的世界観と生存者バイアス

クオンツ投資の長所と限界をまとめ、投資が「決定論」ではなく「確率論」の世界であることを図解とともに説明します。不適切な方法で投資していても、市場のランダム性によって一時的に利益が出てしまう「ビギナーズラック」が、多くの投資家を誤った道へ誘い込みます。成功者の事例が単なる「生存者バイアス」である可能性を理解し、正しい行動が長期的には期待値の高い分布に収束するという確信を持つことが重要です。クオンツの限界として過去データへの依存があり、コロナ禍のような「マーケット・レジーム」の変化には弱いという事実を統計データで示しています。市場がレッドオーシャン化する中で、真のアルファ(超過収益)を見つけるためのコストと難易度が年々高まっている現状を伝えています。

未来への展望:人間の推論と学習カリキュラム

クオンツ化が進む市場において、人間が持つ「少ないデータからの推論能力」や長期投資における優位性を再評価します。今後生き残るための3つの道として、裁量と計量分析の統合、専門的なクオンツへの道、そして機関が狙わない「ニッチな領域」の攻略を提示しています。正しい学習のためにはPythonによるコーディング、統計学、時系列分析、機械学習、そして英語の資料への精通が必要であり、1〜3年の長期的な努力が求められます。最後に『イカゲーム』やゲームの「チート行為」を例に挙げ、結果だけを求めて過程を省略することの虚しさを語り、困難を乗り越える過程にこそ真の幸福があるという哲学的なメッセージで締めくくります。投資は単なる金儲けの手段ではなく、実力を磨き、確率的優位性を追求する知的な旅であるべきだと説いています。

Community Posts

View all posts