[월가아재]퀀트 투자의 허와 실 - 제 2부: 백테스팅은 다다익선이 아니다! (오징어 게임 스포 주의)

월가아재의 과학적 투자
주식 투자자격증/평생교육초보 재테크컴퓨터/소프트웨어

Transcript

00:00:00네 안녕하세요 월가지입니다.
00:00:01오늘 퀀트 투자의 허화실 제2부
00:00:03백테스팅은 다다익선이 아니다
00:00:05여기에 대해서 다뤄보겠습니다.
00:00:07그래서 1부에서 여기까지 다뤘고
00:00:092부에서는 6번부터 다루도록 하겠습니다.
00:00:12그래서 2부에 들어가기 전에
00:00:14영상의 목적에 대해서 다시 한번 강조를 드리자면
00:00:17저는 퀀트 매매 자체가 나쁘다는 뜻은 아니에요.
00:00:19세상은 결국은 계량화되는 쪽으로 흘러가고 있고
00:00:23주식시장에서도 퀀트, 계량화
00:00:26그런 흐름은 필연적인 흐름이라고 봅니다.
00:00:28근데 저는 그저 퀀트 투자에 대한
00:00:31어떤 과장된 희망, 맹신
00:00:33그런 부분들을 경계하자는 뜻으로
00:00:35그런 취지에서 영상을 제작하게 되었고요.
00:00:37그래서 통계적 추론의 기초가 갖춰지지 않으신 분이라면
00:00:41이런 부분들을 꼭 공부를 많이 하시고 나서 손을 대셔야 되고
00:00:45시청자분들 중에 댓글 보니까
00:00:47그래도 감으로 하는 것보다는 퀀트 투자가 좀 낫다
00:00:50그렇게 생각하시는 분들도 계신데
00:00:52저는 그렇게 생각하지 않습니다.
00:00:54물론 감으로 하는 것도 좋은 결과를 얻긴 힘들죠.
00:00:57근데 퀀트 투자를 되게 잘못된 방법으로
00:01:00그러니까 통계적인 유의미성이 전혀 없는
00:01:02그런 백테스팅으로 하게 되면은
00:01:041차적으로 시간 낭비를 추가적으로 하는 것도 있고
00:01:07또 실제로는 통계적으로 전혀 의미가 없는 백테스팅인데
00:01:11본인이 그런 검증을 했다.
00:01:13뭔가 과학적인 검증을 했다는 착각을 하게 됨으로써
00:01:16필요 이상의 리스크를 칠 수도 있거든요.
00:01:18그래서 사실은 제가 웬만하면 이야기를 안 하려고 했는데
00:01:21이제 저한테 이메일로 구독자분들이 이제 손실 본 분들이 꽤나 많이 상담을 해옵니다.
00:01:27이 얘기는 저번에 말씀을 드렸었는데
00:01:29근데 그 중에서 이제 퀀트 투자로 되게 손실을 많이 보신 분이 몇 분이 계세요.
00:01:34그래서 지난주에 이제 이메일을 보내셨던 분은
00:01:36구체적인 액수는 뭐 프라이버시고 말씀드릴 수 없지만
00:01:39상당히 이제 조금 가정에 불화가 생길 정도로
00:01:43큰 돈을 이제 퀀트 투자로 이루셨는데
00:01:46이제 어떤 방법론을 썼는지 제가 뭐 이메일을 조금 주고 받으면서
00:01:50이제 여쭤보고 하니까
00:01:51이제 제가 지금 영상에서 다루는 그런 부분들과 상충되는
00:01:54통계적으로 전혀 의미가 없는 그런 백테스팅을 되게 많이 해오신 분이에요.
00:01:59근데 이제 뭐 MDD가 한 15% 언저리 나는 그런 전략이 있었는데
00:02:04작년 한 해 동안 조금 이게 수익률이 괜찮아가지고
00:02:07올해 들어서 되게 대출을 좀 많이 하셔가지고
00:02:10여기다 이제 넣으셨고
00:02:12코스피가 10% 정도 하락할 때
00:02:15이제 본인 포트폴리오는 한 20% 이상 하락을 했는데
00:02:19그게 거의 이제 대출이랑 이렇게 해가지고
00:02:22레버리지가 한 3배수 돼가지고
00:02:2460-70% 정도 읽게 되신 그런 케이스도 있고
00:02:28근데 그런 분들이랑 대화를 나누면은
00:02:30어떤 퀀드 투자의 백테스팅에 대해서 되게 많이 믿으시고
00:02:34그리고 어떤 벤치마크에 대한 그런 생각도 그렇게 많이 하시지 않으니까
00:02:38작년 한 해 동안 그렇게 되게 수익률이 좋았던 부분이
00:02:42사실은 코스피가 저점에서
00:02:43100% 이상 상승한 해거든요
00:02:45그러면 코스피 지수랑 조금 비교를 하셔야 되는데
00:02:47본인의 백테스팅 전략이 복리로 뭐 40%씩 나왔었고
00:02:52작년 한 해 동안 70% 나오니까
00:02:54거기에 완전히 이제 대출까지 해가지고 넣으셨던 분이셨는데
00:03:00그런 걸 보면서 참 안타깝다고 느끼고
00:03:02그런 차에 이제 제가 퀀드 투자 관련한 그런 담론이나 그런 것들을 좀 지켜보니까
00:03:08아 조금 이런 영상을 한번 제작할 필요가 있다
00:03:11그런 생각을 해서 영상을 제작하게 된 건데
00:03:14그런 식으로 지금 영상에서 제가 이제 설명해드리는 부분이
00:03:17아예 이해조차 잘 되지 않는다면은
00:03:20아예 그냥 손을 대지 마셔야 되고
00:03:22혹은 그런 통계적 기초를 좀 다 지시고
00:03:25이제 중수로 넘어가신 분이라면은
00:03:2710가지를 주의하셔가지고 조심스럽게 접근하시는 쪽으로 가셨으면 좋겠고
00:03:33이미 중수 고수라면은 사실은 알아서 하시면 됩니다
00:03:36제가 뭐 왈과 왈부할 일은 아니고
00:03:39충분히 올바른 방법으로 잘 그렇게 갖춰진 퀀드 전략은
00:03:43그 자체로 상당히 어떤 좋은 엣지가 있죠
00:03:46그래서 저는 그저 세상에 공짜는 없다
00:03:49그런 지극히 상식적인 이야기를 하고 싶을 뿐이에요
00:03:52왜냐하면 이런 상식보다 지난 한 해는 정말 어떤 지름길, 추월차선
00:03:57그렇게 그런 부분에 대한 담론이 조금 지나쳐지는 것 같아가지고
00:04:01그런 면에서 그냥 영상을 제작하는 것 뿐이지
00:04:04나쁘다는 게 아니고
00:04:05열심히 노력해서 제대로 기본기를 갖추고 해야 된다
00:04:08이런 뜻으로 받아들이시면 되겠습니다
00:04:10그래서 이제 퀀트 매매를 하실 때
00:04:12명심해야 될 점 10가지 중에서 여섯 번째
00:04:15퀀트도 자신을 절제해야 된다
00:04:17이게 진짜 진짜 많은 분들이 오해하시는 부분인데
00:04:20심지어 이제 전문가라고 하시는 분들도
00:04:23백테스팅을 많이 하면 할수록 좋다
00:04:25이런 착각을 하시는 분들이 많더라고요
00:04:28근데 절대로 그렇지 않습니다
00:04:30백테스팅은 다다익선이 아니고 퀀트도 본인을 절제할 줄 알아야 됩니다
00:04:35그래서 이거는 논문에서 가져온 건데
00:04:37백테스팅을 많이 하면 할수록 과체조화 문제가
00:04:40그러니까 오버피팅 문제가 조금 심각해지는 그런 문제가 있고요
00:04:44그런 부분들은 이제 수학적으로 증명도 되고
00:04:47이제 퀀트피안의 유저 데이터나 아니면 실증적으로 이런 부분들 확인해 보면은
00:04:51백테스팅을 많이 한 사용자의 알고리즘일수록
00:04:55백테스팅 시의 수익과 향후 실제 그거를 매매를 돌렸을 때의 수익률의 차이가
00:05:00큰 것으로 나타났습니다
00:05:01그 이유는 백테스팅을 많이 돌리면 돌릴수록
00:05:04아주 단순한 무작위 움직임에서도 패턴과 시그널을 픽업하게 되는 거죠
00:05:09그래서 실제로 어떤 한 논문에서는 완전히 그냥 랜덤워크
00:05:12그러니까 무작위적으로 움직이도록 어떤 주식을 시뮬레이션 해서 많이 돌린 다음에
00:05:18거기에 대해서 이제 백테스팅을 해보는 그런 실험을 했거든요
00:05:21근데 완전히 무작위적 움직임 안에서도 백테스팅을 많이 하기 시작하니까
00:05:26샤프 지수가 막 1, 2 넘는 그런 전략들을 발견할 수 있었고
00:05:29학습 데이터뿐만이 아니고 검증 데이터에서도 잘 통하는 그런 전략들이 몇 개가 나오기 시작했다는 거죠
00:05:36그래서 실제로 다른 많은 학문 분야에서도 되게 문제시가 되는 이런 현상이
00:05:40p-value 해킹이라고 하거든요
00:05:42이 p-value라는 것은 물론 통계학 전공하신 분들은
00:05:46뭐 엄밀하지 못한 정의라 싫어하실 수도 있지만
00:05:48지금 주린이 분들을 위해서 굉장히 그냥 직관적으로 쉽게 설명을 해드리자면
00:05:52과학자들이 어떤 실험을 할 때 그 실험의 결과가 실제로 뒤에 있는
00:05:57모집단 여기서 이제 샘플을 그냥 저희는 보고 뒤에 모집단을 추정을 하잖아요
00:06:02예를 들어서 대선 여론조사 같은 경우에는 전국민이 있으면은 그중에 몇 명을 추려가지고 지지율이나 그런 것을 가늠해 보는데
00:06:10실제로 모집단은 그렇지 않은데 정말 정말 우연하게 여기서 샘플들이 지금 연구 방향이랑 주제에 알맞게 잘 뽑혀가지고
00:06:20그렇게 좋은 결과가 나왔을 확률 그거를 그냥 p-value라고 생각하시면 됩니다
00:06:25그래서 분야마다 기준이 조금씩 다르지만 보통 뭐 일반적으로는 5% 미만이면은
00:06:31그게 통계적으로 유의미하다 그런 이야기를 하는 거거든요
00:06:34예를 들어서 우리가 검증하고자 하는 어떤 문장이 지금 뭐 A 후보의 지지율이 50% 이상이냐 아니냐
00:06:42그것을 검증하고 싶어요 근데 샘플을 이렇게 뽑았는데 55%가 나왔습니다
00:06:47그러면 실제로는 모집단이 50%인데 그냥 우연하게 샘플에 이제 A 지지자가 좀 더 들어가서 55% 나올 확률이 뭐냐
00:06:57그러면 뭐 p-value가 0.2다 그러면 이게 그냥 우연이었을 확률이 이제 20%라는 거죠
00:07:03근데 이 샘플이 70%가 나왔다 그러면은 실제로 이 모집단은 50% 밖에 지지를 안 하는데
00:07:10진짜 진짜 운 좋게 막 A를 지지한 사람들만 막 샘플로 되게 운 좋게 다 막 뽑혀 들어가가지고
00:07:1770%가 되었을 확률은 뭐 한 1% 밖에 안 되겠죠
00:07:21이게 이제 p-value인 거죠
00:07:22그래서 이 p-value가 이렇게 뭐 55%일 때 p-value가 0.2다
00:07:27그러면은 우리가 A 후보가 50%가 아니다
00:07:31그렇게 결론을 내릴 수 없다
00:07:33그런 통계적인 유의미성이 확보되지 않는다 그렇게 얘기하고
00:07:38이렇게 70%가 샘플에서 나와버려서 p-value가 1% 정도 되면은 우리가 뭐 5%를 기준점으로 잡으면은 1%면 훨씬 낫잖아요
00:07:46그래서 아 이게 1%면은 우리는 통계적으로 유의미하게 이제 A 후보가 50% 지지율이 아니다고 확신을 조금 가지고 얘기를 할 수 있다
00:07:57뭐 그런 뜻이거든요 어쨌든 그게 p-value고
00:08:00p-value가 좋게 나오게 하기 위해서 계속 실험을 반복하는 게 p-value 해킹이라 하거든요
00:08:06예를 들어서 샘플에서 이 중간에 한 60% 지지율이 나왔을 때 p-value가 0.05라고 해봅시다
00:08:15그 뜻은 뭐냐면은 실제로 이 모집단이 50% 지지율을 가진 집단이라 하더라도
00:08:21100% 정도 계속 샘플을 다시 뽑고 다시 뽑고 해보다 보면은 한 번쯤은 60%의 샘플이 이제 뽑힌다는 거죠
00:08:29그래서 어떤 과학 실험이나 다른 분야에서도 샘플 다시 뽑아서 이제 논문 주제랑 맞는지 보고
00:08:35그렇게 한 20번 하면은 p-value 0.05의 기준을 충족시켜서 논문 출판하고 뭐 그런 사례들이 있어 가지고
00:08:43그게 이제 되게 나쁜 그런 학문적인 태도인데 그걸 피해킹이라 합니다
00:08:48근데 이게 마찬가지로 백테스팅에 적용이 된다는 거죠
00:08:51정말 막 무작위적인 그런 주식을 가지고도 아무런 통계적으로 어떤 패턴이나 그런 것들이 전혀 없이
00:08:58막 진짜 그냥 동전 뒤집듯이 막 움직이는 주식에서도 학습 데이터를 뽑아서 이제 백테스팅해서 수익률 좋은 거를 검증해보고
00:09:06이걸 계속 반복하다 보면은 검증해서도 수익률이 좋게 나오는 것들이 우연하게 몇 번은 나오기 마련이라는 거죠
00:09:13그래서 일부 그 과체적화에 대해서 말씀드렸듯이 학습 데이터에서 수익률을 뭐 최적화 해가지고
00:09:20검증 데이터에서 돌려보고 혹은 뭐 페이퍼 트레이딩을 해보고
00:09:23아무리 그런 과정을 거치더라도 백테스팅을 지나치게 막 많이 하다 보면은
00:09:29아무런 실질적으로 미래 예측력도 없고 그런 유의미한 패턴도 아니고
00:09:34아무 짝의 쓸모없는 그런 과거 패턴을 픽업했을 뿐인데
00:09:39검증 데이터에서까지도 수익률이 좋게 나오는 그런 케이스들이 우연히 나올 수 있다
00:09:44그렇기 때문에 여기서 이어져서 7번에서 빅퀀트적 언어로 전략을 설명하기가 굉장히 중요합니다
00:09:51왜 빅퀀트적 언어로 전략을 설명하는 게 중요한가
00:09:54거기에 대해서 일단 데이터 개수의 중요성이 왜 중요한지 한번 보겠습니다
00:09:58어떤 심플한 모델과 유연한 모델이 있다고 가정을 해봅시다
00:10:02지금 이 사진에서 파란색은 되게 유연도가 높은 그런 모델이고
00:10:06이 까만색은 굉장히 심플한 모델이죠
00:10:09근데 이렇게 모델이 유연할수록 주어진 샘플에는 굉장히 완벽히 오차가 없이 맞출 수 있습니다
00:10:15근데 실제로 분포가 이거라고 치면 새로운 그런 데이터들이 들어왔을 때
00:10:21이 파란 선들은 되게 많이 틀리게 되겠죠
00:10:23그래서 이 얘기를 1부에서 했었는데 데이터가 진짜 진짜 진짜 많은 경우
00:10:28수천 개 수만 개 그러니까 과거에는 데이터 수집이 굉장히 힘들었어요
00:10:32그래서 진짜 작은 샘플로 엄청나게 큰 모집단의 그런 실제 분포를 추정하든지 예측을 하든지 그렇게 했었어야 됐는데
00:10:39요새는 뭐 분야마다 다르긴 하지만 굉장히 그냥 모집단을 아예 측정해 버리든지 아니면 모집단에 가까운 수의 그런 테라바이트 데이터를 모을 수 있기 때문에
00:10:50그만큼의 데이터가 많은 경우에는 이런 유연한 모델을 써도 이 정도로 과체적화가 일어나지 않아요
00:10:57그래서 실제로 이 파란색을 이만큼 많은 그런 데이터에 해보면은 조금 꼬불꼬불 하지만
00:11:04그래도 얼추 이제 피팅이 이렇게 돼서 새로운 검증 데이터 들어왔을 때
00:11:09오차가 얼추 그렇게 크지 않겠죠 근데 이제 트레이딩 컨텍스트 에서 보면은 이것도 일부에서 말씀드렸지만
00:11:15초분 단위에서 시일 월 년으로 갈수록 데이터의 개수는 적어지겠죠
00:11:20그래서 결국 퀀트 트레이딩이 아니고 뭐 소위 말하는 재무제표나 그런 걸로 하는 퀀트 투자 같은 경우에는 데이터 숫자가 작아지게 됩니다
00:11:28그래서 요거는 일부 얘기를 다시 한번 반복 드린 거고 그럼 데이터가 작을 때 어떻게 해야 과체적화를 피할까요
00:11:35그럴 때는 모델의 유연성에 제한을 둬야지 그런 오버 피팅 그런 과체적화가 일어나지 않습니다
00:11:41그래서 뭐 imposing a structure 어떤 구조를 강제한다
00:11:45아니면은 뭐 regularization 테크닉이라고도 하는데 그렇게 유연성을 제한함으로써 이렇게 과체적화를 조금 완화하는 거죠
00:11:53근데 뭐 요런 거 피팅할 때 그렇게 모델을 제한하거나 아니면 뭐 regularization 테크닉을 쓰든지 뭐 그래도 되지만
00:11:59어떤 백테스팅 관련해서 또 다른 방법은 무엇이냐면은 정말 경제학적으로 아니면 트레이더로서의 어떤 상식적으로 의미 있는 전략만
00:12:09가서 아이디어를 구현해 보고 백테스팅 함으로써 그런 과체적화를 제한하는 효과를 얻을 수 있습니다
00:12:15그러니까 랜덤한 데이터에서 여기 테스트 해보고 여기 테스트 해보고
00:12:19막 아무 의미 없이 막 진짜 백테스팅을 수만 번 돌려 보다 보면은
00:12:23와 이렇게 직선으로 잘 이렇게 배열된 케이스를 찾을 수가 있겠죠 패턴을
00:12:29그래서 막 이렇게 막 아무 의미 없이 막 파라미터 다 바꿔보고 PR 안되니까 PBR 해보고
00:12:33그냥 막 무작정 백테스팅을 많이 막 계속 갈면서 막 하는 게 아니고
00:12:39진짜 투자자로서 아니면 트레이더로서 그런 시장을 관찰하고
00:12:43어떤 경제학적으로 의미가 있는 투자 아이디어 트레이딩 아이디어
00:12:47그거를 이제 추려 가지고 백테스팅을 함으로써 쓸데없는 무작위 패턴을 픽업 해가지고
00:12:53그걸 검증 데이터까지 페이퍼 트레이딩까지 좋게 나오는 그런 우연성을 조금 피해 볼 수 있다는 거죠
00:12:59그래서 그냥 뭐 빅데이터 패턴 인식 뭐 그런 거창한 단어가 아니고
00:13:03일상적인 언어로 내 전략이 왜 경제학적으로 초과 수익을 지수보다 더 낼 수 있는 그런 아이디어인지
00:13:10그거를 제대로 잘 설명하지 못한다면은 그저 데이터 스누핑을 하고 있을 확률이 큽니다
00:13:16데이터 스누핑은 그냥 말 그대로 데이터를 고문해 가지고 데이터를 그냥 주구장창 돌리고 돌리고 돌려서
00:13:23어떻게든 본인이 원하는 결과를 그냥 얻어내는 그런 의미라고 생각하시면 되는데
00:13:28저는 생각보다 이게 중요하다고 보거든요
00:13:31물론 예외는 있습니다 예를 들어서 딥러닝을 쓰는 경우
00:13:35딥러닝을 그런 뭐 레귤러이제이션 테크닉, 드랍아웃이나 뭐 그런 부분들 정말 잘 쓰고
00:13:40이것저것 최적화를 진짜 이제 전문가들이 잘 해 가지고 그렇게 모델을 만들어서 그런 자동화된 AI 투자를 할 경우
00:13:49그런 경우 딥러닝에서 뭐 각각 웨잇이 어떻게 선정되고 이런 부분들을 뭐 경제학적으로 설명하기는 힘들거든요
00:13:56그리고 실제로 저희 한국에서도 아주 훌륭한 퀀트 분들이 요런 전략을 이제 연구하시고 뭐 그러시는 것 같은데
00:14:04어쨌든 그런 거 읽어 보시면 어쨌든 엄밀하게 과학적으로 접근을 하셨다
00:14:08요런 걸 좀 느낄 수 있는데
00:14:10지금 제가 여기서 말씀드리는 것은 일반적인 개인 투자자가 그런 백테스팅 툴 이용해서 백테스팅을 할 경우
00:14:17그럴 경우에 요런 데이터 스누핑을 피하고 싶으면은 데이터에서 시작해서 막 거기서 어떻게 짜내려고 하지 말고
00:14:24투자 아이디어, 트레이딩 아이디어, 어떤 경제학적인 논리 여기서 이제 시작해 가지고 백테스팅으로 가라 요런 말씀을 드리는 거예요
00:14:31그래서 제가 지금 이렇게 말씀드리는 부분들은 어떤 주린이 분들을 위해서 이제 말씀드리는 부분이니까
00:14:40그렇게 뭐 강화학습으로 뭐 파라미터를 정하고 딥러닝 하시고 뭐 그런 분들은 이제 뭐 본인이 알아서 하시고
00:14:47그 다음 여덟 번째 요것도 굉장히 중요한데
00:14:50본인을 정말 정말 여러 각도에서 의심을 해 보셔야 됩니다
00:14:53그러니까 본인이라는 것은 여기서 본인의 전략이죠
00:14:56어떤 식으로 생각하셔야 되냐면은 백테스팅을 하시고 뭐 학습 데이터 말고
00:15:01검증 데이터에서도 뭐 통과가 되고 페이퍼 트레이딩을 해 봤는데 통과가 됐다
00:15:06그렇게 고런 검증 단계를 거쳐서 통과된 전략은 수익률이 좋을 거라 증명된 전략이 아니고
00:15:12수익률이 나쁠 거라 증명되지 못한 전략들일 뿐이에요
00:15:15이 차이가 뭐 말장난 같지만 요 미묘한 태도의 차이가 어마어마한 차이를 만들어냅니다
00:15:21백테스팅을 통과했다고 그냥 믿는 것이 아니고
00:15:24못 믿었다는 증명이 아직은 안 됐다 요 정도로 생각해야 된다는 거죠
00:15:29그래서 어떤 식으로 다각도에서 의심을 해 봐야 되냐
00:15:31일단은 결과가 너무 좋으면은 아마도 좋은 것이 아니라는 점
00:15:35예를 들어서 하이 프리퀸시 트레이딩이 아닌
00:15:37단일 전략이 샤프 지수가 2가 넘으면은 조금 의심을 해 봐야 되고
00:15:423 이상은 거의 불가능하다고 보시면 됩니다
00:15:44샤프 지수가 뭐 1점 몇 고런 다수의 전략들로 분산이 된 포트폴리오 가지고
00:15:493 이상이 샤프 지수를 장기간 유지하면은 전설이 될 수 있습니다
00:15:54시장의 마법사 시리즈 이런 데 실릴 수가 있어요
00:15:56그래서 요런 부분들 조심하셔야 되고
00:15:59하이 프리퀸시 트레이딩 같은 경우에는 조금 다르거든요
00:16:02요게 너무 빈도가 높아 가지고 샤프 지수가 막 3,4 요렇게 나오기도 하는데
00:16:06요거는 하이 프리퀸시 트레이딩은 그 대신에
00:16:09인프라 비용이 고정 비용으로 들어가기 때문에 조금 컨텍스트가 다르고
00:16:14일반적으로 이제 퀀트 매매나 뭐 그런 거 백테스팅 하시는 분들이
00:16:17고런 기준에서 이넘으면 의심해 보시라
00:16:20룩어헤드 바이언스가 있다든지
00:16:22아니면은 오버피팅을 했다든지
00:16:24아니면 내가 지나치게 백테스팅 많이 해서
00:16:26지금 피밸류 해킹이 됐다든지
00:16:28고런 부분들을 의심해 보셔야 되고
00:16:30그리고 어떤 백테스팅을 통과한 전략이 있다
00:16:32그럼 계속 요모조모 뜯어 봐야 됩니다
00:16:34예를 들어서 비용에 대한 가정을 조정해 본다든지
00:16:39단순히 그냥 매매에서 나오는 수수료 뿐만이 아니고
00:16:42거래량이나 유동성에 대한 가정도 조금 더 나쁘게 만들어 가지고
00:16:46슬리피지 비용을 조금 올려 본다든지
00:16:48아니면은 전략의 파라미터를 변화시켜 보면서
00:16:51파라미터를 조금 변화 시켰는데도
00:16:54여전히 수익률이 좋고 안정적인지
00:16:56그 부분을 체크해 보셔야 됩니다
00:16:58예를 들어서 뭐 PER 관련한 전략이라고 해 보죠
00:17:01지금 이 아래 케이스인지 위에 케이스인지
00:17:04PER이 14가 최적점이라고 백테스팅해서 나왔는데
00:17:08뭐 13.5, 14, 15, 16 요렇게 이제 나눠 봐도
00:17:13수익률이 요원저리에서 뭐 조금 나빠지고
00:17:15요렇게 좀 안정적인 그런 파라미터 경향을 보이는지
00:17:19아니면 진짜 뭐 요렇게 PER이 14일 때는 이만큼 나왔는데
00:17:2413으로 줄여 봤더니 이만큼 떨어지고
00:17:2612 때는 이렇게 마이너스가 나오고
00:17:28이런 식으로 이제 불안정한
00:17:31파라미터 밸류가 나오는지
00:17:32이럴 경우에는 이제 대부분
00:17:34과태적 과일 확률이 높다
00:17:36그 다음 또 한 가지는 매매 타이밍을 조금씩 변화시켜 보세요
00:17:39예를 들어서
00:17:40시간 단위로 매매하는 그런 전략이면은
00:17:43한 5분, 10분 요렇게 이제 진입 청산 시점을 바꿔 본다든지
00:17:46아니면 월별로 리밸런싱하는 그런 퀀트 투자 전략일 경우에는
00:17:50월초나 월말에 이렇게 리밸런싱을 하겠죠
00:17:54그때 매매를 한다고 가정하고 백테싱을 하실 건데
00:17:56그 날짜 대신에 뭐 28일 아니면 월초라면은 뭐 3일, 4일
00:18:01뭐 그렇게 좀 며칠씩 타이밍을 변화시켜 보고도
00:18:04수익률이 얼추 비슷하게 안정적으로 나오는지
00:18:08월별 리밸런싱이면은 사실 뭐 전날 하든 그 다음날 하든
00:18:11하루 이틀 차이는 큰 차이를 만들어내지 않아야 되거든요
00:18:14근데 요렇게 하루 이틀 바꿔봤는데
00:18:16수익률이 뭐 연 15% 였는데 7%로 떨어진다
00:18:20그러면은 이게 문제가 있는 거죠
00:18:22그 외에도 뭐 다양한 가정들을 추가해 보는 거
00:18:24뭐 외생적 이벤트 아니면 뭐 기간을 조금씩 바꿔 본다든지
00:18:28근데 뭐 외생적 이벤트 이런 건 사실
00:18:30본인의 어떤 시뮬레이션, 백테스팅 그런 거를
00:18:34어떤 툴에서는 하기 힘들죠
00:18:36그 외에도 통계적인 노이즈를 조금 추가해 보든지
00:18:39이런 부분들은 보통 이제 통계에서
00:18:42Bootstrapping 이라고 하는데
00:18:44그런 주식시장의 변수들을 살짝 무작위적으로
00:18:48조금 그 분포 안에서 변화시켜 보는 거죠
00:18:50그런 걸 해봤는데도 이제 결과가 안정적으로 나오는지
00:18:54어쨌든 요런 식으로 최대한 요모조모 다 뜯어보고
00:18:57뭐 그렇게 한 다음에 일반적으로
00:19:00검증 데이터나 페이퍼 트레이딩으로 넘어가서 확인을 해보고
00:19:03그 다음에 이제 실전으로 넘어가시라
00:19:06그런 말씀을 드리고
00:19:07그리고 이 부분도 제가 아까 전에 말씀을 조금 드렸지만
00:19:10벤치마크를 제대로 설정을 하셔야 됩니다
00:19:12실제로 어떤 케이스인데
00:19:14본인이 6개월 동안 30% 수익 냈다고
00:19:17본인 퀀트 전략 자랑하는 분이 계셨어요
00:19:20근데 이 분이 주식 매수 전략인데
00:19:22작년에 똑같은 기간 동안 코스피가 40% 올랐거든요
00:19:25그리고 요 벤치마크 설정 할 때도
00:19:28본인의 전략에 적합한 벤치마크를 선택해야 됩니다
00:19:31예를 들어서 테크 주식을 중심으로 전략을 짰는데
00:19:36그럼 낫사기랑 비교해야 되는데
00:19:38뭐 S&P나 러셀 뭐 이런 거랑 비교해서는 안 되겠죠
00:19:41그래서 우선은 전략의 수익률 관련해서
00:19:43예를 들어서 이렇게 똑같은 6년 기간이라도
00:19:462011년부터 17년 동안 13% 낸 전략과
00:19:4915~21년 동안 17% 낸 전략 어떤 게 나을까요
00:19:53보통 뭐 17%가 낫다고 생각하겠지만
00:19:56이 기간 동안 이 전략의 벤치마크가 어떻게 퍼포먼지에 따라서
00:20:00뭐가 나은지는 달라지겠죠
00:20:02되게 좋은 시장에서 17% 밖에 못 낸 거랑
00:20:06마이너스였던 어떤 국가의 시장에서
00:20:0813% 낸 전략은 확연히 다르니까
00:20:11근데 이런 부분들을 어떤 벤치마크와 비교하지 않고
00:20:14본인의 절대적인 수익률감만
00:20:16되게 중요시하는 분들도 존재해요
00:20:19그래서 항상 벤치마크와
00:20:20상대적으로 본인의 전략을 바라봐야 된다는 거
00:20:23그 다음 본인 전략의 벤치마크를 설정할 때
00:20:25어떤 부분들을 고려해야 되느냐
00:20:27변동성 리스크 아니면 뭐 가치주인지 성장주인지
00:20:30이런 거 관련해서 다 인덱스들이 다 따로 있죠
00:20:33그래서 본인의 어떤 전략이 예를 들어서
00:20:35테크 성장주 위주로만 이제 범위를 설정해 가지고
00:20:38그 안에서 뭐 주식을 고르는 그런 퀀티 전략이다
00:20:41그러면 테크 성장주 관련 지수를 기준으로
00:20:45벤치마크 삼아서 비교를 해야겠죠
00:20:48그 다음 옵션을 사용할 경우에
00:20:50주식 매수하는 포트폴리오인데
00:20:52옵션으로 해지를 합니다
00:20:53이렇게 옵션을 사용하는데
00:20:54이걸 S&P 지수랑 비교하면 되느냐
00:20:56안 됩니다
00:20:57절대 안 됩니다
00:20:58이건 옵션 해지된 그런 벤치마크를
00:21:00상대로 이 전략을 비교해야 되고요
00:21:03그 다음 뭐 매수만 하는지
00:21:05아니면 매수 공매도
00:21:06둘 다 하는 그런 롱숏 전략인지
00:21:08이렇게 공매도도 하는 전략인데
00:21:10그냥 매수만 하는 그런 지수를 쓰면 안 되겠죠
00:21:13그래서 이런 식으로
00:21:14본인의 전략에 알맞은 벤치마크를 설정하고
00:21:17그 벤치마크의 수익률 대비해서
00:21:19내 전략의 수익률을 평가해야 된다는 점
00:21:22사실 엄청나게 기본적인 건데
00:21:24너무너무너무 많은 줄이니 분들이
00:21:27요 부분을 패스하시고
00:21:28그냥 절대적인 수익률만 봅니다
00:21:30그 다음에 이제 마지막으로
00:21:31전략을 분산할 것
00:21:33아무리 아무리 심혈을 기울여서
00:21:35백테스팅을 조심히 하고
00:21:37과학적으로 엄밀하게 해도
00:21:39실제 수익률은 다르게 나옵니다
00:21:41그래서 전략을 분산 투자하면
00:21:43수익률은 낮아지지 않으면서
00:21:45리스크는 줄어드는 효과를
00:21:47그런 분산 효과를 누릴 수가 있습니다
00:21:49물론 살짝 해박히긴 하지만
00:21:51어쨌든 전체적으로 샤프 지수 관점에서는
00:21:54무조건 분산 투자하는 게 좋겠죠
00:21:56그래서 요런 관점에서 볼 때
00:21:58이미 보유한 전략과 비슷한 전략의 경우에는
00:22:01효용가치가 그다지 없다는 뜻도 돼요
00:22:03그래서 나의 포트폴리오 중에
00:22:05뭐 어떤 어떤 재무제표를 쓰고
00:22:07뭐 요런 전략이 있는데
00:22:08요런 거랑 비슷하게
00:22:10뭐 조금만 바꿔가지고
00:22:11백테스팅 해보고
00:22:12그렇게 해서 여기 편입시키를 하는 것은
00:22:14별로 의미가 없다
00:22:16그런 말씀을 드리고
00:22:17그래서 퀀드 투자
00:22:18퀀드 매매에서 조심해야 될 점
00:22:2010가지
00:22:21데이터를 의심할 것
00:22:22미래를 먼저 바라보지 말 것
00:22:23과체적화를 피할 것
00:22:25검증 기회는 단 한 번뿐이라는 거
00:22:27시대는 변한다는 거
00:22:28마켓 레짐
00:22:29그 다음에 퀀트도
00:22:30본인을 절제해야 한다는 거
00:22:31지나치게 아무런
00:22:33그런 투자 아이디어도 없이
00:22:34그냥 백테스팅만
00:22:35주구장창 돌리면 안 된다는 거
00:22:36그런 관점에서
00:22:38빅 퀀트적 언어로
00:22:39전략을 설명할 수 있어야 한다는 거
00:22:40물론 예외는 있겠죠
00:22:42그런 딥러닝
00:22:43강화학습 요런 파트에서는
00:22:44그 다음 백테스팅을 통과해도
00:22:46정말 여러 각도에서 의심을 해보고
00:22:48조금씩 그런 환경들을 조절해 보면서
00:22:50파라미터에 따른 그런 수익률이 안정적인지
00:22:52그런 부분을 확인할 것
00:22:54그 다음 벤치마크를 제대로 설정할 것
00:22:56그 다음 전략을 분산할 것
00:22:58그래서 이 10가지만 명심하셔도
00:23:00잘못된 백테스팅으로
00:23:02퀀트 투자 퀀트 매매를 하시면서
00:23:04시간 낭비하시고
00:23:06또 이런 잘못된 백테스팅에서 오는 손실은
00:23:09피할 수가 있다
00:23:10그런 말씀을 드리고
00:23:11근데 잘못된 백테스팅에서 오는 손실을 피하는 거지
00:23:14제대로 된 백테스팅을 한다고 해서
00:23:16수익이 보장되는 건 아니겠죠
00:23:18근데 적어도 백테스팅의 잘못으로 손실 보는 건 피할 수 있다
00:23:22그래서 이제 마무리하는 관점에서
00:23:23퀀트의 장점과 한계에 대해서 조금 이야기를 해 보겠습니다
00:23:26그래서 제가 영상 초반에도 강조했듯이
00:23:28퀀트 투자가 나쁘다는 것은 아니고
00:23:30계량화된 사고방식을 투자자로서 가지는 것은 매우 바람직합니다
00:23:34근데 과대 광고와 그에 따라서
00:23:36어설프게 백테스팅하는 것은 오히려 독이 되고
00:23:38시한 낭비와 손실 외에도
00:23:40나는 과학적으로 투자 중이라는
00:23:42그런 그릇된 환상을 가지고
00:23:44리스크테이킹을 많이 할 수 있습니다
00:23:46실제로 이제 손실 보신 그런 사례들에서 참 안타까움을 느끼고
00:23:50근데 문제는 뭐냐면은
00:23:52어설픈 백테스팅을 해서
00:23:54정말 통계적으로 무의미한 행동만 해서
00:23:56전략을 수립해도
00:23:58주식시장의 그런 무작위성 때문에
00:24:00그런 어설픈 백테스팅도 수익이 나는 경우가 있습니다
00:24:03왜냐하면 백테스팅을 잘못했다는 것은
00:24:05무조건 백테스팅 수익률보다
00:24:07나쁜 수익률이 나온다는 뜻이 아니고
00:24:09백테스팅 수익률과 실전 수익률의
00:24:11오차가 커진다는 뜻이거든요
00:24:13그래서 오차가 위로 날 수도
00:24:15아래로 날 수도 있겠죠
00:24:17근데 일반적으로 백테스팅은 과거 데이터에서
00:24:19수익률을 최대화하니까
00:24:21보통 이제 오차가 나면은 아래쪽으로
00:24:23그러니까 더 나쁜 수익률로 나오게 되는데
00:24:26정말 정말 통계적으로 아무런 의미 없이 백테스팅을 할 경우
00:24:30진짜 그러니까 랜덤으로 할 경우
00:24:32아니면은 단순히 이제 실전 투입했을 때
00:24:35시장 상황이 되게 좋아서
00:24:37그래서 백테스팅 만큼의 수익률을 내던지
00:24:39아니면 그 이상의 수익률이 나올 수도 있습니다
00:24:41요게 이제 까딱 잘못하면은
00:24:43조심자의 행운이 되는 거죠
00:24:45요거는 퀀트 투자 뿐만이 아니고
00:24:47뭐 가지노나 아니면 그냥 뭐 매뉴얼 트레이딩 차트 매매
00:24:50뭐 다양한 그런 돈을 걸고 하는
00:24:53확률론적인 세계에서 벌어지는 일들인데
00:24:56사람이 초반에 그렇게 돈을 따게 되면은
00:24:59자신감을 가지면서 돈을 더 끌어오고
00:25:01대출을 받고
00:25:02그러다가 더 큰 손실로 이어지는 케이스가 있습니다
00:25:05그래서 이런 부분 조심하셔야 되고
00:25:07다시 한번 말씀드리지만
00:25:08백테스팅을 통해서 수익성이 좋다고
00:25:11증명되는 게 아니에요
00:25:12숱하게 검증을 해 봤는데
00:25:14딱히 이게 수익성이 나쁘다고 증명은 하지 못했다
00:25:17요런 상태의 전략들이
00:25:19실전에 나가는 것이지
00:25:21수익성이 보장되거나
00:25:22좋다고 증명되는 것이 아니다
00:25:24그런 말씀을 다시 한번 드리고
00:25:27그리고 이게 실제로 이제
00:25:29좀 삐딱하게 보시는 분들이
00:25:31저한테 하는 얘기인데
00:25:32아 이놈의 새끼는 항상
00:25:34뭐든 어렵다고만 한다고
00:25:36뭐 가치 투자도 어렵고
00:25:37차트 매매도 어렵고
00:25:38지수 추정도 우상향이
00:25:40반드시 진리는 아니고
00:25:41퀀트 투자도 이제는 어렵다 하고
00:25:44도대체 뭘 하란 말이냐
00:25:46그래서 뭐 제가 이런 얘기도 들었어요
00:25:47금융계 종사한다고
00:25:49전문가 부심 부리는 거냐고
00:25:51일반인들은 뭐 지수 추정이나 해라
00:25:53그렇게 무시하는 거냐고
00:25:54근데 그런 게 아니고
00:25:55원래 남들보다 돈 더 많이 버는 것 자체가 어려운 일입니다
00:26:00솔직히 이런 식으로
00:26:01잘못된 퀀트 투자 하시는 분들이
00:26:03많으면 많을수록 이득이에요
00:26:05그런 분들이 다 시장의 비효율성을 이제 만들어내고
00:26:08그런 분들이 계셔야
00:26:10누군가는 초과 수익을 얻을 수 있거든요
00:26:12굳이 잘못된 방법으로 하고 있다고
00:26:14얘기해줄 동기가 없는 거죠
00:26:15그래서 제가 굳이 뭐 이런 부분들이 다 어렵다 어렵다 하는 거는
00:26:18뭐 여러분들이 이걸 하지 말고
00:26:20전문가가 아니면 뭐 지수 추정이나 해라
00:26:23그렇게 말씀드리는 것이 아니고
00:26:24원래 남들보다 돈 더 많이 버는 것이 어렵기 때문에
00:26:28더 많이 버시고 싶으시면은
00:26:30올바른 방법으로 노력을 드리고
00:26:32공부를 해서 실력을 쌓고
00:26:34경험을 드리고
00:26:35그런 방향을 통해서
00:26:36뭐 같이 투자든
00:26:37뭐 퀀트 투자든
00:26:39아니면 뭐 지수 추종이든 하시라
00:26:41요런 뜻이거든요
00:26:42근데 참 이런 상식적인 이야기가
00:26:44왜 먹히지 않을까요
00:26:45왜 요런 뭐를 통해서 쉽게 돈 벌 수 있다
00:26:48쉽게 연 20% 낼 수 있다
00:26:50요런 얘기가 사실
00:26:5110년 20년 30년
00:26:53100년 전에도 계속 있었을 거예요
00:26:55매번 이런 얘기들이 돌고
00:26:57새로운 또 투자 방법이 있으면
00:26:59거기서도 또 요런 얘기가 돌고
00:27:01또 뭐 새로운 상품이 나오면
00:27:03거기서 또 얘기가 돌고
00:27:05그러면서 왜 매번 이렇게
00:27:06피해자들이 되풀이해서
00:27:08계속 역사가 반복되듯이 생겨날까요
00:27:10제 생각에 그거는
00:27:12이렇게 잘못된 방법을 통해서도
00:27:14실제로 그런 케이스들이
00:27:16이제 생기기 때문이라고 봐요
00:27:18카지노에서도 대박 낸 사람들이 있죠
00:27:20그 다음 어설픈 백테싱으로도
00:27:21돈 번 사람들이 실제로 존재를 해요
00:27:24그래서 그 저변에 있는 실질적인 분포가
00:27:26이제 가려 버리는 거죠
00:27:27그러니까 세상과 삶에는
00:27:29어떤 무작위성이 존재하기 때문에
00:27:31그런 변동성이 실제로
00:27:33그 평균 값을 가려 버리는 거죠
00:27:35그래서 제가 요런 그림을 생각해 봤습니다
00:27:37사람마다 이 사람이 앞으로 돈을 벌지 안 벌지
00:27:41이거는 확정적인 부분이 아니고
00:27:43확률적인 부분이라 생각하거든요
00:27:45그래서 지금 X축이 얼마나 부자 되는지
00:27:48그러니까 오른쪽으로 갈수록 부자가 된다
00:27:50이렇게 생각을 해 봅시다
00:27:51그러면은 뭐 공무원 하시는 분들
00:27:54정년퇴직이 보장 되신 분들
00:27:56아니면 성실하게 그냥 살고 예금 하시는 분들
00:27:58요런 분들이 요 정도 부를 쌓는다
00:28:01이렇게 생각해 보면은
00:28:02요런 분들은 안정적으로 뭐 예금 투자 하시고
00:28:05되게 조심조심 하시기 때문에
00:28:07부위 변동성이 그렇게 높지 않습니다
00:28:09뭐 지출 조금 나가든지 아니면
00:28:11예금 이자 받든지 해도
00:28:13요 언저리에서 움직일 뿐이죠
00:28:15근데 여기서 이제 주식 투자를 하시게 되면은
00:28:17변동성이 이제 늘어나겠죠 삶에서
00:28:20주식 투자를 잃든지 아니면은
00:28:22주식 투자로 이제 수익을 벌든지
00:28:24아니면 뭐 금융위기 터져가지고
00:28:26뭐 여기 내려가든지
00:28:27근데 요 그림에서 살짝 잘못된 부분은
00:28:29그냥 요게 직선으로 내려왔는데
00:28:31요렇게 리스크 테이킹을 좀 더 하게 되면은
00:28:34주식 투자 하시면은
00:28:35변동성이 늘어난 대신에
00:28:37살짝 더 우측으로 가긴 하겠죠
00:28:39그래서 실제로는 뭐 이렇게 된다
00:28:42요런 안정적인 삶 보다는
00:28:43더 리스크 테이킹을 하는 대신에
00:28:45거기에 대한 보상으로
00:28:46평균적으로 또 오른쪽으로 가게 돼 있다
00:28:48그렇게 보시면 되고
00:28:50이제 극단적으로 더 극단적인 삶을 추구하신 분들은
00:28:54뭐 선물 파생 코인 요런 거 하시면은
00:28:57변동성이 많아 지겠죠 노란색으로
00:28:59그리고 같은 주식 투자를 하시는 분들도
00:29:02이제 실력을 더 쌓으면은
00:29:04이쪽 확률분포를 가질 수 있겠고
00:29:06더 쌓으면 뭐 이쪽으로 갈 수도 있겠죠
00:29:08근데 잘못된 방법으로 이제 투자를 하시는 분들
00:29:10카지노에 가서 도박을 한다든지
00:29:12아니면 투기를 한다든지
00:29:14아니면 뭐 불법 리딩방 시세 조종하는 그런 리딩방에 가입을 한다든지
00:29:18아니면은 오늘 말씀드린 그런 잘못된 백테스팅
00:29:21아니면 뭐 귓소문으로 들은 걸로 몰빵을 한다든지
00:29:23요것도 요 그림보다는 변동성을 조금 키워야 되는데
00:29:26어쨌든 요지는 왼쪽으로 가게 됩니다
00:29:29근데 문제는 뭐냐
00:29:31이런 걸 하는 사람들 중에서도
00:29:33어쨌든 이게 확률적인 분포기 때문에
00:29:35정말 천명 만명 중에 한명은
00:29:38여기 대박을 낼 수가 있습니다
00:29:40그래서 여기 이렇게 카지노에서 잭팟 터트리거나
00:29:43아니면 코인 몰빵에서 대박을 치던지
00:29:45이런 사람들이 만명에 한두명은 또 나오기 마련이에요
00:29:48근데 이런 부분들을 볼 때 생존자 편향이다
00:29:51이렇게 생각을 가지고 이 확률분포에서 충분히 요런 케이스도
00:29:55만명 중에 한명은 나올 수 있다
00:29:57이런 마인드를 가지시지 못하고
00:29:59거기에 휘둘려 가지고 성실한 삶을 살고 계시다가
00:30:03이쪽으로 가시게 되면은 높은 확률로 부는 줄어들게 되겠죠
00:30:07그래서 물론 뭐 세세하게 이게 좀 더 오른쪽으로 가야 된다든지
00:30:11아니면 이게 뭐 좀 더 펑퍼짐하게 돼야 된다든지
00:30:13그런 부분을 차치하고
00:30:15제가 지금 말씀드리고 싶은 것은
00:30:17어떤 부를 쌓아가는 거 아니면 재테크 아니면 주식시장
00:30:20그런 부분들은 이렇게 확정적인 결정론적인 그런 세상이 아니고
00:30:25요렇게 분포로 이뤄지는 확률적인 세상이라는 거
00:30:28내가 제대로 올바른 방법으로 주식 투자를 해도
00:30:31시장 상황이 안 좋고 여러 가지 뭐 이벤트가 나쁘게 터지고 해서
00:30:35이 밑으로 갈 수도 있고
00:30:37이렇게 잘못된 뭐 카지노 도박을 해도
00:30:39진짜 우연치 않게 그 사람이 가서
00:30:41어쨌든 누군가는 잭팟이 나오니까
00:30:43그렇게 잭팟이 나올 수도 있는 거고
00:30:45그렇게 세상은 요렇게 확률적 우위가 없는 행동을 한다고 해서
00:30:49여기 딱 고정되어 버리는 것이 아니고
00:30:51이렇게 확률적인 분포 속에서 여기서 살게 되면서
00:30:55요런 행동을 해도 여기 올 수도 있고
00:30:57올바르게 살려고 해도 여기 올 수도 있고
00:30:59그런 거다
00:31:00근데 요런 행동들을 반복하게 되면 어쨌든
00:31:03여기 수렴하게 되고
00:31:04이 사람들은 여기 수렴하게 된다
00:31:06고 생각만 가지고 계셔도
00:31:08이런 사람들이 나와서 떠들던지
00:31:10아니면 요런 거 관련돼서 어떤 유혹을 받더라도
00:31:13중심을 좀 잡는 데 도움이 되지 않을까
00:31:16그런 생각을 해서 요 그림을 한번 준비해 봤습니다
00:31:19그래서 다시 퀀트 얘기로 돌아가서
00:31:21퀀트의 한계는 사실상 과거 데이터에 의존한다는 것이거든요
00:31:25과거 패턴이 반복된다는 가정하에 진행하는 백테스팅이기 때문에
00:31:29그게 이제 퀀트의 한계고
00:31:31그 일부에서 말씀드린 마켓 레짐
00:31:33코로나 같은 이벤트가 터졌을 때
00:31:35시장 체제 시장 성질 자체가 이제 바뀌어 버리면서
00:31:38과거 패턴들이 전혀 이제 먹히지 않는 거죠
00:31:41그래서 작년에 코로나 터지고 보시면은
00:31:43요게 평균적인 미국 뮤추얼 펀드의 수익률
00:31:46요게 평균적인 헤지 펀드 수익률
00:31:48그 다음에 이게 퀀트 뮤추얼 펀드
00:31:50그 다음에 이게 퀀트 헤지 펀드
00:31:52그 다음에 이건 러셀 지수 요렇게인데
00:31:54보시면 요 퀀트가 훨씬 더 언더 퍼포밍을 하죠
00:31:57그리고 팩터 중에서도 모멘텀 팩터 외에는
00:32:00요 밤새기 미국 주식시장인데
00:32:02다른 팩터들은 전체 주식시장보다 다 언더 퍼포밍을 했고요
00:32:06그 다음에 요런 팩터 인베스팅 말고
00:32:08알파를 이제 찾는 그런 부분은
00:32:10요새 뭐 대한데이터 요런 게 화두가 되고 있지만
00:32:14사실은 요런 분야도 퀀트들이 데이터 비용도 어마어마하고
00:32:18진짜 알파를 찾는데 드는 비용이 점점점 증가하고 있다
00:32:22마치 냉전 시대 군비 경쟁처럼
00:32:24정말 참신한 아이디어
00:32:26아직 발견되지 않은 수익성 좋은
00:32:28그런 초과 수익을 계속 주는 패턴은
00:32:30찾기가 점점점 힘들어지는데
00:32:32그걸 찾는 비용은 계속 뻥튀기 되고 있다는 거죠
00:32:34그래서 그런 투입 비용 대비 한계의 초과 수익이 감소하고 있고
00:32:38그래서 지금 뭐 퀀트 해지 펀드나 그런 데 있는 지인들한테 물어보면
00:32:42과거에는 어떤 초과 수익을 내는 되게 좋은 전략을
00:32:46엄청 리서치 해가지고 발견해 놓으면은
00:32:48예를 들어서 1년 동안 그게 지속이 됐다
00:32:52그러다가 이제 서서히 수익성이 악화되고
00:32:54그렇게 뭐 조정을 해 주고 해야 되는데
00:32:56이제는 그게 4개월에서 6개월로 짧아졌다고 하더라고요
00:33:00왜냐 점점 이런 퀀트들의 경쟁도 빡세지고
00:33:04그 다음 퀀트들도 이직을 하면서
00:33:06그런 전략들이 평준화 되기도 하고
00:33:08또 퀀토피안이나 아니면 퀀토피안은 지금 셧다운 했지만
00:33:11다른 그런 백테싱 플랫폼들이 엄청나게 많습니다
00:33:14이제 뭐 몇 십 개 되는 것 같은데
00:33:16그러면서 개인들도 이런 거에 뛰어들고 하면서
00:33:18점점 이제 시장에서 독보적인 알파를 잡고
00:33:22초과 수익을 독보적으로 내는 게 힘들어지고 있다
00:33:25이렇게 레드오션이 되어 간다는 거죠
00:33:27그런 면에서 이제 퀀트와 대비되는 어떤 인간의 판단
00:33:30그런 거에 장점은 적은 데이터로 추론이 가능하다는 거예요
00:33:34예를 들어서 코로나 같은 경우에
00:33:35정말 유일무이한 그런 어떤 이벤트죠
00:33:38그럼 과거에 뭐 코로나 같은
00:33:40판데믹이 있었을 경우가 많이 없기 때문에
00:33:43과거 데이터에서 이제 뭐 패턴을 찾거나 그런 게 불가능한데
00:33:46그렇게 한 번밖에 없는 케이스에서도
00:33:49뭐 사람들은 뭐 1920년대 스페인 독감을 분석한다든지
00:33:53아니면 여러 가지 어떤 삶의 지혜를 토대로
00:33:56합리적인 추론을 하는 게 가능하다는 거죠
00:33:58그렇기 때문에 어떤 주식 시장에서도
00:34:00계량화, 퀀트화가 진행되는 그런 추이를 보시면은
00:34:03데이터 개수가 엄청나게 분초 단위로 촘촘하게 많은
00:34:07하이프리컨시 트레이딩부터 자동화가 시작돼서
00:34:09점점 더 단타 치는 트레이더들은 힘들어지고 사라져가고
00:34:13그 반면에 아직 뭐 연 단위로 데이터 개수가 적은
00:34:16그런 장기 투자 분야는 아직까지 사람이 추론하는 그런 부분들이 많고
00:34:21그래서 해지 펀드들도 이제 장기 투자하는 쪽은
00:34:24요새 뭐 퀀터멘달 이런 걸 하긴 하지만
00:34:26그래도 요런 펀드 매니저들이 그런 재량적 자의적 판단을 많이 한다
00:34:31그런 부분이 있습니다
00:34:32그래서 어쨌든 역사의 흐름은 퀀트에게 있는 게 맞고
00:34:35점점 앞으로 계량화가 진행될 것이지만
00:34:38범용 인공지능 그러니까 본인이 학습한 테스크가 아닌
00:34:42새로운 문제에 직면했을 때
00:34:44다른 테스크에서 오는 그런 경험이나 그런 부분들을
00:34:47이제 추론해 가지고 새로운 테스크를 할 수 있는
00:34:49그런 인공지능은 최소한 수십 년을 걸리기 때문에
00:34:52원샷러닝 메타러닝 이런 것들이 연구가 진행 중이지만
00:34:55전 여전히 먼 미래라고 보기 때문에
00:34:58아직까지 뭐 주식시장에서도 인간을 완벽히 대체할 순 없다
00:35:02그런 생각을 하고 있고
00:35:03근데 그럼에도 불구하고 어쨌든 역사의 흐름은 미래로
00:35:06계량화되고 컨투화되고 있다는 건 부정할 수 없습니다
00:35:09아무리 마켓 레짐과 패러다임 변화에 약한 모습을 보이더라도
00:35:12아무런 원칙도 없고 복귀도 없이 뇌동매매하거나
00:35:15감정에 휘둘리는 인간보다는 월등한 모습을 보여요
00:35:19그래서 본인이 정말로 트레이더를 업으로 삼고 성공하고 싶다면
00:35:23제가 보기에 대충 한 세 가지 방법이 있습니다
00:35:26첫 번째는 개인적인 판단으로 트레이딩을 한다면
00:35:29여러 가지 계량적인 분석과 뭐 센티먼트 모델
00:35:33그런 거의 보조를 좀 받으면서
00:35:36뉴스나 시향 분석이나 아니면 시나리오 분석
00:35:39그렇게 퀀트 알고리즘들이 잘 할 수 없는
00:35:41그런 새로운 이벤트에 대한 분석과 리서치
00:35:43그런 부분들을 더해 가지고
00:35:45이제 너무 잦은 그런 하이 프리퀸시 트레이딩 분야가 아니고
00:35:48데이 트레이딩에서 대충 스윙 그 사이에
00:35:51이제 상주하면서 매매를 하는 코론 트레이더
00:35:54이제 저는 이제 개인 매매 차원에서 이런 길을 걷고 있고요
00:35:57예를 들어서 옵션 매매 데이터를 다 프로세싱 해 가지고
00:36:00거기에 머신러닝을 좀 적용 해 가지고
00:36:03시그널을 조금 나오게 하고
00:36:05그 다음 뭐 뉴스 데이터를 다 긁어 와 가지고
00:36:07센티먼트 모델을 이제 학습시켜 가지고
00:36:09그거의 시그널 좀 본다든지
00:36:11그런 걸로 자동 매매하는 것이 아니고
00:36:13제가 제 판단에 그 부분을 참고해서
00:36:16현재의 시황이랑 연준의 그런 동향이나
00:36:19뭐 그런 것까지 다 참고해서
00:36:21이제 매매 판단으로 이어지는
00:36:23그런 이제 형식이 있고요
00:36:24두 번째로는 이과 다니시는 그런 뭐
00:36:26학부생 그런 분들이라면은
00:36:28만약에 기관에서 퀀트 하시고 싶으시면은
00:36:31진짜 제대로 된 그런 이공계 박사 공부를 해 가지고
00:36:34이제 기관에서 기관 퀀트가 되셔도 되고
00:36:36세 번째는 지금 뭐 퀀트 매매 하시는 분들
00:36:39그런 경우에는 기관들이 건드리지 않는 니치가 있습니다
00:36:42고기를 공략하는 어떤 개인 퀀트 매매를 하시던지
00:36:46대충 요렇게 세 가지 방법이 있지 않을까 싶습니다
00:36:49그래서 기관이 건드리지 않는 니치 예가 뭐냐면은
00:36:52캐파시티가 몇십억 미만인 전략
00:36:55요런 전략에는 기관이 리소스를 쓰지 않습니다
00:36:58요 캐파시티는 이제 투입 자금을 늘리면 늘릴수록
00:37:01얼마나 수익률이 저하되는지
00:37:03뭐 거래비용 슬리피지 뭐 요런 부분도 있을 것이고
00:37:05유동성 문제도 있을 것이고
00:37:07뭐 고런 부분인데
00:37:08대충 50억에서 100억이 마지노선이 아닐까
00:37:11고런 생각을 하거든요
00:37:12다시 말해서 요 정도만 되어도 캐파시티가 저하되는
00:37:15그런 전략은 기관들이 건드리지 않습니다
00:37:18요런 데 노력 투입해 봤자 별로 먹을 게 없기 때문에
00:37:21근데 개인의 입장에서 50억에서 100억까지
00:37:24자금을 늘려도 수익률 저하가 되지 않으면은
00:37:27충분하죠 사실 이 정도면
00:37:29그래서 요런 니치를 잘 찾으셔가지고
00:37:31그런 비효율을 잘 찾으셔서
00:37:33이제 수익을 내시면 됩니다
00:37:34그러면은 어떻게 하면 제대로 공부할 수 있을까
00:37:38퀀트 매매 알고리즘 매매 이런 거에 관련해서
00:37:40어떤 식으로 뭐 커리큘럼을 짤지
00:37:42개괄적으로 말씀드리면은
00:37:44사실 뭐 다양한 루트가 있지만
00:37:45대충 정리해 보면은
00:37:47첫 번째는 저는 코딩은 무조건 배워야 한다고 생각합니다
00:37:50코딩을 못하고 엑셀을 쓰는 퀀트는 퀀트가 아니에요
00:37:53아무리 엑셀이 펑션이 많다고 해도
00:37:56절대적으로 제한적인 그런 툴이고
00:37:59다룰 수 있는 데이터 개수도 좀만 많아져도
00:38:01엑셀이 얼어버리고
00:38:02최소한 파이썬이라도 공부를 하셔야 됩니다
00:38:05그래서 진짜 뭐 누구나 막 백테슨을 막 돌리는
00:38:08그런 뭐 재무제표 지표나 테크니클 지표
00:38:11그렇게 이미 뭐 남들이 수천번 돌린 그런 전략
00:38:14구분에서 과체적화를 할 게 아니라면은
00:38:17진짜 본인이 참신한 아이디어를 전략으로 만들어 보고
00:38:20진짜 블루오션을 찾고 니치를 찾고
00:38:23초과 수익을 내려고 하면은 무조건 코딩을 하셔야지
00:38:26그런 아이디어들을 유연하게 실현을 할 수가 있다
00:38:29그런 말씀을 드리고
00:38:30그 다음 당연한 거지만
00:38:31통계의 기본을 탄탄하게 하셔야 됩니다
00:38:33최소한 이건 정말 최소한 학부 레벨의 통계학
00:38:37베이지안 통계
00:38:38요 정도는 뭐 수업 한두 개
00:38:40고정도는 꼭 들으셔야 되고요
00:38:42그 다음 시계열 분석에 대해서
00:38:44마리마 코인티그레이션 칼만필터
00:38:46뭐 요런 부분에 대해서도 배우지만
00:38:48전반적으로 시계열이라는 데이터를 다룰 때
00:38:51어떤 부분을 조심해야 되고
00:38:52어떻게 처리하고 뭐 그런 부분들
00:38:55그 다음 이제 요새는 기계학습
00:38:57회기분석도 사실은 엄밀히 말하면 기계학습 중에 하나고
00:39:00뭐 기계학습 머신러닝에
00:39:02뭐 svm이나 뭐 랜덤 포러스트
00:39:05아니면 뭐 아다 부스트
00:39:07뭐 엄청나게 알고리즘 들이 많아요
00:39:09근데 공부하실 시간 있으면 다 하셔도 되지만
00:39:12저는 개인적으로 회기분석
00:39:14라이트 gbm
00:39:15아니면 xg 부스트
00:39:16그 다음 딥러닝
00:39:17그 다음 비지도 학습
00:39:18뭐 클러스터링이나 그런 부분
00:39:20그 다음에 이제 자연어 처리
00:39:22플러스 강화학습도 요새는 트레이딩에 조금 적용을 많이 하는 추세고요
00:39:26요 정도 이제 공부하시면 되고
00:39:28그 다음 매우 매우 중요한 부분이 영어
00:39:30퀀트 관련해서 한글 자료는 아직 매우 매우 열악합니다
00:39:33절대로 한국의 퀀트들이 뭐 미국에 비해서 뒤떨어진다
00:39:37이런 얘기는 아니에요
00:39:38한국에도 정말 훌륭한 퀀트들 많습니다
00:39:40근데 그렇게 훌륭한 퀀트분들은 전부 대부분 이제 영어 자료에 능숙하시기 때문에
00:39:46딱히 고런 부분들을 한글로 이렇게 옮기지 않거든요
00:39:49그래서 대다수의 퀀트 자료들이 거의 대부분 이제 영어로 이루어져 있고
00:39:53한국의 뭐 퀀트 학습 공부나 고런 부분들 뭐 한글 자료가 있다고 하면은
00:39:58제가 이제까지 본 부분들은 굉장히 기초적인 어떤 대중적인 레벨의 그런 자료들은 한글도 있긴 한데
00:40:03조금 더 깊이 들어가면은 아직까지 한글 자료는 좀 열악해서 꼭 영어를 하셔야 되고
00:40:11그리고 그런 뭐 퀀트 파이낸스 관련 논문들
00:40:14퀀트 해지 펀드들도 요런 논문 출판에서 굉장히 많은 아이디어를 계속 이제 소싱 해가지고 테스트를 하고
00:40:21고런 식으로 하기 때문에 요런 논문들 많이 읽어 보시고
00:40:24그러면 와 이거 언제 다 이렇게 공부하냐 그런 생각을 하실 수도 있는데
00:40:28이걸 전부 다 다 끝내고 시작할 필요는 없어요
00:40:32대충 통계 기초를 탄탄해 하시고 나서
00:40:35한 2, 3번까지는 제 생각에 그렇게 뭐 오래 걸리진 않거든요
00:40:39이과 베이스가 있으신 분이면은 이미 아시거나 아니면 뭐 6개월 정도
00:40:44그래서 대충 2, 3번만 돼도 그냥 새로운 방법론을 공부해 나가시면서
00:40:48하나씩 전략을 짜보고 같이 공부를 하셔도 무방하다
00:40:52그런 말씀을 드리고
00:40:53그래서 실제로 요런 부분에 대해서 제가 공부한 자료나 그런 강의 자료들을
00:40:57다 정리해 놓은 게 있는데 두께가 딱 요 정도 됩니다
00:41:00근데 요게 이제 양면이거든요
00:41:02그래서 A4로 한 500페이지, 600페이지, 600페이지 정도 되는 거 같은데
00:41:07이과적인 베이스 그러니까 수학, 통계, 물리
00:41:11요런 거를 학부 때 하신 분들은 대충 6개월에서 1년 정도
00:41:15빡세게 공부하시면 될 거 같고
00:41:18이과적인 베이스 없으신 분들은 한 1년에서 3년 정도 잡으셔야 될 거 같고
00:41:23그 언저리로 그렇게 생각을 하시고 커리큘럼을 좀 짜가지고 공부를 하시면은
00:41:28사실 요런 부분들이 그냥 퀀트 매매 뿐만이 아니고
00:41:31요새는 데이터 과학이나 개발자들이나 굉장히 다양하게 도움이 많이 되시니까
00:41:36뭐 차트 매매 한다고 막 차트 계속 분석하고 이런 거는 다른 분야에 별로 쓰임이 없잖아요
00:41:41그래서 요런 부분에서 잘 안 되면은 그 쏟은 시간들이 다 쓸모가 없게 되는데
00:41:46요런 부분들은 그래도 본인의 어떤 본질적인 실력도 높이고 커리어 면에서도 굉장히 좋다
00:41:52그런 말씀을 드리고 그리고 이제 백테스팅 툴에 대해서 제가 좀 검색을 해보다가
00:41:57이제 레딧에서 발견했는데 요 링크로 들어가시면은 백테스팅 관련해서
00:42:02알고리즘 트레이딩 그런 관련 서비스나 사이트들이 있습니다
00:42:06그래서 저는 옛날에 써봤던 것들에는 뭐 콘토피언도 써봤고
00:42:10퀀트커넥 써봤는데 요것도 괜찮고요
00:42:13요거는 개인은 아마 월 8달러 내야 되는 걸로 알고 있는데 꽤 괜찮았고
00:42:18근데 뭐 광고 아니고 당연히 뭐 다른 툴들을 안 써봤기 때문에
00:42:23이거를 막 대단히 추천한다 그런 얘기는 아니고
00:42:26국내는 제가 검색해 보니까 뭐 백테스트.kr 그 다음 젠포트 요런 서비스들이 있는데
00:42:32제가 실제로 써본 적은 없어가지고 뭐라고 말씀은 못 드리지만
00:42:36어쨌든 국내 툴들도 많이 발전을 하면 좋겠죠
00:42:39근데 전반적으로 어떤 어떤 부분만 백테스팅 할 수 있게 이렇게 한정된 사이트보다는
00:42:44어떤 인프라가 있어가지고 거기서 여러가지 뭐 코딩 언어들을 지원해줘가지고
00:42:50내가 코딩하는 코드를 그 인프라 안에서 이제 확장처럼 이제 연결시켜서 백테스팅 하고
00:42:56그런 사이트를 추천합니다
00:42:58왜냐하면은 그런 유연성이 있어야지
00:43:00내가 정말 참신한 아이디어를 실제로 백테스팅 해 보고 구현해 보고
00:43:03그러면서 초과 수익을 낼 수 있기 때문에
00:43:07그래서 퀀트 매매를 진짜 내가 잘하고 싶고 이 길로 가고 싶다 하면은
00:43:11꼭 코딩 공부를 하셔서
00:43:13본인이 그런 전략 부분은 코딩하고
00:43:15그 나머지 인프라 부분들은 다 만들어져서 서비스 해주는
00:43:19그런 툴들을 좀 사용하는게 좋지 않을까
00:43:22그런 말씀을 드리고
00:43:23근데 뭐 여기 들어가 보니까 워낙 서비스들이 많아가지고
00:43:26뭐 제가 뭐 어떤게 좋다 이런 말씀을 못 드리겠고
00:43:29그래서 코딩도 해야되고
00:43:31이렇게 할게 많다
00:43:33이렇게 생각하실 수도 있고
00:43:34어디 쉬운 방법은 없나
00:43:36그런 생각을 하실 수도 있지만
00:43:37마법공시 같은 전략은 직관적이고 싶지만
00:43:4020년 동안 다른 분야처럼
00:43:42금융계도 굉장히 변하고 발전해 왔습니다
00:43:45다른 모든 분야에서는
00:43:4780년대 90년대 기술을 아직까지 쓰는 분야는 없거든요
00:43:50근데 이상하게 주식시장에는
00:43:5280-90년대 전략들이 아직도 개미들한테 와가지고
00:43:56또 유행을 하고
00:43:57그런 현상들이 나타나는데
00:43:59세상에 그렇게 직관적이고 쉽게 돈 버는 방법은 없다고 생각하셔도 됩니다
00:44:03그저 주식시장의 확률과 변동성 때문에
00:44:06그렇게 노력하지 않고 쉬운 방법 써도
00:44:09돈 번 사람이 나올 수도 있고
00:44:10노력하고도 잃는 사람이 나올 수도 있고
00:44:13그런 현상을 만들어내지만
00:44:15그래도 그런 모습을 볼 때
00:44:16거기에 혹하지 말고
00:44:17현실을 직시하고
00:44:18아까 전에 그런 확률분포
00:44:20그걸 생각하시면서
00:44:22본인은 어떤 확률분포를 선택할 것인지
00:44:25어렵지만 오른쪽으로 가는 것을 선택할 것인지
00:44:28아니면 왼쪽에 있는 거지만
00:44:29변동성을 높여가지고
00:44:31내가 여기 갈 수 있을까
00:44:32여기를 한번 도박을 해보든지
00:44:34거기에 선택을 하셔야 된다
00:44:36그런 말씀을 드리고요
00:44:37그래서 마무리는 저도 오징어 게임
00:44:40요새 재밌게 봤는데
00:44:41이 오일남 할아버지가
00:44:42마지막에 하셨던 말씀이
00:44:44되게 기억에 남더라고요
00:44:45그 임종 직전에
00:44:46돈이 아주 적은 사람과
00:44:48돈이 아주 많은 사람의 공통점이
00:44:50뭔지 아냐면서
00:44:51재미가 없다고
00:44:52말씀을 하시거든요
00:44:54그래서 저는
00:44:55실제 저희 삶에서
00:44:56재미와 행복은
00:44:57돈이 적은 상태에서
00:44:59많아지는 과정에서 있는 것이지
00:45:01그런 과정을 어떻게 다 건너뛰고
00:45:03부자가 되는 것은
00:45:04의미가 별로 없다고 생각하거든요
00:45:06그렇게 가는 것은 사실
00:45:08재밌고 행복한
00:45:09그런 기억과
00:45:10그런 부분들을
00:45:11다 건너뛰어 버린 것과 같다
00:45:13저도 옛날에 게임
00:45:14아주 아주 좋아했고
00:45:15저는 중학교 때는
00:45:17진짜 게임에 미쳤던 것 같거든요
00:45:18고등학교 때도 그랬지만
00:45:20근데 1인용 게임이
00:45:21언제부터 재미 없어졌냐면
00:45:23치트키를 쓰기 시작했을 때부터
00:45:26스타크래프트에서
00:45:27쇼미더머니 치면
00:45:28순식간에 부자 돼가지고
00:45:29다 이길 수 있죠
00:45:30근데 그런 게임을 이기기 위해서
00:45:32그냥 치트키를 쓰는 것은
00:45:33게임 본연의 목적인
00:45:35그런 이겨내는 과정에서의
00:45:37그런 재미들을 사실은
00:45:38다 포기해 버리고
00:45:39게임을 지루하게 만드는 것처럼
00:45:41저희 삶에서도 사실 뭐
00:45:43현실이 힘들고 하면
00:45:44아 돈 많았으면 좋겠다
00:45:46그런 생각을 하고
00:45:47실제로 돈이 많아지면서
00:45:49행복해지기도 하죠
00:45:50근데 그 돈 자체
00:45:51결과 자체에서의
00:45:53그런 행복은
00:45:54쉽사리 권태로 이어질 뿐이고
00:45:56그 과정이 사실은
00:45:57정말 노른자위의 행복이다
00:45:59그런 진부한 말씀을 좀 드리면서
00:46:01오늘 영상 마무리 하도록 하겠습니다
00:46:03그러면은
00:46:04또 다른 영상으로 찾아뵙겠습니다
00:46:06감사합니다

Key Takeaway

퀀트 투자는 과학적인 검증 수단이지만, 통계적 유의성에 대한 이해 없이 진행하는 맹목적인 백테스팅은 오히려 시간 낭비와 큰 손실을 초래하는 독이 될 수 있습니다.

Highlights

백테스팅은 다다익선이 아니며, 과도한 시뮬레이션은 무작위 패턴을 시그널로 오인하게 만드는 '과체적화(Overfitting)' 문제를 야기함

투자 아이디어를 '비퀀트적 언어'인 경제학적 논리로 설명할 수 있어야 데이터 스누핑의 함정에서 벗어날 수 있음

전략 검증 시 샤프 지수가 2를 넘으면 의심해야 하며, 매매 타이밍이나 파라미터를 살짝 변경해도 수익률이 안정적인지 확인하는 다각도 의심이 필수적임

본인의 전략에 적합한 벤치마크를 설정하여 상대적인 초과 수익을 평가해야 하며, 단일 전략에 몰빵하기보다 전략 분산을 통해 리스크를 관리해야 함

퀀트 투자의 핵심은 코딩 실력과 통계학적 기초이며, 단순한 툴 사용을 넘어 파이썬 등을 활용한 유연한 전략 구현 능력이 중요함

Timeline

퀀트 투자의 오해와 올바른 접근 태도

월가아재는 퀀트 투자가 필연적인 흐름이지만, 이에 대한 과장된 희망과 맹신을 경계해야 한다고 강조하며 영상을 시작합니다. 특히 통계적 기초 없이 잘못된 백테스팅 결과를 믿고 대출까지 받아 큰 손실을 본 구독자의 안타까운 사례를 공유합니다. 단순히 감으로 하는 것보다 퀀트가 낫다는 생각은 착각일 수 있으며, 유의미성 없는 검증은 오히려 리스크를 키우는 결과를 초래합니다. 필자는 세상에 공짜는 없다는 상식적인 원칙을 바탕으로 기본기를 갖춘 접근이 필요함을 역설합니다. 이 섹션은 퀀트 투자를 시작하기 전 반드시 갖춰야 할 심리적 태도와 리스크 관리의 중요성을 다룹니다.

백테스팅의 함정과 p-value 해킹의 위험성

백테스팅은 많이 할수록 좋은 것이 아니라 오히려 과체적화(Overfitting) 문제를 심화시킨다는 점을 수학적 논거와 함께 설명합니다. 무작위로 움직이는 데이터에서도 백테스팅을 반복하다 보면 우연히 좋은 패턴을 발견하게 되는 'p-value 해킹' 현상을 경계해야 합니다. 통계학적 개념인 p-value를 주린이의 눈높이에서 여론조사 사례를 들어 쉽게 풀이하며, 우연에 의한 결과를 실력으로 착각하는 위험을 지적합니다. 실제로 랜덤 워크 모델에서도 백테스팅 횟수가 많아지면 높은 샤프 지수를 가진 전략이 발견될 수 있다는 실험 결과를 제시합니다. 결국 절제 없는 백테스팅은 미래 예측력이 전혀 없는 과거의 소음에 불과한 데이터를 픽업할 뿐입니다.

경제학적 논리와 모델 유연성의 제한

데이터가 적은 환경에서는 모델의 유연성을 제한해야 과체적화를 피할 수 있으며, 이를 위해 '비퀀트적 언어'로 전략을 설명하는 과정이 필수적입니다. 단순히 숫자를 짜 맞추는 데이터 스누핑에서 벗어나, 왜 이 전략이 경제학적으로 초과 수익을 낼 수 있는지 투자 아이디어를 정립해야 합니다. 딥러닝과 같은 복잡한 모델을 제외하고, 일반 개인 투자자가 백테스팅 툴을 쓸 때는 경제학적 상식에 부합하는 아이디어를 먼저 세우고 검증에 들어가야 합니다. 아무 의미 없이 파라미터를 바꾸며 백테스팅을 돌리는 행위는 데이터를 고문하여 원하는 답을 얻어내는 것과 다름없습니다. 이 과정은 전략의 견고함을 확보하기 위한 가장 기초적이면서도 강력한 방어 기제라고 할 수 있습니다.

다각도 전략 검증과 올바른 벤치마크 설정

백테스팅을 통과한 전략은 '수익이 보장된 것'이 아니라 '나쁘다고 증명되지 못한 것'일 뿐이라는 겸손한 태도로 다각도의 의심을 수행해야 합니다. 샤프 지수가 지나치게 높다면 룩어헤드 바이어스나 오버피팅을 의심하고, 수수료와 슬리피지 같은 비용 가정을 보수적으로 조정해 봐야 합니다. 또한 매매 타이밍을 며칠 옮기거나 파라미터를 살짝 변경했을 때 수익률이 급락한다면 그 전략은 불안정한 과체적화 결과일 가능성이 큽니다. 자신의 전략 성격에 맞는 적절한 벤치마크를 설정하여 시장 대비 우위를 정확히 측정하는 것도 잊지 말아야 할 기본 중의 기본입니다. 성장주 전략을 S&P 500이 아닌 나스닥과 비교하는 식의 정교한 벤치마킹이 실력을 가늠하는 척도가 됩니다.

전략 분산과 퀀트의 장단점 및 한계

아무리 완벽한 전략이라도 실제 수익률은 과거와 다를 수 있으므로, 상관관계가 낮은 여러 전략으로 분산 투자하여 샤프 지수를 높여야 합니다. 퀀트 투자는 계량적 사고를 가능하게 하지만 과거 데이터에 의존한다는 본질적 한계가 있으며, 코로나19와 같은 급격한 마켓 레짐 변화에는 취약할 수 있습니다. 최근 퀀트 간의 경쟁 심화로 인해 알파를 찾는 비용은 증가하고 초과 수익의 지속 기간은 짧아지는 추세입니다. 필자는 어설픈 백테스팅이 운 좋게 수익으로 이어지는 '초보자의 행운'이 가장 위험하며, 이는 결국 더 큰 리스크 테이킹과 파멸로 이어진다고 경고합니다. 퀀트의 장점을 취하되 그 이면의 한계를 명확히 인지하는 것이 장기 생존의 열쇠입니다.

확률적 세계관과 부의 형성 과정

재테크와 주식 시장은 결정론적인 세상이 아닌 확률 분포로 이루어진 세계임을 이해하는 것이 중요합니다. 실력이 좋아도 운이 나빠 손실을 볼 수 있고, 잘못된 방법으로도 운 좋게 대박을 터뜨리는 생존자 편향 사례가 존재함을 시각적 도표로 설명합니다. 중요한 것은 일시적인 결과가 아니라 자신이 어떤 확률 분포를 선택하여 반복적인 행동을 할 것인가에 대한 결정입니다. 도박과 같은 왼쪽 분포의 삶을 살 것인지, 어렵지만 실력을 쌓아 오른쪽으로 수렴하는 분포를 선택할 것인지에 대한 통찰을 제공합니다. 이는 단순한 투자 기법을 넘어 삶을 대하는 태도에 대한 철학적인 조언을 담고 있습니다. 무작위성이 지배하는 세상에서 중심을 잡기 위한 확률론적 사고의 중요성을 강조합니다.

성공적인 트레이더를 위한 커리큘럼과 마무리

성공적인 트레이더가 되기 위해 개인적 판단과 계량 분석을 결합하거나, 기관이 건드리지 않는 틈새시장을 공략할 것을 제안합니다. 특히 코딩(파이썬)과 기초 통계학, 시계열 분석, 기계학습 등을 포함한 구체적인 공부 로드맵을 제시하며 실질적인 가이드를 제공합니다. 한글 자료의 한계를 지적하며 영어 논문과 원서를 활용한 심도 있는 공부를 권장하고, 유연한 백테스팅 환경을 갖춘 툴의 활용을 추천합니다. 마지막으로 오징어 게임의 대사를 인용하여, 돈을 버는 결과 자체보다 그 목표를 향해 치열하게 노력하고 성취해 나가는 과정 속에 진정한 행복이 있음을 설파합니다. 치트키를 쓴 게임이 재미없듯, 삶의 재미와 행복도 고통스러운 과정을 이겨내는 데 있다는 따뜻한 격려로 마무리합니다.

Community Posts

View all posts