[Wall Street Ajae] Fakta dan Mitos Investasi Kuantitatif - Bagian 1: Melakukannya Setengah-Setengah Akan Menjadi Racun

Bahasa Indonesiaالعربية Deutsch English Español Français हिन्दी 日本語 한국어 Português 中文

월월가아재의 과학적 투자

주식 투자마케팅/광고초보 재테크AI/미래기술

Transcript

00:00:00Baik dalam 10, 20,

00:00:03atau 30 tahun terakhir,

00:00:04jika kita melihat periode tersebut, ada berapa banyak pola yang menguntungkan?

00:00:09Jawabannya tidak terbatas. Hal ini bahkan bisa dibuktikan secara nyata.

00:00:12Halo semuanya, saya Wall Street Guy.

00:00:21Hari ini kita akan membahas tentang investasi kuantitatif (quant).

00:00:24Banyak dari Anda yang bertanya melalui komentar, email,

00:00:26atau pesan pribadi tentang bagaimana cara melakukan trading kuantitatif.

00:00:29Sebenarnya, berdasarkan tujuan dan kurikulum saluran saya ke depan,

00:00:33saya tidak berencana membahas trading algoritma

00:00:36atau investasi kuantitatif dalam waktu dekat.

00:00:38Namun, saya melihat bahwa

00:00:40sekitar 15% dari pelanggan saya melakukan trading kuantitatif,

00:00:44dan ada beberapa hal yang mengkhawatirkan tentang investasi ini belakangan ini.

00:00:48Itulah alasan mengapa saya membuat video ini.

00:00:50Agenda hari ini dimulai dengan klasifikasi dan prinsip dasar quant secara umum,

00:00:53kemudian kita akan melihat gambaran besarnya,

00:00:56lalu membahas 10 hal yang harus diwaspadai dalam trading kuantitatif.

00:00:59Jika Anda mengingat 10 hal ini, Anda tidak akan

00:01:04membuang-buang banyak waktu dalam trading kuantitatif,

00:01:06baik itu dalam hal backtesting

00:01:09maupun penggunaan metodologi yang salah.

00:01:11Saya yakin ini bisa mencegah Anda dari kerugian yang besar.

00:01:15Meskipun ini adalah dasar dari segala dasar,

00:01:18tampaknya kursus berbayar yang mahal di luar sana

00:01:21tidak membahas poin-poin ini secara mendalam.

00:01:24Sebaliknya, kursus-kursus tersebut cenderung

00:01:27memperindah realitas backtesting dan investasi kuantitatif.

00:01:31Jadi, ingatlah 10 hal ini agar saat Anda mencari informasi

00:01:35atau menggunakan layanan investasi kuantitatif apa pun,

00:01:39Anda bisa tetap aman dan melindungi diri sendiri.

00:01:43Sebelum kita mulai, beberapa hari yang lalu saya sempat mengunggah

00:01:47sebuah tulisan pendek dengan nada yang agak emosional,

00:01:49dan sepertinya saya melakukan sedikit kesalahan.

00:01:51Saya menulis bahwa pemasaran viral dan iklan berlebihan

00:01:54mengenai investasi kuantitatif sudah melewati batas.

00:01:55Namun, di kolom komentar, banyak muncul ujaran kebencian

00:01:59terhadap individu atau perusahaan tertentu.

00:02:02Saya menghapus postingan itu karena takut merusak reputasi mereka.

00:02:06Sejujurnya, apa yang mereka lakukan bukanlah hal ilegal

00:02:09seperti grup chat saham ilegal atau perantara akun palsu.

00:02:12Mungkin saya memang terlalu ikut campur urusan orang lain.

00:02:16Namun, di sisi lain, masalah seperti akun pinjaman

00:02:19biasanya digunakan oleh orang-orang yang tahu itu ilegal,

00:02:22tetapi tetap melakukannya karena rasa serakah mereka sendiri.

00:02:25Tetapi jika melihat wacana investasi kuantitatif saat ini,

00:02:28banyak orang biasa yang ingin berusaha secara jujur

00:02:33untuk memperbaiki kondisi finansial mereka,

00:02:35malah bisa menjadi korban saat mereka memasuki bidang

00:02:37investasi kuantitatif ini.

00:02:40hal itu bisa membuat orang salah paham padahal ada bagian yang tidak ilmiah.

00:02:46Because it can cause people to misunderstand, even though it contains non-scientific elements.

00:02:51Grup saham ilegal atau akun palsu sangat jelas pelanggarannya,

00:02:55sehingga orang bisa menghindarinya jika mau.

00:02:56Tetapi dalam hal ini, orang-orang baik yang berniat belajar sungguh-sungguh bisa menjadi korban.

00:03:01Ada klaim bahwa siapa pun bisa menjadi ahli investasi kuantitatif dalam beberapa hari,

00:03:04atau ini adalah strategi yang telah teruji dengan data selama puluhan tahun,

00:03:08atau karena telah menghasilkan keuntungan majemuk 20% selama 10 tahun,

00:03:11maka akan terus seperti itu di masa depan.

00:03:14Mungkin niat mereka tidak jahat dan hanya sekadar berbicara,

00:03:18namun bagi para pemula di dunia saham,

00:03:20beberapa dari mereka mungkin salah paham dan membuat asumsi yang keliru.

00:03:23Hal ini bisa menyebabkan mereka membuang banyak waktu untuk backtesting

00:03:25dan bahkan mengalami kerugian finansial yang nyata.

00:03:27Jika mereka memiliki kepercayaan buta pada hasil backtesting tersebut,

00:03:32padahal menurut peraturan SEC di Amerika Serikat,

00:03:35pemasaran dana investasi seperti itu dianggap ilegal dan akan ditindak.

00:03:38Oleh karena itu, saya berharap mereka yang membahas investasi kuantitatif

00:03:41bisa lebih menghargai beratnya nilai uang orang lain.

00:03:45Saya tidak tahu sampai kapan saya akan terus membuat konten YouTube,

00:03:47tapi saya mengatakan ini bukan untuk terlihat seperti orang baik.

00:03:51Saya mengatakannya karena pernah mengalami masa sulit karena uang

00:03:52di usia pertengahan 20-an, jadi saya tahu bagaimana rasanya.

00:03:56Karena saya sering membahas manajemen mental saat rugi

00:03:58dan berbagi cerita tentang kerugian besar saya saat muda,

00:04:01sepertinya banyak orang yang mengirimkan pesan konsultasi kepada saya.

00:04:05Setiap minggunya, ada beberapa email dari pelanggan

00:04:09yang merasa putus asa karena kehilangan uang hingga miliaran rupiah.

00:04:14Oleh sebab itu, para YouTuber keuangan, saham, atau properti

00:04:16perlu melakukan introspeksi diri sesekali.

00:04:20merasa seolah-olah saya sedang melakukan grup berbayar (leading),

00:04:24Lately, while I've been doing my '80-Day Investment Around the World' journey,

00:04:26jadi saya berpikir harus kembali ke niat awal setelah pasar yang turun ini berakhir.

00:04:29Bagaimanapun, video ini dibuat dengan niat tersebut.

00:04:33Sama sekali tidak ada maksud untuk menyerang individu atau perusahaan tertentu.

00:04:37Pihak pemasaran investasi kuantitatif pun

00:04:40mungkin ada hal yang tidak mereka ketahui saat melakukannya.

00:04:43Mari kita semua menyadari hal ini dan berusaha memperbaikinya bersama.

00:04:46Jadi, saya mohon kepada para penonton untuk tidak

00:04:49menyebutkan nama atau menyerang siapa pun di kolom komentar.

00:04:51Baiklah, pembukaannya sudah cukup panjang.

00:04:55Pertama-tama, mari kita lihat klasifikasi investasi kuantitatif.

00:04:57Istilah “quant” didefinisikan secara sangat luas dan beragam.

00:04:58Jika kita membaginya berdasarkan urutan waktu

00:05:01untuk memudahkan pemahaman, ada yang disebut High-Frequency Trading (HFT).

00:05:04Di dalam HFT, ada tingkatan yang disebut Ultra HFT.

00:05:07Di sini, server diletakkan langsung di lokasi bursa (colocation),

00:05:10pengodean dilakukan di tingkat bahasa mesin,

00:05:12dan mereka sangat memperhatikan performa perangkat keras.

00:05:14Itulah level trading yang sangat cepat.

00:05:19Lalu, ada trading dengan cakrawala waktu yang sedikit lebih panjang,

00:05:20yaitu trading algoritma.

00:05:22Ini menggunakan indikator teknikal atau sistem berbasis aturan (rule-based).

00:05:24Jenis ini banyak dilakukan oleh individu

00:05:28dan mulai populer melalui berbagai platform backtesting.

00:05:29Selanjutnya, ada arbitrase statistik

00:05:33seperti pair trading,

00:05:35yang menggunakan model atau metodologi statistik.

00:05:39Intinya adalah mencari pola masa lalu

00:05:41dengan asumsi bahwa harga akan kembali ke rata-rata (mean reversion).

00:05:42Lalu ada juga investasi faktor (factor investing).

00:05:44Ini cenderung untuk jangka panjang, seperti faktor momentum, nilai (value), atau carry.

00:05:46Tujuannya mencari faktor yang menggerakkan harga dan menemukan alfa.

00:05:48Kemudian, topik yang sedang hangat dalam beberapa tahun terakhir

00:05:50adalah “Quantamental”.

00:05:52Ini adalah metode mengukur dan mengotomatisasi analisis fundamental,

00:05:54serta menambahkan berbagai analisis data alternatif

00:05:59untuk investasi jangka panjang.

00:06:01Dalam konteks yang sama, penggunaan machine learning,

00:06:03big data, dan data alternatif

00:06:06semakin meluas ke berbagai bidang.

00:06:07Klasifikasi ini dibuat untuk mempermudah pemahaman,

00:06:10karena sebenarnya batas-batasnya sangat kabur.

00:06:12Ada yang menyebut seluruh bidang ini sebagai trading algoritma.

00:06:16Jadi, saya akan membahas trading kuantitatif

00:06:18secara umum dan merangkum semuanya jadi satu.

00:06:20Prinsip dari trading kuantitatif adalah,

00:06:23pertama, Anda harus memiliki ide investasi atau hipotesis.

00:06:26Kedua, Anda melakukan backtesting.

00:06:28Yaitu menguji ide atau hipotesis tersebut

00:06:30menggunakan data historis.

00:06:31Jika Anda merasa metode ini bisa menghasilkan uang,

00:06:33Anda menguji apakah secara historis

00:06:35metode ini benar-benar menghasilkan keuntungan.

00:06:37Jika hasil backtesting-nya bagus,

00:06:40baru kemudian Anda melakukan trading riil

00:06:42sambil mengelola risikonya.

00:06:44Itulah empat tahapan prosesnya.

00:06:47Sebenarnya, hingga pertengahan 2010-an,

00:06:50trading kuantitatif adalah wilayah eksklusif institusi,

00:06:51terutama dana lindung nilai (quant funds)

00:06:54yang mempekerjakan banyak doktor di bidang sains dan teknik.

00:06:56Namun kini, hal ini mulai menjadi umum di institusi

00:06:57terutama dalam hal eksekusi.

00:07:00Selain itu, munculnya layanan seperti Quantopian di AS

00:07:01yang mempermudah proses backtesting

00:07:03membuat trading kuantitatif bisa diakses oleh investor individu.

00:07:06Namun di saat yang sama, pemahaman yang keliru

00:07:09tentang investasi kuantitatif juga semakin meningkat.

00:07:13Sebagai contoh,

00:07:16misalkan selama 15 tahun terakhir, jika kita berinvestasi pada perusahaan

00:07:18dengan PBR di bawah 0,9 dan masuk bursa dalam 12 bulan terakhir,

00:07:21hasilnya memberikan imbal hasil tahunan 20,2%.

00:07:23Lalu ketika angka PBR-nya sedikit diubah,

00:07:25hasilnya berubah menjadi 14% atau 17,8%.

00:07:28Banyak orang melakukan backtesting seperti ini,

00:07:30dan karena hasil pertama adalah yang terbaik,

00:07:33mereka memutuskan untuk berinvestasi

00:07:35menggunakan aturan dari hasil tersebut.

00:07:38Ini adalah contoh pemahaman yang salah.

00:07:40Jika Anda merenungkannya baik-baik,

00:07:42proses backtesting hanyalah mencari pola masa lalu

00:07:46yang menghasilkan keuntungan, dengan asumsi

00:07:48bahwa pola tersebut akan terulang di masa depan.

00:07:51Tapi apakah ada jaminan pola itu akan berulang?

00:07:53Dalam jangka waktu 10, 20, atau 30 tahun terakhir,

00:07:56kira-kira ada berapa banyak pola yang menguntungkan

00:07:58selama periode tersebut?

00:08:01Coba hentikan video ini sejenak dan pikirkan.

00:08:03Jawabannya adalah: tak terbatas.

00:08:04Ini bahkan bisa dibuktikan secara matematis.

00:08:07Karena parameter berbagai strategi bersifat kontinu,

00:08:09maka secara teknis ada jumlah strategi menguntungkan yang tak terbatas.

00:08:12Pertanyaannya, berapa banyak dari strategi itu yang akan tetap menguntungkan di masa depan?

00:08:14Inilah inti dari tantangan dalam dunia kuantitatif.

00:08:16Menemukan pola yang menguntungkan di masa lalu

00:08:18adalah hal yang bisa dilakukan siapa saja

00:08:21jika mereka memiliki alat backtesting.

00:08:24Namun, menemukan pola yang bagus di masa lalu

00:08:26DAN akan tetap bagus di masa depan adalah hal yang sangat sulit.

00:08:29Itu seperti mencari jarum dalam tumpukan jerami.

00:08:30Saat saya menjelajahi berbagai blog dan situs di Korea,

00:08:32saya melihat “Magic Formula” karya Joel Greenblatt

00:08:34sangatlah populer.

00:08:36Dia menciptakan sebuah formula sederhana

00:08:38untuk memilih saham berdasarkan kriteria tertentu,

00:08:42dan menulis buku tentang formula ajaib tersebut.

00:08:46Buku itu menjadi viral dan sangat dikenal

00:08:50di kalangan investor individu.

00:08:52Joel Greenblatt sendiri sangat terkenal di dunia hedge fund.

00:08:55Dia mulai berinvestasi sejak tahun 1980-an,

00:08:56dan selama periode itu, dia mencatatkan imbal hasil

00:09:00yang bahkan lebih tinggi daripada Warren Buffett.

00:09:02Itulah mengapa formula ajaibnya mendapatkan banyak perhatian.

00:09:04Namun, jika saya boleh langsung ke kesimpulannya,

00:09:07formula tersebut memiliki keterbatasan tersendiri.

00:09:09Banyak orang yang mengikutinya tanpa memahami risikonya.

00:09:12Strategi kuantitatif tidak semudah hanya memasukkan angka.

00:09:13Ada banyak variabel pasar yang bisa berubah sewaktu-waktu.

00:09:15Oleh karena itu, jangan hanya terpaku pada performa masa lalu.

00:09:17Dia menetapkan rumus untuk memilih saham

00:09:20dan menulis buku tentang rumus ajaib investasi tersebut.

00:09:24Buku itu menjadi topik hangat

00:09:25dan tampaknya sangat dikenal di kalangan investor ritel.

00:09:28Namun, orang ini juga sangat terkenal di dunia hedge fund.

00:09:31Dia mulai berinvestasi sejak tahun 1980-an,

00:09:33dan selama periode investasi tersebut, dia mencatat

00:09:35tingkat pengembalian yang lebih tinggi daripada Warren Buffett.

00:09:37Itulah mengapa “Rumus Ajaib” ini semakin mendapat perhatian.

00:09:40Singkatnya,

00:09:42Greenblatt bukanlah seorang quant (investor kuantitatif),

00:09:44dan hedge fund miliknya tidak berinvestasi hanya dengan rumus ajaib.

00:09:47Keuntungan besar itu bukan hasil dari investasi rumus ajaib saja.

00:09:50Dana tersebut melakukan investasi nilai (value investing)

00:09:52dan juga investasi dalam “situasi khusus” (special situations).

00:09:54Misalnya, seperti peristiwa spin-off,

00:09:57ketika sebuah perusahaan memisahkan diri,

00:09:59terjadi perbedaan harga atau celah pasar,

00:10:01dan dia menggunakan metodologi untuk menangkap keuntungan dari situ.

00:10:04Dia menggunakan metode-metode tersebut secara bersamaan.

00:10:07Dan untuk bagian investasi nilai pun, menurut saya dia tidak

00:10:10hanya menggunakan rumus yang sederhana seperti itu.

00:10:12Tentu saja, hal itu mungkin tercermin dalam kerangka kerjanya.

00:10:14Tapi saya rasa dia tidak mendapatkan hasil itu hanya dengan

00:10:18membeli saham secara mekanis menggunakan rumus tersebut.

00:10:20Jadi, jika kita melakukan backtesting performanya

00:10:22sejak tahun 2005 setelah rumus ajaib ini dipublikasikan,

00:10:26garis abu-abu ini adalah indeks S&P,

00:10:28dan garis hijau ini adalah hasil dari rumus ajaib.

00:10:29Seperti yang Anda lihat, setelah mengalami volatilitas yang tinggi,

00:10:32rumus ini terus menunjukkan performa di bawah pasar (underperform).

00:10:34Hal-hal semacam ini muncul dalam ETF ekuitas sistemik,

00:10:37jadi investasi serupa pun bermunculan,

00:10:40dan seiring dengan pasar yang menjadi lebih efisien,

00:10:42bisa dikatakan keunggulan atau “edge” tersebut telah hilang.

00:10:44Bahkan rumus yang sangat terkenal pun hanya menunjukkan hasil seperti ini.

00:10:48Sangat mudah untuk menemukan pola yang menguntungkan di masa lalu.

00:10:50Anda bahkan bisa menulis buku tentang hal itu.

00:10:53Namun, menemukan pola yang juga akan menguntungkan di masa depan

00:10:56membutuhkan kerja keras yang sangat, sangat, sangat banyak.

00:11:00Jadi, strategi dengan profit 20% setahun yang didapat hanya dari

00:11:03berpikir beberapa hari dan beberapa klik saja itu tidak ada di dunia ini.

00:11:06Contoh lainnya adalah Quantopian.

00:11:08Quantopian adalah startup yang didirikan sekitar tahun 2011,

00:11:12sebuah platform di AS yang membuat backtesting menjadi sangat mudah.

00:11:16Sebanyak 300.000 orang melakukan 12 juta kali backtesting,

00:11:20menguji dan menciptakan strategi quant yang sangat banyak di sana.

00:11:24Miliarder terkenal Steve Cohen bahkan berinvestasi di sana.

00:11:27Dia adalah seorang trader hedge fund.

00:11:29Dan para ahli quant papan atas di Quantopian

00:11:32bahkan menerbitkan makalah penelitian

00:11:34tentang strategi mana yang akan menguntungkan di masa depan,

00:11:37dengan kriteria apa dan metodologi statistik seperti apa

00:11:40yang harus digunakan untuk menyaringnya.

00:11:41Mereka benar-benar melakukan penelitian yang intensif,

00:11:44memilih strategi yang tepat,

00:11:46dan berencana untuk mengelola hedge fund baru dengan strategi itu.

00:11:48Itulah idenya,

00:11:49tapi mereka gagal total.

00:11:51Akhirnya, mereka menutup bisnisnya tahun lalu.

00:11:53Mengapa fenomena seperti ini bisa terjadi?

00:11:55Dan bagi penonton yang ingin mencoba trading atau investasi quant,

00:11:58bagaimana cara menghindari hasil yang mengecewakan seperti ini?

00:12:02Tentu saja, Anda tidak bisa menghindarinya secara sempurna.

00:12:03Dan menurut saya, ini adalah tugas yang sangat sulit.

00:12:07Namun, jika Anda tetap ingin mencobanya,

00:12:10setidaknya ingatlah 10 hal ini

00:12:12dan berhati-hatilah.

00:12:13Saya akan menjelaskannya satu per satu dari sudut pandang tersebut.

00:12:16Hanya dengan mengingat 10 hal ini,

00:12:17Anda bisa menghindari pemborosan waktu akibat backtesting yang salah,

00:12:22serta menghindari kerugian finansial.

00:12:24Tentu saja, backtesting yang baik tidak menjamin keuntungan.

00:12:27Hal pertama adalah Anda harus meragukan data tersebut.

00:12:31Ada orang yang menggunakan data dari Google atau Yahoo,

00:12:34tapi data seperti itu sebenarnya sangat, sangat “kotor”.

00:12:37Jadi, bagi mereka yang ingin memulai trading quant dari nol,

00:12:41data akan menjadi hambatan yang sangat besar.

00:12:45Data gratis seperti itu sangat kotor dan banyak kesalahan.

00:12:47Lalu, dalam proses pembersihan data

00:12:50untuk membuatnya menjadi bersih,

00:12:51Anda mungkin berpikir hanya perlu mencari kesalahannya saja.

00:12:54Namun ternyata, penilaian subjektif dan bias manusia

00:12:57pasti akan ikut masuk ke dalamnya.

00:12:59Mari saya beri satu contoh.

00:13:01Katakanlah sebuah saham diperdagangkan di kisaran 41 hingga 43 dolar,

00:13:05lalu pasar ditutup.

00:13:06Namun menjelang penutupan pasar,

00:13:08seorang trader melakukan kesalahan input order,

00:13:11sehingga satu lembar saham terjual di harga 28 dolar.

00:13:14Maka, secara teknis,

00:13:16harga terendah hari itu adalah 28 dolar.

00:13:18Meskipun orang ini rugi besar karena kesalahannya,

00:13:21harga terendah tetap harus tercatat sebagai 28 dolar.

00:13:24Itu adalah fakta yang terjadi.

00:13:25Lalu bagaimana Anda menentukan harga terendah dan tertinggi?

00:13:28Jika Anda menghapus itu dan mencatat 41 dolar sebagai harga terendah,

00:13:31sebenarnya Anda sedang menghapus transaksi

00:13:34dan harga terendah yang benar-benar terjadi.

00:13:36Tapi jika Anda tidak menghapusnya,

00:13:38misalnya, jika Anda memiliki strategi

00:13:40untuk memasang order beli jika harga anjlok lebih dari 5%

00:13:44dalam waktu 5 menit dalam rentang harga hari itu,

00:13:45maka saat melakukan backtesting,

00:13:47sistem akan mengenali bahwa Anda membeli di harga 28 dolar.

00:13:48Sistem backtesting akan menganggapnya demikian.

00:13:51Maka hasilnya seolah-olah Anda membeli di harga 28 dolar

00:13:53dan langsung menjualnya di harga penutupan 42 dolar,

00:13:55sehingga backtesting akan mencatatnya sebagai keuntungan.

00:13:58Hal ini bisa membuat performa keuntungan strategi ini

00:13:59menjadi sangat menggelembung atau tidak akurat.

00:14:01Tentu saja, jika hanya 1 lembar, Anda bisa menghapusnya.

00:14:03Tapi bagaimana jika kesalahan trader itu

00:14:06sebanyak 10 lembar, 100 lembar, atau bahkan 10.000 lembar?

00:14:09Kasus seperti itu benar-benar ada.

00:14:11Kasus-kasus seperti itu terkadang terjadi beberapa kali.

00:14:14Memang ada kasus berskala besar yang merugikan puluhan miliar won,

00:14:17dan itu memang pernah benar-benar terjadi.

00:14:20Tapi kesalahan input 100 atau 1.000 lembar

00:14:21terjadi lebih sering daripada yang Anda bayangkan.

00:14:23Tentu saja, dalam beberapa tahun terakhir,

00:14:24karena algoritma yang melakukan

00:14:25eksekusi perdagangan,

00:14:27jaring pengaman juga sudah disiapkan.

00:14:29Jadi tidak sesering dulu lagi.

00:14:31Bagaimanapun, data backtesting

00:14:33biasanya menggunakan data sebelum eksekusi algoritma menjadi umum,

00:14:36seperti data dari tahun 2011 atau 2005.

00:14:37Jika Anda melihat ke belakang sejauh itu,

00:14:39kasus-kasus seperti ini akan cukup sering ditemukan.

00:14:41Lalu bagaimana Anda akan menangani hal itu?

00:14:43Juga ada produk yang diperdagangkan

00:14:44di beberapa bursa saham yang berbeda.

00:14:45Untuk produk-produk seperti itu,

00:14:47apakah data dari berbagai bursa tersebut

00:14:49sudah diintegrasikan dengan baik?

00:14:50Misalnya, apakah harga terendah, tertinggi,

00:14:52data perdagangan, dan volume penjualannya

00:14:53sudah terintegrasi secara bersih?

00:14:56Atau,

00:14:57apakah Anda melakukan backtesting dengan data yang tidak lengkap

00:14:59karena hanya mengambil data dari beberapa bursa saja?

00:15:01Jika biaya datanya murah,

00:15:02kemungkinan besar datanya tidak lengkap.

00:15:04Dan saat menghitung MDD (Maximum Drawdown),

00:15:05apakah Anda menggunakan harga terendah dan bukan harga penutupan?

00:15:07Misalnya, untuk strategi

00:15:09rebalancing bulanan,

00:15:11saat melakukan backtesting,

00:15:13beberapa orang menggunakan data harian

00:15:14tapi hanya memakai harga penutupan saja.

00:15:15Tapi sebenarnya,

00:15:17untuk menghitung penurunan nilai (drawdown),

00:15:18Anda juga harus melihat

00:15:20penurunan nilai di dalam hari yang sama (intraday drawdown).

00:15:21Hal-hal sepele semacam itu,

00:15:22atau saat melakukan backtesting untuk kontrak berjangka (futures),

00:15:24jika produk tersebut memiliki masa kedaluwarsa,

00:15:26bagaimana Anda melakukan rollover kontraknya?

00:15:27Atau dalam kasus backtesting,

00:15:29sering kali data dibuat dengan menyambungkan

00:15:31masa kedaluwarsa kontrak berjangka yang berurutan.

00:15:33Lalu bagaimana Anda memperlakukan

00:15:34rollover kontrak tersebut?

00:15:35Masalah-masalah seperti itu

00:15:37dan masih banyak lagi masalah lainnya.

00:15:38Apakah Anda pernah memikirkan

00:15:39masalah data seperti ini?

00:15:40Atau jika Anda menggunakan layanan backtesting,

00:15:42apakah Anda hanya percaya begitu saja bahwa perusahaan itu

00:15:44sudah memproses datanya dengan benar?

00:15:47Bagian-bagian itu perlu dikonfirmasi.

00:15:51Kesalahan yang sangat banyak sering kali muncul dari masalah data,

00:15:53dan hasil backtesting sering kali

00:15:57menjadi terdistorsi atau bias.

00:15:59Selain itu, salah satu masalah yang datang dari data adalah

00:16:01bias penyintas (survivorship bias).

00:16:04Ini adalah salah satu kesalahan tipikal dalam backtesting.

00:16:06Gambar ini menunjukkan sesuatu tentang

00:16:08Perang Dunia I atau II, saya kurang yakin yang mana,

00:16:10tapi angkatan udara mencoba untuk memperkuat pesawat mereka.

00:16:12Mereka ingin tahu bagian mana dari badan pesawat

00:16:16yang harus diberi pelindung atau baja tambahan.

00:16:18Untuk mengetahui hal itu,

00:16:20para insinyur mengumpulkan semua pesawat

00:16:21yang kembali setelah pertempuran udara,

00:16:24dan menganalisis bagian mana

00:16:26yang paling banyak terkena tembakan.

00:16:28Mereka menyimpulkan, “Oh, bagian ini yang paling sering tertembak.”

00:16:29Jadi mereka memutuskan untuk membuat bagian itu

00:16:33lebih tebal dengan pelat baja atau semacamnya.

00:16:34Tapi ini adalah kesalahan yang sangat besar.

00:16:36Sebab, pada kenyataannya, pesawat yang tertembak di bagian lain

00:16:38seperti mesin atau kokpit

00:16:40semuanya sudah jatuh dan tidak pernah kembali.

00:16:42Jadi, mengambil kesimpulan hanya dari data yang tersedia

00:16:42sangatlah berbahaya.

00:16:44Ini adalah contoh bagus yang menunjukkan hal itu.

00:16:46Dalam investasi saham, bias penyintas berarti,

00:16:49misalnya, jika kita melihat sekarang,

00:16:50Hal ini menunjukkan betapa berbahayanya

00:16:52mengambil kesimpulan hanya dari data yang ada.

00:16:54Dalam investasi saham, yang disebut bias kelangsungan hidup adalah,

00:16:56sebagai contoh,

00:16:57jika kita melihat sekarang,

00:16:59seandainya kita membeli Apple dan Microsoft di tahun 80-an,

00:17:02pasti kita sudah kaya raya.

00:17:03Karena berpikir seperti itu,

00:17:05katakanlah kita menyusun strategi untuk membeli saham teknologi semacam itu.

00:17:08Namun kenyataannya, pada tahun 80-an saat itu,

00:17:10perusahaan yang menjanjikan setingkat Apple atau Microsoft

00:17:13ada lebih dari 30 perusahaan.

00:17:14Dan 28 di antaranya telah lenyap.

00:17:17Jadi, hanya dua perusahaan itu yang bertahan hidup.

00:17:19Hanya mereka berdua yang selamat,

00:17:22tapi dengan melihat mereka,

00:17:23kita berpikir bahwa investasi seperti itu akan sukses besar sekarang.

00:17:27Jadi, melakukan backtesting hanya pada perusahaan

00:17:30yang masih bertahan saat ini sebagai subjeknya,

00:17:32pasti akan membuat tingkat pengembaliannya terlihat menggelembung.

00:17:35Dan tentu saja, semakin lama periode backtesting dilakukan,

00:17:38masalahnya akan menjadi semakin besar.

00:17:40Karena dalam periode yang panjang itu,

00:17:41pasti banyak perusahaan yang ada di awal,

00:17:43namun kemudian menghilang di tengah jalan.

00:17:45Tetapi ternyata banyak investor pemula

00:17:47saat memulai backtesting seperti ini,

00:17:48menentukan “stock universe” di awal.

00:17:51Mereka menentukan cakupan saham mana

00:17:54yang akan diuji melalui backtesting,

00:17:55dan sering kali hanya terdiri dari perusahaan yang ada saat ini.

00:17:58Lalu di dalam cakupan itu,

00:17:59mereka melakukan backtesting dengan berbagai kriteria

00:18:02untuk menentukan bagaimana cara memilih

00:18:05perusahaan yang bagus di antara mereka.

00:18:07Jika dilakukan dengan cara itu,

00:18:08sejak periode backtesting dimulai hingga sekarang,

00:18:11perusahaan yang bangkrut akan otomatis tereliminasi.

00:18:13Seolah-olah kita mengasumsikan bahwa

00:18:16kita memiliki kemampuan dewa saat melakukan backtesting.

00:18:18Maka tingkat pengembaliannya tentu akan jauh lebih tinggi dari kenyataan.

00:18:21Oleh karena itu, saat melakukan backtesting,

00:18:23misalnya jika durasinya 20 tahun,

00:18:25kita harus memulai dengan perusahaan yang ada di tahun 2001

00:18:29sebagai basis datanya

00:18:30dan menjadikannya sebagai ruang lingkup pengujian.

00:18:32Saya ingin menyampaikan hal itu,

00:18:33dan sekadar info tambahan,

00:18:34para investor raksasa atau “super ants” di YouTube pun

00:18:37mungkin saja memiliki masalah bias kelangsungan hidup ini.

00:18:40Memang ada yang menjadi investor sukses berkat kemampuan murni,

00:18:43tapi ada juga yang mengambil risiko sangat besar

00:18:45dengan membeli saham dalam jumlah masif di satu perusahaan,

00:18:48lalu saham itu melonjak tajam

00:18:49sehingga mereka menjadi investor kaya raya.

00:18:51Namun, orang-orang yang melakukan tindakan serupa

00:18:53mungkin ada 30 atau 50 orang lainnya.

00:18:55Dari 50 orang yang mengambil tindakan berisiko tinggi tersebut,

00:18:58hanya satu orang yang berhasil selamat,

00:18:59dan penonton mungkin hanya melihat satu orang yang beruntung itu.

00:19:02Hal ini pun bisa jadi merupakan masalah bias kelangsungan hidup.

00:19:05Jadi, jika pada saat ini kita berpikir,

00:19:06“Aku juga harus jadi seperti dia,”

00:19:08lalu melakukan investasi dengan risiko yang sangat besar,

00:19:11itu tidak menjamin kesuksesan yang pasti,

00:19:13melainkan hanya jika Anda menjadi satu orang yang beruntung dari 50 orang.

00:19:17Hanya dengan menyadari adanya bias-bias seperti ini,

00:19:20kita bisa melakukan investasi yang jauh lebih rasional dan bijaksana.

00:19:22Jadi, saat menggunakan platform backtesting,

00:19:24masalah data yang saya sebutkan tadi

00:19:27atau masalah bias kelangsungan hidup,

00:19:28bisa dibilang Anda menyerahkan semuanya kepada penyedia layanan tersebut.

00:19:31Secara naif.

00:19:32Namun, apakah perusahaan tersebut

00:19:33benar-benar menangani masalah data atau bias tersebut

00:19:35secara sangat ketat

00:19:37dari sudut pandang pengguna, dan mengkhawatirkan

00:19:39tingkat pengembalian investasi yang nyata dari penggunanya?

00:19:41Apakah mereka menginvestasikan banyak modal

00:19:43untuk membersihkan data tersebut?

00:19:45Hal-hal seperti itu harus Anda pastikan terlebih dahulu.

00:19:48Lalu, poin kedua yang harus diwaspadai adalah

00:19:50apa yang disebut sebagai “look-ahead bias”.

00:19:52Jangan melihat masa depan terlebih dahulu.

00:19:54Jika kita mencoba menerjemahkan istilah look-ahead bias,

00:19:57mungkin bisa disebut sebagai “bias prediksi masa depan”?

00:19:58Bisa diartikan seperti itu.

00:20:00Ini terjadi ketika informasi yang belum bisa didapatkan saat waktu transaksi,

00:20:03digunakan dalam backtesting yang menggunakan data masa lalu.

00:20:05Jadi, berdasarkan urutan waktu,

00:20:07informasi itu sebenarnya belum ada tahun lalu,

00:20:09tetapi sering kali ditemukan logika transaksi

00:20:12yang merujuk pada informasi tersebut saat melakukan simulasi beli/jual tahun lalu.

00:20:14Itulah yang disebut sebagai look-ahead bias.

00:20:15Salah satu contoh kesalahan umum dalam hal ini adalah,

00:20:18misalnya per bulan September 2021 ini,

00:20:21karena sulit untuk melakukan backtesting pada semua saham di Korea,

00:20:24pengguna berpikir, “Mari kita pilih 100 saham saja.”

00:20:27Begitulah kira-kira pemikiran penggunanya.

00:20:29Lalu mereka menyaring 100 perusahaan teratas berdasarkan kapitalisasi pasar KOSPI

00:20:30dan melakukan backtesting dengan daftar tersebut.

00:20:34Misalnya, strategi membeli jika PER berada di angka tertentu.

00:20:35Dengan cara itu,

00:20:38mereka melakukan backtesting selama 10 tahun

00:20:39dan hasilnya ternyata sangat bagus.

00:20:41Tapi apa yang salah di sini?

00:20:42Mereka menyaring 100 teratas kapitalisasi pasar KOSPI

00:20:44berdasarkan data per September 2021.

00:20:50Hanya perusahaan-perusahaan itulah yang dipilih,

00:20:51padahal jika melakukan backtesting 10 tahun dari tahun 2011,

00:20:55itu sama saja dengan sudah mengetahui sebelumnya

00:20:59perusahaan mana yang akan masuk 100 besar di tahun 2021.

00:21:01Kapitalisasi pasar yang tinggi sebenarnya berarti

00:21:03harga saham perusahaan tersebut terus naik secara stabil.

00:21:06Meskipun orang-orang mencoba berhati-hati,

00:21:08mereka sering melakukan kesalahan ini

00:21:11dengan berpikir untuk membatasi simulasi pada beberapa ratus saham teratas saja.

00:21:12Mereka sering terjebak dalam pemikiran seperti itu.

00:21:14Contoh lainnya adalah

00:21:15saat melakukan backtesting dengan data fundamental laporan keuangan perusahaan.

00:21:17Setiap perusahaan memiliki tanggal pengumuman laporan keuangan

00:21:21kuartalan yang berbeda-beda.

00:21:24Tetapi, apakah transaksi seperti rebalancing

00:21:26dilakukan benar-benar setelah pengumuman tersebut?

00:21:29Katakanlah sebuah perusahaan baru merilis laporan keuangannya awal bulan depan,

00:21:31namun rebalancing dilakukan akhir bulan ini

00:21:33seolah-olah sudah mengetahui informasi tersebut.

00:21:36Artinya, transaksi dilakukan dengan sudah mengetahui masa depan.

00:21:40Hal-hal semacam itu bisa tercampur dalam backtesting.

00:21:41Lalu contoh lainnya adalah,

00:21:44misalkan kita berasumsi melakukan transaksi berdasarkan harga penutupan.

00:21:46Dan kita melakukan rebalancing harian,

00:21:48padahal harga penutupan adalah informasi yang baru diketahui setelah hari itu berakhir.

00:21:50Namun, jika backtesting dilakukan seolah-olah pesanan dieksekusi

00:21:525 menit sebelum pasar tutup dengan harga tersebut,

00:21:54maka bisa timbul bias

00:21:57karena seolah-olah sudah mengetahui masa depan dalam rentang waktu tersebut.

00:22:00Selanjutnya, poin ketiga ini sangat, sangat penting.

00:22:03Yaitu menghindari “overfitting” atau optimasi berlebihan.

00:22:05Ini adalah bagian yang tidak bisa terlalu ditekankan betapa pentingnya.

00:22:07Overfitting adalah

00:22:09membuat model yang kinerjanya terlalu bagus

00:22:11hanya pada data sampel yang diberikan.

00:22:13Misalnya, kita punya sampel seperti ini.

00:22:16Maka yang ingin kita ketahui adalah

00:22:18populasi yang ada di baliknya.

00:22:19Kita ingin mengestimasi

00:22:23seluruh populasi secara umum.

00:22:25Bagi Anda yang mungkin belum familiar dengan istilah populasi,

00:22:27saya akan jelaskan secara singkat.

00:22:29Misalnya kita melakukan survei opini

00:22:32tentang hasil pemilihan umum.

00:22:34Jika kita melakukan survei terhadap seluruh rakyat,

00:22:36maka itu akan menjadi survei opini yang sempurna.

00:22:38Dengan tingkat akurasi 100%.

00:22:40Tapi karena tidak mungkin bertanya kepada seluruh rakyat,

00:22:41maka kita mengambil sampel dari mereka.

00:22:44Kita hanya mengambil sebagian populasi dan mengasumsikan sampel itu

00:22:46mewakili populasi di belakangnya.

00:22:48Kita menganggapnya memiliki representativitas dan melakukan estimasi.

00:22:50Begitu juga dengan data ini, sebenarnya data populasi di baliknya

00:22:53pasti memiliki distribusi tertentu,

00:22:58dan kita mengambil beberapa sampel darinya

00:22:59untuk mencoba mengira-ngira seperti apa bentuk populasi tersebut.

00:23:02Ini adalah gambaran upaya mencocokkan model agar sesuai dengan bentuk itu,

00:23:06namun mencocokkan model (fitting) berarti

00:23:08kita harus menemukan garis tren model

00:23:10yang meminimalkan kesalahan (error) dengan sampel ini.

00:23:16Garis-garis seperti ini.

00:23:20Tetapi jika Anda mencocokkan model yang sangat kompleks

00:23:22dan berkelok-kelok seperti ini,

00:23:25maka pada data sampel, kesalahannya adalah nol.

00:23:30Garisnya menyentuh semua titik sampel.

00:23:30Jadi, ini adalah model dengan kesalahan nol

00:23:34yang sempurna hanya untuk sampel ini.

00:23:37Tapi apakah ini model yang merepresentasikan populasi di baliknya dengan baik?

00:23:39Tentu saja tidak, kan?

00:23:41Jika kita mengambil sampel baru, tingkat kesalahannya pasti akan sangat besar.

00:23:44Oleh karena itu, optimasi harus dilakukan secukupnya saja

00:23:47agar ketika sampel baru masuk,

00:23:51total kesalahannya tetap kecil.

00:23:51Sebaliknya, jika Anda mencocokkan garis lurus

00:23:54yang terlalu sederhana seperti ini,

00:23:58maka itu disebut “underfitting” atau kurang optimasi.

00:24:00Sehingga tingkat kesalahan pada sampel itu sendiri sudah besar.

00:24:03Jadi, hal terpenting dalam pemodelan apa pun

00:24:06adalah melakukan optimasi yang moderat.

00:24:08Namun banyak orang saat melakukan backtesting,

00:24:10menggunakan data masa lalu yang sebenarnya merupakan data sampel.

00:24:13Hanya demi memaksimalkan keuntungan di dalam sampel tersebut,

00:24:16mereka memasukkan segala macam aturan

00:24:18untuk menaikkan tingkat pengembalian setinggi mungkin.

00:24:20Misalnya, dari hasil backtesting data tahun 2015 sampai 2021,

00:24:24jika membeli saham dengan PER antara 13,75 hingga 17,23,

00:24:26kapitalisasi pasar antara 51,7 miliar hingga 62,3 miliar won,

00:24:29dan PBR di bawah 1,17,

00:24:32maka keuntungan tahunan sebesar 70% bisa tercapai.

00:24:35Hasil backtesting seperti ini muncul.

00:24:39Dilihat dari sini saja, ini jelas merupakan overfitting total.

00:24:43Ini adalah optimasi yang sangat berlebihan.

00:24:46Jika Anda membeli saham dengan PBR di bawah 1,17,

00:24:50maka keuntungan tahunan sebesar 70% dimungkinkan.

00:24:52Hasil backtesting seperti ini pun muncul.

00:24:54Jika dilihat, ini jelas merupakan overfitting.

00:24:57Ini adalah hasil dari optimasi yang berlebihan.

00:24:58Mungkin ada perusahaan dengan PER 17,24 yang profitabilitasnya buruk,

00:25:04namun tetap dimasukkan ke dalam data ini.

00:25:05Atau mungkin ada perusahaan dengan kapitalisasi pasar 51,5 miliar won,

00:25:09yang sebenarnya contoh buruk, namun aturannya dibuat seperti ini.

00:25:12Jika Anda mencoba memaksimalkan keuntungan secara detail hanya berdasarkan data sampel masa lalu,

00:25:16dengan cara menyesuaikan semuanya secara paksa,

00:25:19maka model seperti inilah yang akan dihasilkan.

00:25:21Jika data dengan distribusi seperti itu muncul di masa depan,

00:25:25maka margin kesalahannya akan menjadi sangat besar.

00:25:27Itulah intinya,

00:25:28mari kita bahas ini dengan lebih mendalam.

00:25:29Ini juga merupakan salah satu contoh optimasi berlebih.

00:25:31Kita mencoba mencari garis

00:25:34yang memisahkan warna merah dan biru dengan baik.

00:25:36Model garis semacam itu.

00:25:37Garis hitam ini dipelajari dengan cukup tepat,

00:25:40tapi garis hijau yang berkelok-kelok itu,

00:25:42berdasarkan titik-titik biru dan merah yang Anda lihat,

00:25:46berhasil memisahkan mereka dengan sempurna.

00:25:48Jadi, berdasarkan data sampel ini,

00:25:50itu adalah garis sempurna dengan kesalahan nol.

00:25:52Namun, pada populasi yang ada di baliknya,

00:25:55titik biru mungkin akan muncul di sini,

00:25:57dan titik merah mungkin akan muncul di sana.

00:25:59Ketika data baru masuk di masa depan,

00:26:03garis hijau ini kemungkinan besar akan memiliki banyak kesalahan.

00:26:05Kita bisa memprediksinya seperti itu.

00:26:07Jika terlalu memaksakan kecocokan pada data masa lalu,

00:26:10model itu tidak akan bisa diterapkan di masa depan.

00:26:11Ini juga contoh yang serupa,

00:26:13katakanlah kita mengumpulkan data pribadi yang mendalam

00:26:15dari 100 siswa yang sedang bersekolah.

00:26:16Berdasarkan data itu, kita ingin menentukan siapa

00:26:19yang akan mendapat nilai bagus di antara 100 siswa tahun ini.

00:26:20atau “tinggi badannya harus sekian”.

00:26:22The key is lately,

00:26:23Jika kita terlalu mengoptimalkan aturan

00:26:26berdasarkan data siswa berprestasi tahun lalu secara berlebihan,

00:26:28dan menetapkan aturan pembedaan seperti itu,

00:26:30lalu menerapkannya pada siswa tahun ini,

00:26:32hasilnya bisa menjadi sangat tidak masuk akal.

00:26:34Jika kita hanya menetapkan aturan pembedaan

00:26:37berdasarkan jumlah jam belajar saja,

00:26:39If we plug it into the data of students who were enrolled last year,

00:26:42maka dibandingkan dengan aturan yang sangat detail tadi,

00:26:44tingkat akurasinya mungkin akan lebih rendah.

00:26:45Meskipun tingkat akurasinya sedikit lebih rendah,

00:26:47ketika diterapkan pada siswa tahun ini pun,

00:26:49kemungkinan besar akurasinya akan tetap terjaga dengan baik.

00:26:53Lalu, bagaimana kita bisa memitigasi masalah optimasi berlebih ini?

00:26:56Setiap backtesting pasti memiliki masalah optimasi berlebih sampai batas tertentu,

00:27:00dan mustahil untuk menghilangkannya sepenuhnya.

00:27:01Misalnya, bagaimana kita tahu apakah strategi yang di-backtest dengan data 5 tahun terakhir

00:27:06akan tetap efektif untuk 3 tahun ke depan?

00:27:08Jawaban sempurna untuk pertanyaan itu

00:27:11hanyalah dengan mencoba melakukan trading selama 3 tahun, bukan?

00:27:12Tapi itu adalah cara yang retrospektif,

00:27:15jika kita merugi setelah trading selama 3 tahun,

00:27:17maka itu tidak akan ada artinya, kan?

00:27:17Jadi, salah satu metodenya adalah

00:27:19menggunakan apa yang disebut “Out of Sample Data”.

00:27:21Yaitu menggunakan data di luar sampel.

00:27:23Saya tidak yakin apakah terjemahannya tepat,

00:27:25tapi biasanya ini disebut sebagai data OOS.

00:27:27Sebagai contoh,

00:27:28menggunakan data dari September 2015 hingga September 2021,

00:27:31yang berarti data selama 6 tahun,

00:27:33untuk menemukan strategi terbaik lalu langsung

00:27:34melakukan trading mulai Oktober 2021 bukanlah ide yang bagus.

00:27:38Bukannya melakukan itu,

00:27:39tetapi gunakanlah data dari September 2014 hingga September 2020,

00:27:42yaitu data selama 6 tahun,

00:27:44untuk menemukan strategi yang menghasilkan keuntungan tinggi.

00:27:46Setelah itu, bayangkan Anda mulai trading mulai Oktober 2020,

00:27:49lalu lakukan backtesting sekali lagi untuk periode hingga September 2021.

00:27:52Jadi, setelah menemukan strategi terbaik melalui backtesting

00:27:55dengan data 6 tahun sejak 2014,

00:27:57Anda membayangkan seolah-olah sedang melakukan trading sungguhan mulai Oktober 2020,

00:28:02dan melakukan backtesting selama satu tahun tersebut.

00:28:04Jika hasilnya bagus,

00:28:06barulah Anda melakukan trading sungguhan mulai Oktober 2021.

00:28:09Tentu saja, pembagian seperti ini

00:28:10bisa menimbulkan masalah lain,

00:28:12tapi kita akan membahasnya nanti.

00:28:13Poin yang ingin saya sampaikan sekarang adalah,

00:28:16jika Anda memiliki data sampel sebanyak ini,

00:28:18pisahkanlah sebagian kecil darinya.

00:28:19Sisihkan bagian tersebut,

00:28:21dan gunakan data sisanya untuk mencari strategi dengan giat,

00:28:23melakukan banyak backtesting,

00:28:24dan mencoba mengoptimalkannya di sana.

00:28:26Namun jangan langsung terjun ke trading sungguhan,

00:28:28melainkan gunakan data

00:28:30yang tidak digunakan saat mencari strategi tadi.

00:28:31Bayangkan itu adalah trading sungguhan,

00:28:33lalu cobalah terapkan strategi Anda di sana.

00:28:34Itulah yang disebut menggunakan data di luar sampel,

00:28:35atau data OOS.

00:28:38Dalam ilmu data, ada istilah seperti

00:28:39data pelatihan (training data), data validasi (validation data),

00:28:41data uji (test data), atau data pengembangan (development data).

00:28:42Istilah-istilah tersebut

00:28:44sebenarnya tidak terlalu penting.

00:28:45Poin nomor 4 berlanjut dari nomor 3,

00:28:46yaitu “kesempatan validasi hanya ada satu kali”.

00:28:48Ini sangat, sangat, sangat penting.

00:28:50Kalimat ini benar-benar sangat penting,

00:28:53tidak peduli seberapa sering saya menekankannya,

00:28:58itu tidak akan pernah cukup.

00:29:01Mari kita bahas lebih lanjut mengenai

00:29:03pengujian data di luar sampel ini.

00:29:04Ada berbagai istilah untuk data sampel dan data luar sampel,

00:29:06tapi dalam video ini,

00:29:08saya akan menyederhanakannya menjadi

00:29:09data pelatihan dan data validasi.

00:29:11Dalam contoh sebelumnya,

00:29:12data dari tahun 2014 hingga 2020

00:29:13adalah data pelatihan.

00:29:16Data pelatihan berarti

00:29:18data yang digunakan untuk mencari strategi.

00:29:19Setelah strateginya ditemukan,

00:29:20kita memvalidasinya.

00:29:22Data backtesting selama satu tahun terakhir

00:29:24akan kita sebut sebagai data validasi.

00:29:26Grafik ini menunjukkan

00:29:28seberapa kompleks aturan atau model yang digunakan.

00:29:30Semakin ke kanan,

00:29:32modelnya menjadi semakin kompleks.

00:29:35Misalnya, menetapkan aturan yang sangat mendetail

00:29:36seperti “antara 173cm hingga 173,25cm”.

00:29:38Semakin Anda melakukan itu,

00:29:40maka kompleksitasnya akan meningkat.

00:29:42Dan sumbu ini menunjukkan kesalahan prediksi.

00:29:44Yaitu seberapa besar kesalahan yang terjadi

00:29:45saat model diterapkan pada situasi nyata.

00:29:47Bisa Anda lihat bahwa pada sampel pelatihan,

00:29:49semakin kompleks model yang digunakan,

00:29:50maka kesalahannya akan semakin berkurang.

00:29:52Tadi ada banyak sampel di sini,

00:29:53dan semakin berkelok-kelok atau semakin kompleks aturannya,

00:29:54kesalahan dalam data sampel tersebut

00:29:55bisa dihilangkan hingga menjadi nol.

00:29:58Jadi, jika model dibuat sangat kompleks,

00:29:59kesalahan akan mendekati nol.

00:30:02Namun, jika model yang sudah dipelajari tersebut

00:30:03diuji dengan data validasi yang sudah kita pisahkan tadi,

00:30:05berapakah kesalahan yang akan muncul?

00:30:06Pada awalnya, ketika modelnya sangat sederhana

00:30:08seperti garis lurus, atau saat terjadi underfitting,

00:30:12kesalahannya akan terlihat mirip.

00:30:14Namun, seiring dengan semakin kompleksnya model atau aturan,

00:30:16kesalahan pada sampel data pelatihan akan terus berkurang,

00:30:18tetapi pada data validasi,

00:30:19setelah mencapai titik terendah, kesalahannya justru akan mulai meningkat

00:30:21saat model menjadi terlalu kompleks.

00:30:23Jika diibaratkan dengan backtesting dalam investasi,

00:30:24kita melakukan banyak sekali backtesting,

00:30:26menetapkan aturan-aturan yang sangat mendetail,

00:30:28mencoba berbagai macam backtesting,

00:30:31dan menyesuaikan parameter

00:30:33seperti nilai PER harus di atas angka tertentu secara mendetail.

00:30:35Semakin kompleks Anda membuatnya,

00:30:37maka tingkat keuntungan pada data masa lalu akan terus meningkat.

00:30:40Karena ini adalah grafik kesalahan, maka semakin rendah grafiknya, semakin baik.

00:30:42Pokoknya, backtesting yang dipaksakan agar cocok dengan data masa lalu

00:30:45akan memberikan keuntungan yang lebih baik seiring dengan tingkat kecocokannya.

00:30:47Namun, ketika ini diterapkan di dunia nyata,

00:30:51jika aturannya dibuat terlalu kompleks,

00:30:52maka sejak titik tertentu, semakin kompleks aturannya,

00:30:55tingkat keuntungan di dunia nyata justru akan menurun.

00:30:56Begitulah jadinya.

00:30:59Tadi saya mengibaratkan kesalahan yang rendah

00:31:02sebagai keuntungan yang membaik,

00:31:05dan kesalahan yang tinggi sebagai keuntungan yang memburuk.

00:31:08Secara teknis,

00:31:12kesalahan yang membesar

00:31:15sedikit berbeda dengan penurunan tingkat keuntungan.

00:31:17Maksudnya, semakin buruk backtesting dilakukan

00:31:18dan semakin terjadi overfitting,

00:31:21maka kesenjangan antara keuntungan backtesting dan keuntungan di masa depan,

00:31:23yaitu margin kesalahannya, akan semakin besar.

00:31:24Kesalahan itu secara acak

00:31:26bisa saja membuat hasilnya lebih tinggi

00:31:28atau bisa juga lebih rendah.

00:31:31Namun, secara umum, jika terjadi kesalahan seperti itu,

00:31:32tingkat keuntungan di dunia nyata akan menjadi lebih buruk.

00:31:33Alasannya karena saat mencocokkannya dengan data masa lalu,

00:31:34semuanya sudah diatur sedemikian rupa

00:31:37untuk memaksimalkan tingkat keuntungan.

00:31:39Sehingga jika terjadi kesalahan dari tingkat keuntungan tersebut,

00:31:42biasanya kesalahannya akan mengarah ke bawah.

00:31:45Lalu, bagaimana sebaiknya kita membagi

00:31:47data pelatihan dan data validasi untuk backtesting?

00:31:49Misalnya, dari tahun 2011 hingga 2021,

00:31:50mari kita lihat cara pembagiannya.

00:31:51Tapi biasanya, jika terjadi selisih seperti itu,

00:31:53tingkat pengembalian di lapangan akan menjadi lebih buruk.

00:31:55Karena saat mencocokkan dengan data masa lalu,

00:31:57semuanya dipaksakan sedemikian rupa

00:31:59agar tingkat pengembaliannya bisa naik semaksimal mungkin.

00:32:00Jadi, jika terjadi kesalahan pada angka pengembalian tersebut,

00:32:02biasanya selisihnya akan mengarah ke bawah.

00:32:03Lalu, bagaimana cara membagi data pelatihan

00:32:06dan data validasi untuk melakukan backtesting?

00:32:08Misalnya, dari tahun 2011 hingga 2021,

00:32:11belajar dari data 11 tahun dan menerapkannya mulai tahun depan.

00:32:15Artinya, Anda tidak menggunakan data validasi secara terpisah.

00:32:18Semuanya digunakan sebagai data pelatihan lalu langsung diterapkan.

00:32:21Cara ini sangat tidak disarankan.

00:32:22Metode pembagian yang saya sebutkan tadi adalah

00:32:25menggunakan data 10 tahun sebagai data pelatihan untuk belajar,

00:32:28lalu memvalidasinya dengan data 1 tahun terakhir di 2021,

00:32:31baru kemudian menerapkannya mulai tahun 2022.

00:32:34Namun, seperti yang akan saya jelaskan nanti,

00:32:36ini pun bukan metode yang terlalu bagus.

00:32:38Lalu, apa metode lain yang lebih baik?

00:32:40Ada metode yang disebut “Walk-forward Testing”.

00:32:43Sistemnya adalah seperti ini.

00:32:44Misalnya, mulai dari tahun 1999 selama 3 tahun,

00:32:46Anda belajar dan mengoptimalkan parameter di sana.

00:32:49Berdasarkan hasil itu, lakukan validasi selama 1 tahun,

00:32:52lalu lanjutkan dengan sistem bergulir (rolling) seperti itu.

00:32:55Jika Anda menyusun strategi dengan cara ini,

00:32:58sebagai contoh untuk model yang sangat sederhana.

00:33:01Sebenarnya melakukan backtesting hanya berdasarkan PER

00:33:04menurut saya tidak masuk akal,

00:33:05tapi anggaplah ada strategi membeli saham dengan PER di bawah angka tertentu.

00:33:08Jika Anda mengoptimalkan PER berdasarkan data 10 tahun,

00:33:11maka standar PER yang ideal

00:33:13untuk setiap tahunnya pasti akan berbeda-beda.

00:33:17Dari situ, Anda mungkin akan memilih nilai rata-rata yang cukup baik.

00:33:20Tetapi jika rentangnya dipersempit,

00:33:22Anda menetapkan nilai PER berdasarkan 3 tahun terakhir untuk bertransaksi,

00:33:26dan melakukan pengujian dengan cara seperti itu.

00:33:28Dengan cara ini, parameter dapat disesuaikan

00:33:30secara lebih fleksibel mengikuti alur waktu.

00:33:32Begitulah cara pengujiannya dilakukan.

00:33:35Bisa dengan cara itu, atau bisa juga

00:33:37menggunakan metode K-Fold CV.

00:33:38Ini disebut juga Cross Validation.

00:33:39Cara kerjanya adalah sebagai berikut.

00:33:41Nilai K ini menunjukkan menjadi berapa bagian data tersebut dibagi.

00:33:45Jika melihat gambar, nilai K-nya adalah 5.

00:33:47Jika K ditetapkan 5, data dibagi menjadi 5 bagian yang sama.

00:33:50Kemudian, lakukan pelatihan pada data 4 tahun,

00:33:53lalu cek berapa tingkat pengembaliannya pada data validasi 1 tahun.

00:33:56Selanjutnya, lakukan pelatihan pada 4 bagian lainnya,

00:33:59dan validasi hasilnya pada tahun yang tersisa.

00:34:01Setelah itu, rata-rata tingkat pengembalian ini dibagi 1/5.

00:34:05Maksudnya, semua hasil pengembalian tersebut dirata-ratakan.

00:34:09Hasil itulah yang dianggap mendekati profit yang bisa diharapkan.

00:34:12Itulah konsep dasarnya.

00:34:13Selain itu, misalnya menggunakan data 10 tahun terakhir.

00:34:16Ada juga yang belajar menggunakan data tahun genap,

00:34:19lalu memvalidasinya dengan data tahun ganjil.

00:34:22Semua metode ini memiliki kelebihan dan kekurangan.

00:34:23Jika bicara soal kelebihannya,

00:34:26parameternya sangat stabil terhadap “Market Regime Change”.

00:34:30Maksudnya begini.

00:34:31Ketika terjadi krisis keuangan atau pandemi COVID-19,

00:34:33karakteristik pasar akan berubah.

00:34:35Misalnya, krisis keuangan terjadi pada tahun 2008,

00:34:39tapi Anda belajar dari data tahun 1998 hingga 2007.

00:34:43Anda menemukan strategi dengan profit tinggi di sana,

00:34:45lalu mencoba memvalidasinya.

00:34:46Karena karakteristik pasar sudah berubah total,

00:34:49distribusi datanya pun ikut berubah.

00:34:51Sehingga situasi pasar yang baru ini

00:34:52tidak akan tercermin dalam pola-pola lama tersebut.

00:34:55Jadi, jika membagi data dengan cara seperti ini,

00:34:57ketika terjadi peristiwa besar yang mengubah

00:35:00sifat dan pola pasar secara drastis,

00:35:02Anda bisa melakukan validasi dengan lebih stabil.

00:35:06Itulah sebabnya metode ini sering digunakan.

00:35:08Namun saat menggunakan cara ini, berhati-hatilah agar tidak “melihat ke masa depan”.

00:35:11Hal ini sangat penting untuk diperhatikan.

00:35:13Karena meskipun tergantung pada siklus transaksinya,

00:35:16jika diasumsikan Anda bertransaksi bulanan,

00:35:18dalam data pelatihan saat ini,

00:35:19data tahun 2014 sudah tercermin di dalamnya.

00:35:22Tergantung pada aturan atau data apa yang digunakan di tahun 2013,

00:35:26hal-hal yang baru diketahui setelah masuk tahun 2014

00:35:28bisa saja ikut tercampur ke dalam data validasi.

00:35:30Jika itu terjadi, profit pada data validasi akan terlihat melonjak.

00:35:34Sebab model belajar dengan sudah mengetahui masa depan.

00:35:36Oleh karena itu, Anda harus sangat berhati-hati pada bagian ini.

00:35:39Dan meskipun saya menjelaskannya secara garis besar,

00:35:41dalam bidang Machine Learning,

00:35:44ada bagian yang disebut Hyperparameter.

00:35:46Secara umum, parameter adalah bagian yang disesuaikan

00:35:50oleh model itu sendiri untuk meminimalkan error pada data sampel.

00:35:54Sedangkan Hyperparameter adalah bagian yang harus ditentukan oleh manusia.

00:35:57Misalnya, saat melakukan analisis regresi.

00:35:59Apakah Anda akan menggunakan garis lurus atau garis lengkung?

00:36:03Dengan kata lain, seberapa kompleks bentuk rumus

00:36:07atau model yang akan digunakan.

00:36:09Hal-hal seperti itu diputuskan oleh manusia.

00:36:11Jumlah parameter tersebut adalah Hyperparameter.

00:36:15Setelah itu ditentukan, barulah berdasarkan data yang ada,

00:36:18garis ini akan dicocokkan (fitting)

00:36:22ke arah yang paling mengoptimalkan selisih data tersebut.

00:36:23Jadi, nilai-nilai seperti kemiringan (slope) atau intersep

00:36:28yang dipelajari model agar sesuai dengan data Itulah yang disebut parameter.

00:36:33Jadi, Anda juga perlu mencoba berbagai Hyperparameter.

00:36:36Maka data tidak hanya dibagi menjadi Train dan Test,

00:36:40tapi ada satu lagi yang disebut Dev Data.

00:36:42Setelah melakukan optimasi di sana,

00:36:45Hyperparameter dioptimalkan pada data tersebut,

00:36:48baru kemudian divalidasi dengan Test Data. Ada juga yang melakukannya begitu.

00:36:51Bagi yang sudah paham Machine Learning pasti mengerti,

00:36:55tapi bagi yang belum tahu, penjelasan singkat ini mungkin tidak cukup.

00:36:58Jadi, mari kita lewati saja bagian itu.

00:37:00Namun dalam melakukan proses ini, ada hal yang sangat,

00:37:04sangat, sangat penting dan tidak boleh disepelekan.

00:37:08Yaitu mengenai data validasi.

00:37:10Jangan pernah, sekali-kali, melihat data validasi dua kali.

00:37:15Maksud saya hasilnya.

00:37:16Anda belajar dari data pelatihan dan menguji berbagai strategi untuk mencari profit terbaik.

00:37:22Strategi itu mungkin terlihat bagus di atas kertas data pelatihan,

00:37:26tapi untuk memastikan apakah strategi itu benar-benar akan berhasil di dunia nyata,

00:37:31Anda menjalankannya menggunakan periode atau data yang tidak dipakai saat pelatihan.

00:37:38Ingat, ini tidak boleh dilakukan dua kali.

00:37:41Cukup sekali saja. Jika hasilnya buruk saat pertama kali dijalankan,

00:37:45maka seberapa pun kerasnya usaha Anda selama bertahun-tahun untuk membuatnya,

00:37:50seluruh strategi itu harus dibuang.

00:37:52Mengapa? Karena di dunia nyata pun, Anda hanya punya satu kesempatan untuk untung atau rugi.

00:37:57Kita tidak bisa memutar balik waktu, bukan?

00:37:58Meskipun merasa sayang karena hasil validasinya buruk,

00:38:03lalu Anda mengutak-atik parameter lagi menggunakan data pelatihan,

00:38:07dan akhirnya mendapatkan profit bagus saat divalidasi ulang.

00:38:10Begitu Anda melakukan itu, data validasi tersebut bukan lagi data validasi,

00:38:14melainkan sudah berubah menjadi bagian dari data pelatihan.

00:38:16Karena Anda sudah melakukan optimasi parameter termasuk dengan data validasi tersebut.

00:38:21Jadi, kita tidak bisa memberikan jaminan apa pun

00:38:26mengenai seberapa besar profit yang akan dihasilkan di lapangan nanti.

00:38:29Itulah mengapa poin ini sangat krusial.

00:38:31Dan hal penting lainnya saat melakukan backtesting,

00:38:34The fact that times change—the concept of a 'market regime.'

00:38:37Saya ingin mengajukan satu pertanyaan.

00:38:39Antara backtesting 20 tahun dan backtesting 3 tahun,

00:38:42mana yang lebih bermakna?

00:38:44Melihat judulnya, jawabannya mungkin sudah jelas.

00:38:47Banyak investor pemula yang berpikir bahwa semakin lama periode backtesting,

00:38:50atau semakin banyak datanya, maka akan semakin baik.

00:38:54Namun bagi saya, di antara kedua backtesting ini,

00:38:57meskipun tergantung pada rentang waktu dan frekuensi transaksi,

00:39:00secara umum,

00:39:01saya akan lebih memilih data 3 tahun.

00:39:03Semakin banyak jumlah data, memang semakin baik.

00:39:06Tapi data tersebut harus berasal dari distribusi yang sama.

00:39:09Data yang banyak itu bagus, namun

00:39:11tidak baik jika dicampur dengan data lain dari lingkungan yang sudah berubah.

00:39:17Masalah yang dihadapi jika periode backtesting terlalu panjang

00:39:20adalah karakteristik pasar yang berubah.

00:39:22Ini entah grafik tingkat pengembalian riil

00:39:26atau grafik yang terkait dengan suku bunga,

00:39:28tapi bisa dilihat di sini bahwa konsep suku bunga yang wajar

00:39:33memang terus berfluktuasi,

00:39:34tapi level suku bunga yang dianggap wajar dalam suatu sistem berubah drastis.

00:39:38Pada waktu itu di level ini, lalu mungkin karena Oil Shock,

00:39:41setelah periode itu, levelnya pindah ke sini.

00:39:45Lalu setelah tahun 80-an,

00:39:47level inilah yang secara umum berlaku sebagai suku bunga standar.

00:39:51Katakanlah Anda melakukan trading obligasi,

00:39:53dan Anda mempelajari strategi trading di dalam periode ini

00:39:57untuk kemudian digunakan di periode berikutnya.

00:39:59Jika Market Regime-nya sudah berubah,

00:40:02maka strategi menguntungkan yang dibuat dari data pelatihan sebelumnya

00:40:07tidak akan berlaku lagi di sini.

00:40:08Itulah yang disebut Market Regime Change.

00:40:11Perubahan sifat atau sistem pasar.

00:40:14Perubahan karakteristik pasar ini

00:40:17bisa terjadi karena perubahan pelaku pasar.

00:40:20Contohnya setelah COVID-19, banyak sekali investor ritel yang masuk,

00:40:23sehingga muncul insiden GameStop.

00:40:25Sebelum pandemi COVID-19,

00:40:27strategi short-selling semacam itu,

00:40:30bahkan ada hedge fund yang khusus melakukan short-selling.

00:40:32Itu adalah strategi yang sangat efektif dulu.

00:40:34Tapi tiba-tiba karena karakteristik pasar berubah,

00:40:37mereka bahkan ada yang sampai mengalami kebangkrutan.

00:40:39Selanjutnya adalah perubahan sistem dan regulasi. Krisis keuangan terjadi,

00:40:43prop-trading di bank investasi dilarang,

00:40:45dan berbagai regulasi di pasar derivatif juga mengubah pasar.

00:40:49Strategi yang dipelajari

00:40:50berdasarkan data sebelum krisis keuangan

00:40:52tidak akan berjalan dengan baik setelahnya.

00:40:54Lalu ada kejadian eksternal,

00:40:55seperti Oil Shock yang sangat luar biasa

00:40:57hingga mengubah pasar itu sendiri.

00:40:59Kejadian makroekonomi semacam itu.

00:41:01Dan juga perubahan makroekonomi lainnya.

00:41:03Seiring dengan rasio utang yang terus meningkat,

00:41:06level suku bunga yang dulunya berada di kisaran tertentu,

00:41:08kini telah memasuki era suku bunga yang sangat rendah.

00:41:11Hal ini juga didukung oleh pelonggaran kuantitatif,

00:41:13yang turut berkontribusi pada suku bunga rendah ini.

00:41:15Akibatnya, saham-saham pertumbuhan tiba-tiba berkinerja sangat baik

00:41:17selama 10 tahun terakhir.

00:41:19Namun, jika Anda menggunakan data sebelum pelonggaran kuantitatif

00:41:22untuk menemukan strategi yang menguntungkan,

00:41:24mungkin model tersebut akan menyarankan untuk membeli saham nilai.

00:41:25Maka tentu saja, selama 10 tahun ke depan,

00:41:27hasilnya pasti akan sangat buruk.

00:41:28Selain itu, ada juga faktor munculnya teknologi baru,

00:41:30atau perubahan dalam struktur industri,

00:41:32dan hal-hal semacam itu.

00:41:33Jadi, saat melakukan backtesting selama 20 tahun,

00:41:35apakah data dari tahun 2001 masih relevan?

00:41:38Tentu saja, apa yang disebut sebagai “perubahan rezim pasar”

00:41:40bergantung pada elemen apa yang Anda amati.

00:41:42Itu bisa sedikit berbeda.

00:41:43Pada akhirnya, bergantung pada logika strategi,

00:41:45aturan, atau jenis model

00:41:47yang sedang digunakan,

00:41:49serta data apa yang dianalisis,

00:41:51berdasarkan hal-hal itulah

00:41:52Anda harus memperhatikan apakah rezim data tersebut

00:41:53telah mengalami perubahan.

00:41:55Ada jenis data yang sifatnya

00:41:56berubah dengan sangat cepat,

00:41:58bahkan dalam hitungan bulan.

00:41:59Namun ada juga data yang tetap

00:42:01sangat stabil selama 10 hingga 15 tahun.

00:42:03Siklus krisis pun berbeda-beda setiap saat,

00:42:05sehingga secara umum,

00:42:07hanya karena pandemi COVID terjadi,

00:42:09bukan berarti semua pola sebelumnya

00:42:09menjadi tidak berarti sama sekali.

00:42:12Meski begitu, jika Anda menggunakan data 20 tahun,

00:42:14seperti yang saya katakan,

00:42:15pasti akan ada masalah yang muncul.

00:42:17Anda bisa melihatnya seperti itu.

00:42:18Jika Anda mencoba melakukan inferensi

00:42:20dengan menggunakan data yang sangat lama,

00:42:22rezim pasar mungkin sudah

00:42:23berubah di tengah jalan,

00:42:24dan terus berubah lagi.

00:42:25Bagaimanapun, jika data dari masa lalu yang jauh tersebut

00:42:29masih mencerminkan kondisi saat ini,

00:42:30maka data itu masih bisa digunakan.

00:42:32Oleh karena itu, beberapa orang mengatakan

00:42:33bahwa kondisi sekarang mirip dengan tahun 1940-an.

00:42:35Ada juga pembicaraan seperti itu,

00:42:37tapi itu hanya selingan saja.

00:42:38Jadi, perdagangan kuantitatif (quant trading)

00:42:41kini sudah sangat umum digunakan,

00:42:42bahkan oleh investor individu.

00:42:44Namun untuk investasi jangka panjang,

00:42:45kelemahan dari investasi kuantitatif adalah

00:42:47ketika menerapkan teknik kuantitatif ini

00:42:49pada investasi jangka panjang,

00:42:51sangat sulit untuk mengamankan data yang cukup

00:42:53sekaligus menghindari perubahan rezim pasar.

00:42:55Misalkan ada strategi algoritma

00:42:57yang menggunakan data per menit.

00:42:59Dalam satu jam,

00:43:01terdapat 60 poin data.

00:43:02Karena ada 60 menit,

00:43:03maka ada 60 data.

00:43:04Lalu misalkan

00:43:05ini adalah perdagangan berjangka 24 jam.

00:43:08Jika dikalikan 24,

00:43:09hasilnya 1.440.

00:43:10Benar, kan?

00:43:10Ada 1.440 poin data dalam sehari.

00:43:12Jika satu hari ada 1.440 data,

00:43:15dan diperdagangkan 5 hari seminggu, total sekitar 250 hari,

00:43:17katakanlah kita punya 250 hari kerja.

00:43:20Dalam setahun, akan terkumpul lebih dari 300.000 data.

00:43:21Kira-kira sebanyak itulah jumlah data

00:43:23yang bisa diperoleh dalam satu tahun.

00:43:25Hanya dengan satu tahun saja,

00:43:26Anda sudah mendapatkan lebih dari 300.000 data.

00:43:29Dengan jumlah data yang sangat banyak dan signifikan itu,

00:43:32Anda bisa melakukan verifikasi,

00:43:33menggunakan model yang lebih kompleks,

00:43:35dan melakukan berbagai hal lainnya.

00:43:36Namun, misalkan strategi rebalancing

00:43:37dilakukan setiap bulan.

00:43:39Maka dalam setahun hanya ada 12 data.

00:43:41Bahkan jika Anda melakukannya selama 20 tahun,

00:43:42hanya akan ada 240 data.

00:43:44Karena jumlah data tidak bisa ditambah melalui sumbu waktu,

00:43:47Anda harus melihat berbagai macam saham

00:43:49dan mencoba memperluas cakupan ke sana

00:43:51untuk mengamankan signifikansinya.

00:43:53Namun pada akhirnya, dalam sumbu waktu,

00:43:54sulit untuk menghindari perubahan rezim pasar.

00:43:57Itulah sebabnya bagian ini sangat sulit.

00:43:58Setelah pandemi COVID melanda,

00:44:00banyak praktisi kuantitatif yang mengeluh.

00:44:02Ada seseorang bernama Inigo Fraser-Jenkins,

00:44:05setahu saya dia adalah Head of Quants di perusahaan ternama.

00:44:09Dia pernah menjelaskan tentang

00:44:11“Mengapa saya tidak lagi menjadi seorang Quant.”

00:44:13Inti dari penjelasannya adalah,

00:44:15tugas Quant adalah memprediksi masa depan berdasarkan pola masa lalu.

00:44:19Namun,

00:44:20ketika peristiwa seperti COVID terjadi, pola masa lalu menjadi tidak berguna.

00:44:23Saat terjadi perubahan rezim pasar,

00:44:25sangat sedikit hal yang bisa dilakukan oleh seorang Quant.

00:44:28Bahkan ada yang menyebutnya sebagai krisis eksistensial bagi para Quant.

00:44:30Istilah seperti itu sering digunakan.

00:44:31Dan tahun lalu, kinerja para Quant sangat buruk.

00:44:34Tentu ada beberapa Quant yang kinerjanya bagus,

00:44:36tapi rata-ratanya sangat, sangat mengecewakan.

00:44:38Sekarang kita sudah sampai sekitar setengah jalan,

00:44:40dan waktu sudah berlalu satu setengah jam.

00:44:43Jadi, Bagian 1 kita akhiri sampai di sini.

00:44:45Besok di Bagian 2, kita akan membahas sisa poin nomor 6 sampai 10,

00:44:49kelebihan dan keterbatasan,

00:44:50serta kurikulum untuk belajar investasi kuantitatif.

00:44:52Kita akan membahas semuanya secara detail.

00:44:54Sampai jumpa di Bagian 2.

00:44:55Terima kasih.

Key Takeaway

Investasi kuantitatif bukanlah cara instan untuk kaya, melainkan disiplin yang sangat sulit karena kesuksesan backtesting masa lalu jarang menjamin performa masa depan akibat jebakan teknis dan perubahan rezim pasar.

Highlights

Investasi kuantitatif sering kali disalahpahami oleh investor pemula akibat pemasaran yang berlebihan dan hasil backtesting yang diperindah.

Ada jumlah pola menguntungkan yang tak terbatas di masa lalu, namun menemukan pola yang akan tetap berhasil di masa depan adalah tantangan utama.

Data gratis atau murah sering kali 'kotor' dan penuh kesalahan, yang dapat mendistorsi hasil simulasi investasi secara signifikan.

Bias penyintas (survivorship bias) dan bias melihat ke masa depan (look-ahead bias) adalah jebakan teknis utama dalam melakukan backtesting.

Overfitting atau optimasi berlebihan pada data masa lalu membuat strategi tampak sempurna di simulasi tetapi gagal total di pasar riil.

Perubahan rezim pasar (market regime change), seperti pandemi COVID-19, dapat membuat pola historis yang dipelajari selama puluhan tahun menjadi tidak relevan.

Timeline

Pendahuluan: Realitas dan Bahaya Investasi Kuantitatif

Pembicara membuka video dengan menyoroti meningkatnya minat pada investasi kuantitatif (quant) di kalangan pelanggan salurannya. Ia menyatakan keprihatinan atas maraknya pemasaran viral yang menjanjikan keuntungan tetap dari strategi quant tanpa menjelaskan risiko yang sebenarnya. Bagian ini menekankan bahwa kursus berbayar yang mahal sering kali memperindah realitas backtesting tanpa membahas aspek non-ilmiah yang bisa merugikan pemula. Tujuannya adalah memberikan 10 hal yang harus diwaspadai untuk melindungi aset investor dari kerugian finansial yang nyata. Pembicara juga mengklarifikasi bahwa video ini dibuat untuk edukasi jujur, bukan untuk menyerang pihak tertentu.

Klasifikasi dan Prinsip Dasar Perdagangan Kuantitatif

Sesi ini menjelaskan berbagai jenis investasi kuantitatif mulai dari High-Frequency Trading (HFT) yang sangat cepat hingga investasi faktor jangka panjang. Pembicara menguraikan kategori seperti trading algoritma, arbitrase statistik, dan tren terbaru 'Quantamental' yang menggabungkan analisis fundamental otomatis. Prinsip dasar trading kuantitatif dijelaskan dalam empat tahap: pembentukan hipotesis, backtesting dengan data historis, pengujian keuntungan, dan eksekusi perdagangan riil dengan manajemen risiko. Meskipun dulunya eksklusif bagi institusi besar, platform modern kini memungkinkan individu mengakses alat ini. Namun, aksesibilitas ini juga membawa risiko salah paham bagi mereka yang tidak memiliki dasar statistik yang kuat.

Fakta Backtesting: Pola Masa Lalu vs Realitas Masa Depan

Pembicara mengkritik kebiasaan investor yang hanya mencari parameter terbaik dalam simulasi tanpa mempertimbangkan jaminan keberlanjutan pola tersebut. Ia memberikan contoh 'Magic Formula' dari Joel Greenblatt yang sangat populer namun menunjukkan performa di bawah pasar (underperform) setelah dipublikasikan secara luas. Kegagalan startup terkenal seperti Quantopian juga diangkat sebagai bukti bahwa penelitian intensif pun tidak menjamin kesuksesan di pasar nyata. Masalah utamanya adalah kemudahan menemukan pola yang menguntungkan di masa lalu dibandingkan kesulitan ekstrem menemukan pola yang bertahan di masa depan. Bagian ini memperingatkan bahwa strategi dengan profit 20% setahun tidak bisa didapatkan hanya dengan beberapa klik simulasi.

Waspadai Data 'Kotor' dan Bias Penyintas dalam Simulasi

Poin pertama dari hal-hal yang harus diwaspadai adalah kualitas data yang digunakan, di mana data gratis sering kali mengandung kesalahan input yang fatal. Kesalahan seperti harga terendah yang tidak akurat dapat membuat sistem backtesting mencatat keuntungan semu yang sangat menggelembung. Selanjutnya, pembicara menjelaskan 'bias penyintas' dengan ilustrasi pesawat tempur yang kembali dari medan perang, di mana data hanya diambil dari perusahaan yang masih ada saat ini. Jika investor melakukan backtesting hanya pada saham yang sukses bertahan, tingkat pengembalian akan terlihat jauh lebih tinggi daripada kenyataan sejarah. Hal ini sangat berbahaya karena mengasumsikan investor memiliki kemampuan dewa untuk menghindari perusahaan yang akan bangkrut.

Jebakan Look-ahead Bias dan Bahaya Overfitting

Look-ahead bias dijelaskan sebagai kesalahan di mana informasi masa depan yang belum tersedia saat waktu transaksi digunakan dalam simulasi masa lalu. Contohnya adalah memilih 100 saham teratas berdasarkan kapitalisasi pasar saat ini untuk diuji pada data sepuluh tahun lalu. Topik utama berikutnya adalah 'overfitting', yaitu menciptakan model yang terlalu kompleks agar sesuai sempurna dengan data sampel tetapi gagal pada data baru. Pembicara menggunakan analogi survei opini dan pola belajar siswa untuk menjelaskan bahwa optimasi harus dilakukan secara moderat. Model yang dipaksakan untuk menyentuh semua titik data masa lalu biasanya akan memiliki margin kesalahan yang sangat besar di masa depan.

Metodologi Validasi: Out-of-Sample dan Cross Validation

Untuk mengatasi masalah overfitting, pembicara menyarankan penggunaan data di luar sampel atau Out-of-Sample (OOS) data dalam proses pengujian. Strategi harus ditemukan menggunakan data pelatihan, lalu divalidasi menggunakan data yang disisihkan seolah-olah sedang melakukan trading sungguhan. Metode lain yang dibahas adalah 'Walk-forward Testing' dan 'K-Fold Cross Validation' untuk menyesuaikan parameter secara fleksibel mengikuti alur waktu. Grafik kesalahan menunjukkan bahwa semakin kompleks model, kesalahan pada data pelatihan berkurang, tetapi kesalahan pada data validasi justru meningkat setelah titik tertentu. Intinya adalah mencari keseimbangan agar model tetap stabil saat menghadapi dinamika pasar yang terus berubah.

Aturan Emas Validasi dan Perubahan Rezim Pasar

Pembicara menekankan aturan krusial bahwa kesempatan validasi hanya ada satu kali dan hasilnya tidak boleh dimanipulasi untuk pengujian ulang. Jika hasil validasi buruk, strategi tersebut harus dibuang sepenuhnya karena memutar balik waktu di dunia nyata adalah hal yang mustahil. Bagian penutup membahas 'Market Regime Change', yaitu perubahan karakteristik pasar akibat faktor makroekonomi, regulasi, atau peristiwa seperti COVID-19. Data historis yang terlalu lama (misalnya 20 tahun) sering kali tidak relevan karena distribusi data telah berubah total akibat perubahan rezim ini. Video Bagian 1 diakhiri dengan peringatan bahwa perubahan rezim adalah krisis eksistensial bagi para Quant karena pola masa lalu menjadi tidak berguna.

Community Posts

Tipuan Mematikan Backtesting Investasi Kuantitatif: Strategi Bertahan Hidup Praktis 2026

makedream2026년 3월 8일8110

Write about this video