00:00:00Tunggu, saya baru sadar.
00:00:01Laporan ini berdasarkan informasi publik per Januari 2025.
00:00:06Aduh, gawat, 2025? Bukan ini yang saya minta.
00:00:15Moonshot AI baru saja merilis model AI terbaru mereka, Kimi k 2.5, dan model ini sedang sangat viral
00:00:22di internet minggu ini.
00:00:24Beberapa orang bahkan sampai bilang kalau ini mungkin model favorit mereka sejauh ini.
00:00:29Jadi, tentu saja saya harus mencobanya untuk melihat apa yang sedang ramai dibicarakan dan menentukan apakah ini
00:00:34benar-benar sesuatu yang baru atau hanya model lain yang dibesar-besarkan oleh pemasaran yang mencolok.
00:00:39Jadi, itulah yang akan kita cari tahu di video hari ini.
00:00:42Ini akan sangat menyenangkan, jadi mari kita mulai.
00:00:49Jadi, Kimi k 2.5 adalah model open source terbaru yang dikembangkan oleh perusahaan Tiongkok bernama Moonshot
00:00:55AI.
00:00:56Baru enam bulan lalu Richard membahas K2 secara mendalam, dan hari ini kita kembali
00:01:01untuk melihat apa yang baru di K2.5.
00:01:05Jadi, apa istimewanya model ini?
00:01:06Apa bedanya dengan ribuan model baru lainnya yang muncul hampir setiap hari?
00:01:12Nah, ada dua hal.
00:01:13Pertama-tama, ia diklaim sangat ahli dalam penglihatan (vision) dan pengodean.
00:01:17Ia bahkan berani melabeli dirinya sebagai open source SOTA.
00:01:21SOTA.
00:01:22Apa kalian tahu apa artinya itu?
00:01:24Sebenarnya saya sendiri harus mencarinya, saya tidak benar-benar tahu sebelumnya.
00:01:27Oh, oke, artinya “state of the art” (tercanggih).
00:01:30Oke, saya baru tahu hari ini.
00:01:32Pokoknya, ini benar-benar teknologi tercanggih dalam tolok ukur agentic, visi, dan pengodean.
00:01:37Dan hal kedua yang menonjol dari model ini adalah fungsi baru yang disebut
00:01:42Agent Swarm.
00:01:44Di mana ia mampu menjalankan hingga seratus sub-agen dan 1.500 panggilan alat (tool calls) secara
00:01:51bersamaan, yang menghasilkan performa 4,5 kali lebih cepat.
00:01:55Untuk model ini, mereka menggunakan metode pelatihan baru yang disebut parallel agent reinforcement learning
00:02:00atau PARL.
00:02:01Ini berarti model tersebut dapat mengatur seluruh kawanan agen secara mandiri dengan membuat
00:02:06agen orkestrator yang dapat dilatih, yang pada dasarnya menjalankan tugas dengan memecahnya menjadi
00:02:12sub-tugas yang dapat diparalelkan, dan mengawasi semua agen ini untuk memastikan seluruh operasi tidak
00:02:18mengalami “serial collapse” yang sering terjadi pada alur kerja multi-agen seperti ini.
00:02:23Cara mereka mengatasinya adalah dengan memberikan imbalan (rewards) kepada setiap sub-agen pada tahap langkah kritis yang terpisah,
00:02:28dan seluruh sistem ini memungkinkan k 2.5 mencapai peningkatan performa yang nyata.
00:02:34Jadi, kita pasti akan mengujinya.
00:02:35Sekarang, saya tidak akan membahas terlalu detail tentang semua tolok ukur (benchmarks) yang berbeda karena,
00:02:40sejujurnya, setiap video yang saya lihat sekarang selalu memuji angka-angka ini, padahal saya rasa
00:02:44kita bahkan tidak bisa lagi memercayai angka-angka tersebut.
00:02:47Bahkan grafik tolok ukurnya saja tidak rapi, ayolah.
00:02:51Jadi, saya akan berfokus pada dua hal yang mereka klaim sebagai keunggulan model ini.
00:02:55Visi dan pengodean, serta fungsi agent swarm yang baru.
00:03:00Mari kita uji.
00:03:02Mereka juga punya alat CLI sendiri yang disebut Kimi CLI.
00:03:06Jadi, itulah yang akan saya gunakan hari ini untuk melakukan pengujian.
00:03:09Salah satu fitur paling mengesankan yang mereka klaim adalah kemampuan untuk mengambil rekaman video
00:03:13UX dari situs web tertentu dan mereplikasinya ke dalam kode.
00:03:19Itu sangat mengesankan.
00:03:20Untuk mencobanya, saya membuat rekaman video halaman produk iPad Air Apple dengan segala
00:03:25animasi dan transisi mewahnya.
00:03:28Dan saya membuat folder yang hanya berisi file rekaman tersebut.
00:03:32Sekarang saya akan memerintahkan k 2.5 untuk membuat situs web promosi produk iPad Air
00:03:38berdasarkan video ini.
00:03:39Sebelum menjalankan perintah shell, ia akan bertanya apakah kita mengizinkannya, jadi saya akan izinkan
00:03:44untuk sesi ini.
00:03:46Dan sekarang ia sedang berjalan.
00:03:48Wah, menarik.
00:03:49Ia mendeteksi bahwa filenya terlalu besar.
00:03:51Jadi, ia langsung menggunakan FFmpeg untuk mengompresnya sendiri.
00:03:56Saya sangat penasaran, bagaimana model ini memproses dan memahami file video.
00:04:01Ternyata ia mengambil file video tersebut dan sekali lagi menggunakan FFmpeg untuk mengekstrak
00:04:06frame-frame kunci dari video untuk digunakan sebagai bantuan visual dalam membangun situs web.
00:04:11Model ini membutuhkan waktu sekitar lima setengah menit untuk menyelesaikan tugasnya.
00:04:15Jadi, ini jelas bukan model tercepat yang ada.
00:04:18Dan perlu diingat, saya menggunakan API mereka sendiri untuk memanggil modelnya, bukan versi lokal.
00:04:23Tapi bagaimanapun, setelah selesai, kita bisa lihat di sini bahwa ia memberikan ringkasan mendetail tentang apa
00:04:28yang telah dilakukannya.
00:04:29Sekarang mari kita lihat situsnya sendiri.
00:04:30Oh, wow.
00:04:31Lihat itu.
00:04:32Ia berhasil menangkap seluruh estetika desain Apple dan bahkan membuat iPad yang melayang 3D
00:04:38di tengah.
00:04:39Dan sepertinya ia juga merespons gerakan mouse.
00:04:42Keren sekali.
00:04:43Lalu ada bagian carousel yang bagus dengan jendela berbeda, sayangnya bagian ini tidak
00:04:48merespons saat saya mengeklik titik-titiknya, tapi tampilannya tetap elegan.
00:04:52Lalu ada bagian lain dengan beberapa animasi.
00:04:55Oh, dan di sini ada carousel yang bisa dinavigasi dengan berbagai desain.
00:05:00Keren juga.
00:05:01Lalu ada beberapa bagian lagi yang semuanya terasa sangat mirip dengan estetika Apple.
00:05:06Sejujurnya, ini cukup bagus.
00:05:07Kenyataan bahwa ia mampu menghasilkan situs web yang bagus dengan semua animasi ini hanya
00:05:12dari video referensi dan instruksi singkat sangatlah luar biasa.
00:05:16Baiklah.
00:05:17Tapi Apple adalah merek terkenal.
00:05:18Saya yakin estetika desainnya pasti sudah menjadi bagian dari data pelatihan model mereka.
00:05:23Jadi, ini mungkin tugas yang mudah bagi model tersebut.
00:05:26Sekarang mari kita coba sesuatu yang lebih menarik dan agak aneh.
00:05:29Saya telah membuat folder lain berisi satu gambar Mr. Burns dari The Simpsons.
00:05:34Mari kita lihat seberapa kreatif Kimi k 2.5.
00:05:37Saya menambahkan instruksi ini: Mr. Burns mencalonkan diri sebagai presiden.
00:05:40Saya ingin kamu membuat situs web kampanye presiden untuk Mr. Burns, yang mencakup kebijakan
00:05:45dan agenda politiknya berdasarkan sifat dan motivasi karakter ini.
00:05:49Mari kita lihat hasilnya.
00:05:51Begitu proses penalaran dimulai, kita bisa melihat bagaimana ia memikirkan desainnya.
00:05:55Asetnya jelas.
00:05:56Montgomery Burns dengan setelan hijau tua khasnya dan dasi warna persik.
00:06:01Ini adalah referensi visual utama untuk estetika kampanye.
00:06:05Keren.
00:06:06Dan bagian ini ternyata memakan waktu lebih lama untuk selesai.
00:06:08Sekitar enam menit totalnya.
00:06:11Tapi sekarang setelah selesai, sekali lagi, kita melihat ringkasan detail dari apa yang dihasilkan dan kita lihat
00:06:16di sini ia menambahkan bagian visi, bagian kebijakan, materi promosi, dan lain-lain.
00:06:22Dan lihat itu.
00:06:23Ia bahkan menambahkan Easter egg tersembunyi untuk bersenang-senang.
00:06:26Wah, itu keren banget.
00:06:27Sekarang mari kita lihat tampilan situs webnya.
00:06:29Wow.
00:06:30Lihat itu.
00:06:31Keunggulan dalam pemerintahan.
00:06:33“Saya membuat negara ini hebat lagi demi saya sendiri.”
00:06:36Oh, dan ada tombol nuklir kecil di sana.
00:06:40Apa yang terjadi kalau saya klik?
00:06:41“Smithers, beri saya kopi.”
00:06:43Keren.
00:06:44Bahkan ada halaman profil (about) yang mendetail.
00:06:46Dan ada bagian kemakmuran.
00:06:49Animasinya sangat halus.
00:06:50Wow.
00:06:51Jadi, sepertinya Kimi k 2.5 benar-benar tahu cara membuat grafis yang menarik.
00:06:55Ini jelas jauh lebih baik daripada desain-desain ungu membosankan yang kita lihat
00:07:01dihasilkan oleh model lain.
00:07:02Dan lihat itu.
00:07:04Kebijakan untuk kaum elit.
00:07:05Ya ampun.
00:07:06Banyak sekali lelucon nakal di sini.
00:07:08Luar biasa.
00:07:10Voucher kesehatan hanya bisa ditukarkan di pusat medis Burns.
00:07:14Daftar tunggu transplantasi organ diurutkan berdasarkan kekayaan bersih.
00:07:18Tembok pembatas yang terbuat dari emas.
00:07:21Apa kata orang-orang?
00:07:22Oke, di sini ada kutipan karakter Simpsons, formulir kontak, dan halaman donasi
00:07:29kampanye.
00:07:30Bahkan ada toko merchandise.
00:07:31Oke, tapi bagian itu statusnya “segera hadir”.
00:07:33Ya, karena ini adalah halaman HTML statis.
00:07:35Baiklah.
00:07:36Sekarang saya ingin memicu Easter egg itu.
00:07:38Bagaimana caranya?
00:07:39Kode Konami tertulis saya harus memasukkan kode Konami.
00:07:43Apa itu kode Konami?
00:07:45Oh, oke.
00:07:46Kode Konami adalah kode curang video game yang terkenal.
00:07:49Wow.
00:07:50Saya tidak tahu hal ini sebelumnya.
00:07:51Sekali lagi, saya baru belajar hari ini.
00:07:52Jadi: atas, atas, bawah, bawah, kiri, kanan, kiri, kanan, A, B. Oh, oke.
00:07:58Nah, berhasil.
00:07:59Muncul teks besar “ha ha ha” di seluruh halaman dan slogannya berubah jadi “excellent”.
00:08:06Lucu juga.
00:08:07Sejujurnya, ada banyak hal menarik di sini sehingga saya akan menyertakan tautan
00:08:10ke beranda ini di deskripsi agar kalian bisa mengeceknya sendiri nanti.
00:08:14Para penggemar The Simpsons mungkin akan sangat menyukai ini.
00:08:17Ini sungguh mengesankan, jujur saja.
00:08:19Saya tidak menyangka ia bisa membuat situs web yang menyenangkan hanya dari satu gambar dan instruksi teks pendek.
00:08:24Baiklah.
00:08:25Tapi sekarang saya ingin mencoba fungsi agent swarm yang banyak dibicarakan orang.
00:08:29Melihat contoh-contoh dari mereka, sepertinya fitur swarm ini sangat bagus untuk tugas-tugas seperti
00:08:33mengumpulkan riset tentang topik tertentu atau tindakan apa pun yang memerlukan
00:08:39pendekatan multi-utas (multi-threaded).
00:08:40Namun untuk menguji fitur ini secara maksimal, sebaiknya gunakan halaman resmi Kimi
00:08:46dan jalankan di chatbot mereka karena mereka telah menambahkan banyak elemen visual
00:08:50dan animasi keren yang membuat proses swarm terlihat sangat menarik.
00:08:54Kalian akan melihatnya sebentar lagi.
00:08:56Untuk pengujian ini, saya akan meminta agent swarm mengumpulkan informasi sebanyak mungkin
00:09:00tentang berbagai model, mana yang paling banyak digunakan, dan meminta k 2.5 untuk menyusun
00:09:06semua informasi tersebut ke dalam dokumen PDF yang terformat dengan baik.
00:09:10Selain itu, jika kalian ingin model menggunakan swarm, sebaiknya kalian memintanya secara eksplisit karena
00:09:16dalam salah satu pengujian saya sebelumnya, saya meminta sebuah tugas dan k 2.5 menyimpulkan sendiri bahwa
00:09:23ia tidak perlu menggunakan swarm dan mengembalikan beberapa kredit token saya.
00:09:27Jadi, jika kalian benar-benar ingin mengaktifkan swarm, pastikan untuk memberitahunya.
00:09:31Baiklah.
00:09:32Mari kita luncurkan tugasnya.
00:09:33Begitu dimulai, kita bisa melihat animasi keren di antarmuka chatbot Kimi ini.
00:09:39Dan sejujurnya ini adalah sesuatu yang saya perhatikan dari Moonshot AI.
00:09:43Mereka sangat unggul dalam memberikan pengalaman pengguna yang menyenangkan dan bergaya permainan (gamified),
00:09:49yang membuat seluruh proses penggunaan alat mereka jauh lebih menyenangkan.
00:09:52Dan sekali lagi, Kimi tampil unik di sini saat model tersebut menetapkan tugas kepada
00:09:57para agen.
00:09:58Ia bahkan memberikan lencana identitas kepada masing-masing agen.
00:10:01Kita juga bisa memantau status penyelesaian tugas mereka secara real-time.
00:10:05Saat para agen menyelesaikan tugas, kita juga bisa mengikuti perkembangan mereka di jendela
00:10:10utama.
00:10:11Kita bisa melihat halaman web yang mereka kunjungi dan kode yang mereka hasilkan.
00:10:15Pada titik ini, kalian bahkan bisa bertaruh agen mana yang akan menyelesaikan tugasnya
00:10:20paling cepat.
00:10:21Setelah agen menyelesaikan tugas, kalian bisa melihat gelembung kecil muncul di atas avatar mereka.
00:10:26Sekitar 10 setengah menit kemudian, kawanan agen saya telah menyelesaikan tugas yang diberikan dan kita mendapatkan
00:10:31dokumen PDF ini sebagai hasilnya.
00:10:33Tampaknya ada teks di sini, tapi saya tidak bisa melihatnya dengan jelas.
00:10:39Oke, jadi saya harus menyalin-tempelnya ke tempat lain untuk memahaminya.
00:10:43Oke, isinya “Coding Models, Comparative Analysis” (Analisis Perbandingan Model Pengodean).
00:10:46Oke, oke.
00:10:47Wah, pilihan desain yang sangat buruk sejak awal.
00:10:50Tapi baiklah, jangan langsung mengambil kesimpulan.
00:10:53Mari kita lihat isi laporannya.
00:10:55Oke, di sini ada ringkasan eksekutif.
00:10:58Temuan utama.
00:10:5981 persen pengembang menggunakan atau berencana menggunakan AI.
00:11:0359 persen pengembang menjalankan tiga alat AI secara paralel.
00:11:06Oke, oke, menarik.
00:11:08Dan kita lihat di sini bahwa Claude Code Opus 4.5 mendominasi tangga data.
00:11:13Lalu kita lihat tren pasar di sini.
00:11:1646 persen pengembang secara aktif tidak memercayai hasil AI.
00:11:20Wah, ini mengejutkan.
00:11:22GitHub Copilot adalah pemimpin pasar dengan 42 persen pangsa pasar.
00:11:26Wow.
00:11:27Llama 4 Scout sepertinya punya jendela konteks terbesar dengan 10 juta token.
00:11:31Itu sangat mengesankan.
00:11:32Oke, ini dia.
00:11:33Bagian yang paling menarik.
00:11:34Kesimpulan utama.
00:11:35Oke, mari kita lihat.
00:11:36Tidak ada pemenang tunggal.
00:11:37Aduh, payah sekali.
00:11:39Tidak asyik.
00:11:4145 persen kode yang dihasilkan AI memiliki kerentanan.
00:11:43Ya, itu memang sesuatu yang perlu dikhawatirkan.
00:11:46Tunggu, saya baru sadar laporannya berdasarkan informasi publik per Januari
00:11:522025.
00:11:54Aduh, tidak.
00:11:56Aduh, payah.
00:11:572025.
00:11:59Bukan itu yang saya minta.
00:12:02Saya secara khusus memintanya informasi tentang model yang paling banyak digunakan saat ini.
00:12:09Kenapa kamu tidak memakai data dari Januari 2026?
00:12:14Anda benar sekali.
00:12:15Seharusnya saya meriset data dari 2025 dan Januari 2026.
00:12:21Perilaku khas LLM.
00:12:23Saya sangat kecewa padamu, Kimi.
00:12:25Saya baru saja membuang banyak token dan 10 menit waktu saya untuk informasi yang sudah usang.
00:12:30Yah, sudahlah.
00:12:31Jadi begitulah.
00:12:32Itulah Kimi k 2.5.
00:12:35Meskipun saya sangat kecewa dengan kemampuannya mengikuti instruksi di tes terakhir, saya tetap
00:12:40menganggap ini model yang cukup bagus.
00:12:42Saya tidak akan bilang ini revolusioner atau yang tercanggih, tapi ia punya kelebihan sendiri.
00:12:47Saya pasti akan merekomendasikannya jika kalian ingin membuat situs web yang benar-benar indah,
00:12:51sesuatu yang layak dipamerkan di awwwards.com.
00:12:55Untuk itu saya pasti akan memilih k 2.5 dibandingkan salah satu model Claude Code, misalnya.
00:13:01Dan sejujurnya, fitur swarm-nya terlihat sangat keren dan pasti seru untuk
00:13:06digunakan.
00:13:07Tapi tahukah kalian kalau fitur yang sama bisa didapatkan menggunakan Claude Code?
00:13:10Richard baru saja membuat video bagus yang mengeksplorasi topik tersebut, jadi pastikan untuk menonton video itu
00:13:14juga.
00:13:15Dan kawan-kawan, jika video ini bermanfaat atau setidaknya menghibur, beri tahu saya dengan
00:13:19menekan tombol suka di bawah video ini.
00:13:22Jangan lupa juga berlangganan ke saluran kami supaya kalian tidak ketinggalan
00:13:26video-video bedah teknis kami di masa mendatang.
00:13:28Saya Andris dari Better Stack dan sampai jumpa di video-video berikutnya.