Kimi K2.6 Bisa Memulai Bisnis dalam 40 Menit! (Analisis Model Lengkap)

BBetter Stack
Computing/SoftwareAdvertising/MarketingSmall Business/StartupsInternet Technology

Transcript

00:00:00Jadi, seperti yang bisa Anda lihat dari contoh ini, Anda bisa memulai bisnis
00:00:04agensi web kecil Anda sendiri dalam 40 menit menggunakan fitur Kimi ini.
00:00:07Nah kawan-kawan, Moonshot AI kembali dengan pembaruan lain pada model unggulan mereka, Kimi.
00:00:13Kimi K 2.6 adalah model terbaru mereka yang menjanjikan pengodean canggih,
00:00:18eksekusi jangka panjang, dan kemampuan kawanan agen.
00:00:22Dalam video hari ini, kita akan melihat model baru ini, melihat bagaimana kinerjanya pada berbagai
00:00:27tugas agen, dan mencari tahu apakah itu benar-benar mengesankan seperti yang diiklankan.
00:00:32Ini akan sangat menyenangkan, jadi mari kita selami.
00:00:34Beberapa bulan yang lalu, saya meninjau Kimi K 2.5 dan kinerjanya sangat baik dalam desain front-end.
00:00:44Dan saya benar-benar terkesan dengan fitur kawanan agen mereka.
00:00:48Saya juga menyukai fakta bahwa mereka berusaha keras dalam UX di halaman chatbot mereka sendiri.
00:00:54Jadi, dalam iterasi berikutnya ini, Kimi menjanjikan lompatan yang cukup besar
00:00:57dalam bagaimana kita benar-benar menggunakan agen AI di lingkungan produksi.
00:01:02Pertama, kawanan agen pada dasarnya telah bertambah tiga kali lipat.
00:01:05Di K 2.5, kita melihat sekitar 100 sub-agen, tetapi K 2.6 menskalakan ini secara horizontal
00:01:12menjadi 300 agen khusus yang dapat melakukan hingga 4.000 langkah terkoordinasi.
00:01:18Jadi, ini adalah pembaruan yang cukup masif.
00:01:20Jadi, sekarang Anda dapat menjalankan lebih banyak tugas paralel pada saat yang bersamaan.
00:01:24Mereka juga menambahkan mode pemikiran yang dipertahankan baru,
00:01:26yang menjaga jejak penalaran model tetap konsisten di seluruh tugas multi-giliran.
00:01:31Ini menghentikan penyimpangan memori yang biasanya terjadi saat Anda mendalami alur kerja yang kompleks.
00:01:36Dan kemudian kita memiliki tugas cakrawala panjang.
00:01:39Dan dalam pengujian mereka sendiri, itu berhasil melakukan tugas rekayasa 13 jam dengan peningkatan throughput 185%.
00:01:46Dan jika berbicara tentang estetika, itu telah beralih ke desain berbasis pengodean.
00:01:51Alih-alih hanya membuat halaman landas yang cantik, K 2.6 menggunakan penyandi visi asli mereka
00:01:57yang disebut MoonVIT untuk menalar tentang struktur UI dan UX di tingkat yang lebih dalam.
00:02:03Sekarang ia dapat menangani alur kerja full stack mulai dari autentikasi hingga pencatatan basis data,
00:02:08mengubah referensi visual tunggal atau perintah menjadi prototipe interaktif yang berfungsi penuh
00:02:14dengan animasi GSAP dan efek pemicu yang digulir dan segala macam kebaikan lainnya.
00:02:19Dan omong-omong, semua ini adalah sumber terbuka, termasuk penyandi visi.
00:02:23Jadi, jika Anda mau, Anda benar-benar bisa menjalankannya secara mandiri,
00:02:26terlepas dari arsitektur Kimi jika Anda mendapatkan modelnya dari Hugging Face.
00:02:30Jadi, semua itu terdengar sangat mengesankan, tetapi mari kita uji dan lihat bagaimana kinerjanya sebenarnya.
00:02:35Dan model Kimi bersifat sumber terbuka, jadi Anda secara teoretis dapat menggunakannya dalam pengaturan apa pun yang Anda sukai.
00:02:40Tetapi untuk menguji Kawanan Agen mereka, saya akan menggunakan antarmuka chatbot mereka sendiri
00:02:46untuk hasil terbaik. Pertama-tama, saya ingin mencoba fitur Kawanan Agen yang baru.
00:02:50Melihat contoh mereka di situs mereka, satu hal benar-benar menarik perhatian saya.
00:02:54Itu adalah bagian di mana K 2.6 digunakan untuk mengidentifikasi 30 toko ritel di Los Angeles tanpa
00:03:01situs web resmi dari Google Maps dan membuat halaman landas berkonversi tinggi untuk masing-masing toko tersebut.
00:03:06Saya telah melihat tren ini beredar di Instagram, jadi saya ingin mencobanya dan melihat apakah kita bisa benar-benar
00:03:11membuat agensi web kecil kita sendiri. Jadi, untuk tes ini, saya memutuskan untuk melakukan sesuatu yang serupa.
00:03:16Jadi, saya tinggal di Toronto dan apa yang saya perhatikan adalah bahwa banyak notaris di sekitar area saya memiliki situs web yang
00:03:21tidak ada atau sangat ketinggalan zaman. Jadi, saya pikir akan menjadi ide yang keren untuk mengidentifikasi
00:03:2620 notaris di sekitar area Toronto yang lebih besar dan mencarinya di Google Maps atau di
00:03:32Canadian Yellow Pages dan membuat halaman landas berkonversi tinggi untuk masing-masing dari mereka.
00:03:37Dan untuk tugas ini, Kimi menjalankan lima sub-agen, masing-masing didedikasikan untuk salah satu sub-tugas.
00:03:43Dan sangat menarik untuk melihat bagaimana sub-agen tersebut benar-benar menavigasi web dan mengunjungi
00:03:48situs web tersebut. Dan mereka bahkan mencoba memperkirakan apakah situs web tersebut sudah ketinggalan zaman atau tidak menggunakan penilaian
00:03:53mereka sendiri. Secara total, dibutuhkan waktu sekitar 40 menit bagi Kimi untuk menyelesaikan seluruh alur kerja.
00:03:58Tetapi pada akhirnya, Kimi menghasilkan laporan analisis yang sangat mendetail tentang semua temuan
00:04:03tentang masing-masing situs web. Dan itu bahkan menghasilkan contoh surel penjangkauan yang bisa saya kirimkan ke calon
00:04:09klien untuk proposal situs web, bersama dengan laporan lain mengenai ukuran pasar keseluruhan dan potensi dampak pendapatan
00:04:16Dan di sampingnya, tentu saja, kami juga mendapatkan semua file yang dihasilkan. Dan ada
00:04:22juga halaman khusus yang dibuat Kimi di mana saya bisa melihat pratinjau setiap halaman landas. Dan saya harus
00:04:27mengatakan semua halaman landas ini terlihat persis sama, yang agak mengecewakan. Tapi mungkin
00:04:32itu adalah kesalahan saya karena tidak memberikan perintah yang cukup mendetail, meskipun situs web mereka sendiri memang memiliki
00:04:38perintah yang sama dengan yang saya gunakan. Tapi mungkin mereka memiliki beberapa rangkaian yang telah dikonfigurasi sebelumnya. Jadi sebagai tugas tindak lanjut,
00:04:43saya meminta Kimi untuk menelusuri setiap halaman ini dan menerapkan gaya unik untuk masing-masingnya, dan juga menambahkan
00:04:49beberapa gambar untuk membuat halaman landas lebih menarik. Dan di sini kita bisa melihat bahwa Kimi benar-benar menghasilkan
00:04:55gambar kustom untuk masing-masing situs. Dan sebagai catatan samping yang lucu, saya juga memperhatikan bagaimana Kimi suka
00:05:00memuji dirinya sendiri. Misalnya, di sini, ke-20 gambar itu menakjubkan. Sekarang saya akan membangun 20 halaman landas yang benar-benar
00:05:06unik. Maksud saya, oke, Kimi, tapi biarkan saya yang menilainya. Tapi tetap saja, butuh waktu bagi Kimi
00:05:12sekitar 17 menit untuk menyelesaikan tugas tindak lanjut ini. Dan sekali lagi, kita lihat di sini Kimi memuji dirinya sendiri
00:05:17bahwa halaman landas tersebut terlihat fantastis. Oke, Kimi, oke. Jadi sekarang kita punya halaman pratinjau baru,
00:05:23tapi yang satu ini rusak aneh. Mungkin ada masalah gaya CSS atau sesuatu, tapi tidak apa-apa.
00:05:28Saya akan mengabaikan itu. Saya lebih tertarik pada halaman web itu sendiri. Jadi halaman-halaman baru memang terlihat jauh
00:05:34lebih baik karena sekarang kita mendapatkan animasi CSS yang tampak bagus ini, dan setiap halaman web sekarang memiliki gambar
00:05:40header, yang dihasilkan oleh AI, tapi tetap saja, itu header yang bagus. Tapi saya juga memperhatikan bahwa setiap halaman
00:05:45masih mengikuti pola yang sama. Kami memiliki bagian yang sama, struktur situs yang sama. Jadi meskipun
00:05:51semua halaman ini memang terlihat berbeda sekarang, mereka masih memiliki templat yang sama, yang agak
00:05:56mengecewakan karena saya benar-benar berharap untuk pendekatan yang lebih unik. Tapi ini awal yang baik
00:06:02meskipun demikian. Jadi seperti yang bisa Anda lihat dari contoh ini, Anda bisa memulai bisnis agensi web
00:06:07kecil Anda sendiri dalam 40 menit menggunakan fitur Kimi ini. Cukup minta kawanan agen Kimi untuk menelusuri
00:06:13bisnis lokal Anda dan hubungi masing-masing dari mereka dengan situs web yang dibuat khusus dan surel penjangkauan
00:06:18yang dibuat khusus dan Anda pada dasarnya mendapatkan pekerjaan sampingan yang bagus. Saya bayangkan setelah video ini, setiap bisnis
00:06:25lokal kecil akan mulai menerima ratusan surel proposal ini dengan situs web yang dibuat khusus oleh AI
00:06:29yang disesuaikan. Tapi hei, ya sudahlah. Dan saya harus mencatat bahwa untuk menggunakan fitur kawanan agen
00:06:36ini, Anda harus berada pada paket allegretto mereka. Tapi saya juga harus mengatakan bahwa saya cukup
00:06:41yakin ini jauh lebih murah daripada meminta Claude code untuk melakukan tugas yang sama. Sayang sekali penggunaan Kimi
00:06:46tidak memberi kita detail lebih lanjut tentang berapa banyak token yang dihabiskan untuk tugas 40 menit
00:06:53yang raksasa ini. Tapi saya merasa bahwa saya pasti sudah menghabiskan semua batas penggunaan saya sekarang
00:06:58jika saya menggunakan Claude untuk melakukan hal yang sama. Jadi, itulah kawanan agen yang baru ditingkatkan. Dan omong-omong,
00:07:04jika Anda baru saja menggunakan kawanan agen Kimi untuk melakukan beberapa eksperimen menarik, bagikan temuan Anda
00:07:09di kolom komentar di bawah ini. Sekarang saya ingin menguji bagaimana Kimi telah meningkat dalam hal pengodean.
00:07:14Jadi mereka mengklaim bahwa 2.6 telah melihat peningkatan yang kuat dalam tugas pengodean jangka panjang dengan generalisasi
00:07:20yang andal. Jadi untuk tugas ini, saya memutuskan untuk meminta Kimi membuat aplikasi web sederhana dengan front end
00:07:26dan antarmuka back end yang juga menangani pengikisan web. Jadi kita mungkin semua pernah mendengar betapa sangat
00:07:31mahalnya harga RAM dalam beberapa bulan terakhir. Jadi saya pikir akan menjadi ide keren untuk
00:07:36membuat situs web perbandingan harga yang secara aktif mengikis data harga untuk berbagai RAM dan memberi Anda
00:07:42tabel perbandingan untuk menemukan opsi termurah di luar sana. Jadi butuh waktu bagi Kimi sekitar 12 menit untuk
00:07:47menyelesaikan tugas ini. Dan saya bisa melihat bahwa mereka sekarang benar-benar telah menambahkan penghitung token di versi
00:07:52CLI terbaru mereka. Jadi kita sekarang bisa memantau pengeluaran token kita yang sebenarnya, yang cukup keren. Jadi inilah
00:07:59hasil akhirnya. Dan seperti yang Anda lihat di sini, itu menunjukkan tema gelap yang bagus untuk situs tersebut. Dan kita bisa beralih
00:08:05melalui merek individu. Dan kita juga bisa melihat opsi harga yang berbeda dari toko yang berbeda untuk
00:08:11masing-masing RAM. Dan yang lebih keren lagi adalah kita bisa memicu penyegaran langsung, yang secara aktif
00:08:16mengikis ulang data toko. Sayang sekali itu tidak bisa mengambil sebagian besar gambar produk,
00:08:21tetapi sebagian besar fungsinya ada di sana. Dan itu juga memiliki bagian perbandingan. Tapi tidak ada cara untuk menambahkan
00:08:27apa pun ke sana. Jadi saya harus meminta Kimi tugas tindak lanjut untuk memperbaiki masalah ini. Dan sekarang kita mendapatkan tombol
00:08:34tambahkan untuk membandingkan. Dan jika kita pindah ke tab bandingkan, kita sekarang mendapatkan tabel perbandingan yang keren
00:08:41dari semua RAM yang dipilih. Jadi itu cukup bagus. Dan melihat kodenya, saya melihat bahwa ia memilih untuk
00:08:46membangun situs menggunakan Node JS dan Express dasar. Dan itu bahkan tidak menggunakan react tetapi malah memilih
00:08:53versi JavaScript vanilla ini di mana setiap perubahan memodifikasi elemen HTML dalam secara langsung, yang merupakan
00:08:59pilihan yang menarik. Tapi hei, jika berhasil, saya tidak bisa mengeluh. Dan terakhir, ia bahkan menambahkan fungsi pengikis
00:09:05yang bagus ini yang menggunakan axios dan cheerio untuk mengikis Amazon, new egg dan Best Buy. Jadi itu
00:09:13cukup keren. Jadi begitulah, kawan-kawan, itulah model Kimi K 2.6 yang baru. Dan sejujurnya,
00:09:19menilai dari semua tes yang telah kita lakukan hari ini, saya tidak akan mengatakan itu kemajuan besar dari 2.5.
00:09:25Tapi ada beberapa peningkatan kualitas hidup yang sangat bagus. Dan saya menghargai fakta bahwa
00:09:30moonshot AI terus meningkatkan platform mereka dengan banyak hal. Dan saya juga suka fakta bahwa mereka menyediakan alternatif
00:09:36yang lebih murah dan solid untuk beberapa raksasa yang lebih mahal di luar sana seperti Claude code. Jadi secara keseluruhan,
00:09:43kerja bagus moonshot AI teruskan kerja bagus ini. Dan saya tentu saja bersemangat untuk melihat bagaimana Kimi meningkat di
00:09:48masa depan. Dan kawan-kawan, jika Anda menemukan video ini berguna atau informatif, tolong beri tahu saya dengan
00:09:53menghancurkan tombol suka di bawah video. Dan juga pastikan untuk berlangganan ke saluran kami agar Anda
00:09:58tidak ketinggalan video perincian teknis kami di masa depan. Ini adalah Andres dari
00:10:04better stack dan saya akan melihat Anda di video berikutnya.

Key Takeaway

Kimi K 2.6 menawarkan alternatif yang efisien secara biaya dibandingkan model seperti Claude Code, dengan kemampuan skalabilitas hingga 300 agen dan efisiensi tugas rekayasa yang meningkat 185%.

Highlights

  • Kimi K 2.6 meningkatkan skalabilitas kawanan agen menjadi 300 agen khusus yang mampu menjalankan hingga 4.000 langkah terkoordinasi.

  • Mode pemikiran yang dipertahankan (maintained thinking mode) menjaga konsistensi jejak penalaran model di seluruh tugas multi-giliran untuk mencegah penyimpangan memori.

  • Penyandi visi MoonVIT memungkinkan Kimi K 2.6 menangani alur kerja full stack, mulai dari autentikasi hingga pembuatan prototipe interaktif dengan animasi GSAP.

  • Pengujian menunjukkan Kimi K 2.6 mampu menyelesaikan tugas rekayasa selama 13 jam dengan peningkatan throughput sebesar 185%.

  • Penggunaan Kimi K 2.6 memungkinkan pembuatan prototipe agensi web lokal untuk 20 notaris dalam waktu 40 menit melalui alur kerja agen terotomatisasi.

  • Antarmuka CLI versi terbaru kini menyertakan penghitung token yang memungkinkan pemantauan konsumsi sumber daya secara langsung selama eksekusi tugas.

Timeline

Kemampuan dan Peningkatan Model Kimi K 2.6

  • Skalabilitas kawanan agen meningkat menjadi 300 sub-agen yang mampu menjalankan 4.000 langkah terkoordinasi.
  • Mode pemikiran baru menjaga konsistensi penalaran dalam alur kerja multi-giliran yang kompleks.
  • Desain berbasis pengodean menggunakan penyandi visi MoonVIT untuk analisis struktur UI/UX yang lebih dalam.

Pembaruan K 2.6 berfokus pada eksekusi jangka panjang dan efisiensi agen. Model ini beralih dari sekadar desain halaman landas visual menuju pemahaman struktur aplikasi full stack yang lebih mendalam, termasuk pengelolaan autentikasi dan basis data.

Eksperimen Agensi Web Lokal

  • Alur kerja otomatis mengidentifikasi 20 bisnis notaris di Toronto yang membutuhkan pembaruan situs web.
  • Proses pembuatan situs web dan laporan proposal diselesaikan dalam waktu 40 menit menggunakan lima sub-agen.
  • Tugas tindak lanjut menambahkan gaya CSS unik dan gambar kustom pada setiap halaman landas dalam waktu 17 menit.

Pengujian dilakukan dengan mengotomatisasi pencarian bisnis lokal melalui Google Maps dan Yellow Pages. Hasilnya adalah laporan analisis pasar, surel penjangkauan, dan prototipe situs web interaktif untuk setiap entitas, meskipun penggunaan template yang konsisten memerlukan penyesuaian manual melalui perintah tindak lanjut.

Pengembangan Aplikasi dan Efisiensi Pengodean

  • Aplikasi perbandingan harga RAM dibangun menggunakan Node.js, Express, dan JavaScript vanilla dalam 12 menit.
  • Fungsi pengikis web diintegrasikan menggunakan pustaka axios dan cheerio untuk mengambil data real-time dari toko ritel.
  • Penghitung token pada antarmuka CLI menyediakan transparansi biaya penggunaan untuk tugas-tugas kompleks.

Pengujian kemampuan pengodean membuktikan efisiensi model dalam membangun aplikasi web fungsional yang mampu melakukan penyegaran data aktif. Meskipun menggunakan pendekatan arsitektur non-React, aplikasi yang dihasilkan mampu memproses tabel perbandingan harga secara efektif dengan integrasi fungsi pengikisan web yang stabil.

Community Posts

View all posts