Fitur Rahasia Agent Swarm Claude Code (Lebih Baik dari Kimi K2.5?)

BBetter Stack
컴퓨터/소프트웨어경제 뉴스AI/미래기술

Transcript

00:00:00Orang-orang mulai heboh membicarakan Kimi 2.5. Ini adalah model open-source dengan benchmark yang lebih baik
00:00:05daripada Opus, serta mode Agent Swarm yang sangat cerdas di mana orkestrator bisa membuat hingga 100
00:00:11agen khusus untuk tugas yang rumit. Tapi tahukah Anda bahwa fitur ini juga ada di dalam kode Claude,
00:00:17tersembunyi di balik flag rahasia dan ditemukan oleh seorang pengguna Twitter? Bagaimana cara menemukannya?
00:00:23Dan apakah Anthropic mencuri ide ini dari Kimi? Klik subscribe dan mari kita bahas. Anthropic mengumumkan
00:00:30sub-agen kustom pada Juli tahun lalu dan sejak saat itu banyak orang menggunakannya untuk berbagai
00:00:35tugas khusus. Kami sebenarnya pernah membuat video tentang itu juga. Namun sub-agen itu sendiri hanya
00:00:41memiliki cuplikan konteks yang lebih luas karena mereka dirancang untuk tugas spesifik. Mereka mengerjakan
00:00:48tugas tersebut, mengembalikan data, dan memiliki memori yang bersih kembali. Jadi, orang-orang menyiasati memori
00:00:54dengan meminta sub-agen mengeluarkan temuan mereka ke file markdown serta memperbarui file konteks utama.
00:01:01Jadi, jika sub-agen yang sama atau berbeda diminta melakukan pembaruan, mereka bisa membaca file tersebut
00:01:06dan melihat progres sub-agen sebelumnya. Namun Anda tetap harus membuat sub-agen secara manual,
00:01:12memberinya peran, akses ke keahlian tertentu, alat, izin, dan sebagainya. Inilah mengapa Agent Swarm baru milik Kimi
00:01:19membawa segalanya ke level baru karena orkestratorlah yang secara dinamis
00:01:25membuat sub-agen khusus untuk tugas tertentu, jadi Anda tidak perlu melakukan apa pun. Sub-agen ini
00:01:31dapat bekerja secara paralel untuk menyelesaikan tugas besar, dan setelah bagian mereka selesai, mereka akan
00:01:36menyerahkannya ke orkestrator yang akan memutuskan apakah sub-agen baru perlu dibuat dengan data tersebut
00:01:42demi menyelesaikan tugas yang rumit. Agent Swarm Kimi masih berupa proyek riset, tapi sudah
00:01:48menunjukkan peningkatan besar dibandingkan alur kerja agen tunggal. Lihatlah grafik ini, untuk tugas yang
00:01:53semakin kompleks, performanya tetap konsisten karena para agen bekerja secara paralel untuk
00:01:58menyelesaikan hal yang sama. Sejujurnya, Anda sudah bisa melakukan hal serupa di Claude Code,
00:02:04dengan fitur tugas baru yang memungkinkan Anda membuat daftar tugas dan membaginya ke masing-masing
00:02:10sub-agen. Masalahnya, sub-agen ini bersifat umum dan tidak dikhususkan untuk
00:02:15tugas spesifik tersebut. Saya juga tidak yakin apakah Claude secara otomatis mampu memberikan tugas kepada
00:02:21sub-agen kustom yang tepat. Tulis di komentar jika Anda sudah mencobanya. Tapi sepertinya
00:02:25tim Claude sedang mengerjakan cara agar orkestrator bisa secara otomatis membuat sub-agen secara instan
00:02:31berdasarkan tugasnya, dan fitur ini disembunyikan di balik sebuah flag yang ditemukan oleh Mike Kelly,
00:02:37yang menunjukkan cara kerjanya lewat cuitan ini. Di cuitan yang sama, ia membagikan tautan repo
00:02:42hasil fork dari CC Mirror yang disebut Claude Sneak Peek. Mari kita coba. Ini adalah rencana yang ditulis AI untuk membuat
00:02:48tampilan web untuk alat bernama XDL yang memungkinkan Anda mengunduh video dari X atau Twitter di
00:02:55terminal. Saya sudah menginstal dan menjalankan Claude Sneak Peek, yang tampilannya terlihat seperti
00:03:00versi minimal dari Claude Code. Saya akan memintanya membaca file plan.md dan membuat tugas-tugas
00:03:05yang bisa dijalankan oleh sekelompok agen (swarm). Saya biarkan dia membuat tugasnya, dan sekarang setelah selesai,
00:03:11saya akan memintanya menjalankan tugas-tugas tersebut menggunakan sub-agen. Sebelum saya lakukan itu,
00:03:16hanya untuk memastikan saya tidak memiliki sub-agen kustom, saya akan menjalankan perintah slash agent,
00:03:21dan bisa Anda lihat tidak ada sub-agen khusus atau kustom yang terpasang. Sekarang
00:03:26tugas sedang dijalankan, dan di sini ia secara otomatis menambahkan sub-agen front-end builder untuk tugas front-end.
00:03:32Bisa dilihat di sini kita memiliki satu tim; jika kita tekan bawah untuk melihat timnya, ada lima
00:03:37agen yang bekerja: team lead, QA tester, back-end builder, component builder, dan front-end builder,
00:03:42semuanya mengerjakan tugas di saat yang sama. Kita juga bisa melihat apa yang sedang dikerjakan setiap agen.
00:03:48Bisa dilihat QA tester sedang mencari pola, back-end builder juga sedang mencari
00:03:53pola dan membaca file, begitu juga dengan component builder dan front-end builder. Jika kita
00:03:57ingin melihat apa yang sedang dilakukan agen secara detail, kita bisa tekan enter dan sekarang kita masuk ke tampilan agen,
00:04:02di sini kita bisa melihat system prompt-nya. Jika kita kembali, sekarang ada delapan agen: component
00:04:07creator, API server, ada yang melakukan setup Vite, ada yang mengintegrasikan API, dan sekarang ada
00:04:13yang mengerjakan CSS, dan tim agen kita sepertinya terus bertambah. Jika kita tekan enter pada team lead,
00:04:18kita kembali ke tampilan utama Claude Code, jadi team lead adalah orkestrator utama Claude Code.
00:04:24Kita juga bisa melihat di tampilan utama bahwa setiap sub-agen memberikan status terbarunya,
00:04:29dan jika saya perkecil tampilannya sedikit dan geser ke atas, kita bisa melihat pesan-pesan yang dikirim sebelumnya dari semua
00:04:34agen yang berbeda. Dan sekarang setelah semua tugas selesai, kita mendapatkan file swarm project complete
00:04:41yang memberitahu kita semua yang telah dikerjakan, tapi kita juga mendapatkan swarm execution report yang merinci
00:04:47jumlah agen khusus yang digunakan, peran mereka, dan apakah mereka menyelesaikan tugasnya. Kita
00:04:52juga bisa geser ke bawah untuk melihat detail tepatnya apa yang dilakukan setiap agen. Berdasarkan seberapa banyak
00:04:59usaha yang sudah dikeluarkan tim Claude untuk fitur ini, saya rasa mereka tidak meniru Kimi. Saya pikir mereka melihat
00:05:04implementasi daring seperti agents.py dan ingin menambahkannya ke Claude Code secara native, tapi saya
00:05:10bisa mengerti mengapa mereka belum merilisnya. Pertama, saya rasa fitur ini belum melewati
00:05:16pelatihan berjam-jam seperti orkestrator Kimi 2.5, dan juga segalanya menjadi rumit bagi
00:05:22pengguna yang sudah memiliki beberapa atau banyak sub-agen. Misalnya, jika pengguna ingin menyelesaikan tugas yang rumit,
00:05:28bagaimana orkestrator tahu harus membuat sub-agen front-end baru atau menggunakan sub-agen
00:05:35milik pengguna yang sudah ada? Metrik atau data apa yang dia gunakan untuk membuat keputusan itu? Dan juga, keahlian menambah
00:05:42kerumitan baru. Jika pengguna sudah memiliki banyak keahlian yang diunduh, bagaimana orkestrator tahu
00:05:49kapan harus menggunakannya atau mengunduh miliknya sendiri yang mungkin lebih sesuai untuk
00:05:56tugas yang ada? Maksud saya, orkestrator ini, jika Anthropic nanti merilisnya, harus memproses banyak sekali
00:06:02data pengguna, agen, alat, dan keahlian, sebelum ia bisa memutuskan apakah perlu membuat sub-agen sendiri
00:06:10dan hal apa saja yang harus ditambahkan ke dalamnya. Saya sebenarnya tidak tahu apakah tim tersebut sedang mengerjakan fitur ini
00:06:16saat ini atau apakah mereka sudah memutuskan bahwa ini terlalu rumit dan tidak akan merilisnya. Saya tidak tahu.
00:06:22Bicara soal fitur, jika Anda menggunakan AI atau manusia untuk menambah fitur ke sebuah proyek dengan cepat dan
00:06:28ingin memastikan tidak ada yang rusak, maka Anda harus mencoba Betastack karena alat ini mampu
00:06:33memantau log di server Anda dan menggunakan deteksi anomali untuk memberitahu Anda jika ada masalah
00:06:38sebelum hal itu terjadi. Alat ini juga memiliki pelacakan eror berbasis AI untuk memberitahu Anda jika terjadi masalah
00:06:44pada front-end Anda. Jadi, segera cek Betastack sekarang juga.

Key Takeaway

Claude Code memiliki fitur rahasia 'Agent Swarm' yang memungkinkan pembuatan sub-agen secara otomatis dan paralel untuk menyelesaikan tugas pemrograman yang kompleks, menyaingi kemampuan model Kimi 2.5.

Highlights

Kimi 2.5 memperkenalkan Agent Swarm yang mampu mengelola hingga 100 agen khusus secara dinamis.

Fitur tersembunyi serupa ditemukan dalam kode Claude (Claude Code) melalui flag rahasia oleh Mike Kelly.

Claude Code versi eksperimental menunjukkan kemampuan membuat tim agen seperti QA tester dan pengembang secara otomatis.

Sub-agen dalam sistem swarm bekerja secara paralel untuk menyelesaikan tugas-tugas besar yang kompleks.

Anthropic kemungkinan belum merilis fitur ini secara resmi karena masalah kompleksitas data dan integrasi dengan agen pengguna yang sudah ada.

Terdapat perdebatan apakah Anthropic meniru ide Kimi atau sekadar mengimplementasikan konsep orkestrasi agen yang sudah ada di komunitas open-source.

Timeline

Pengenalan Kimi 2.5 dan Agent Swarm

Video dimulai dengan membahas kehebohan seputar model open-source Kimi 2.5 yang memiliki benchmark lebih baik daripada Opus. Fitur utamanya adalah mode Agent Swarm di mana sebuah orkestrator dapat membuat hingga 100 agen khusus untuk menangani tugas rumit. Narator mengungkapkan bahwa fitur serupa ternyata tersembunyi dalam kode Claude dan ditemukan oleh seorang pengguna Twitter melalui flag rahasia. Bagian ini memberikan konteks tentang persaingan teknologi agen AI antara Kimi dan Anthropic. Hal ini memicu pertanyaan apakah Anthropic mengambil inspirasi atau meniru inovasi dari Kimi.

Evolusi Sub-Agen di Ekosistem Claude

Anthropic sebenarnya telah mengumumkan sub-agen kustom sejak Juli tahun lalu untuk berbagai tugas spesifik. Namun, sub-agen tradisional ini memiliki keterbatasan karena hanya memiliki cuplikan konteks yang sempit dan memori yang bersih setelah tugas selesai. Pengguna biasanya harus menyiasati ini dengan menggunakan file markdown sebagai penyimpan memori kolektif antar agen. Selain itu, proses pembuatan sub-agen masih bersifat manual di mana pengguna harus menentukan peran, alat, dan izin secara satu per satu. Keterbatasan manual inilah yang coba dipecahkan oleh teknologi swarm yang baru.

Kelebihan Dinamis Agent Swarm Kimi

Agent Swarm milik Kimi dianggap membawa perubahan besar karena orkestratornya mampu membuat sub-agen secara dinamis tanpa intervensi manual dari pengguna. Sub-agen ini dapat bekerja secara paralel untuk memecah tugas besar menjadi bagian-bagian kecil yang lebih mudah dikelola. Setelah tugas selesai, hasil kerja diserahkan kembali ke orkestrator untuk diputuskan apakah diperlukan agen baru lagi. Data menunjukkan bahwa performa sistem swarm tetap konsisten bahkan ketika kompleksitas tugas meningkat secara signifikan. Hal ini membuktikan efisiensi kerja agen dalam tim dibandingkan dengan sistem agen tunggal.

Eksperimen Claude Code dan Fitur Tersembunyi

Narator menjelaskan bahwa fitur serupa sebenarnya sudah mulai muncul di Claude Code melalui fitur tugas (tasks) baru. Mike Kelly menemukan flag rahasia yang memungkinkan Claude membuat sub-agen secara instan berdasarkan deskripsi tugas melalui fork bernama "Claude Sneak Peek". Dalam demonstrasi, AI diminta membaca rencana pembuatan aplikasi web untuk alat pengunduh video XDL. Sistem kemudian mulai mengidentifikasi tugas-tugas yang bisa dijalankan oleh kelompok agen atau swarm. Meskipun awalnya tidak ada agen kustom yang terpasang, sistem secara otomatis mulai menginisiasi agen yang diperlukan.

Demonstrasi Tim Agen yang Bekerja Paralel

Saat dijalankan, Claude Code secara otomatis membentuk tim yang terdiri dari Team Lead, QA Tester, Back-end Builder, dan lainnya. Pengguna dapat melihat aktivitas masing-masing agen secara real-time, seperti mencari pola kode atau membaca file tertentu. Jumlah agen bahkan bisa bertambah secara dinamis sesuai kebutuhan proyek, misalnya menambahkan spesialis CSS atau integrasi API. Setelah semua selesai, sistem memberikan laporan eksekusi swarm yang merinci peran setiap agen dan status keberhasilan tugas mereka. Dokumentasi otomatis ini memudahkan pengguna untuk memantau proses pengembangan perangkat lunak yang kompleks.

Analisis Mengapa Fitur Belum Dirilis Secara Resmi

Narator berpendapat bahwa Anthropic mungkin tidak meniru Kimi, melainkan terinspirasi oleh proyek open-source seperti agents.py. Alasan fitur ini belum dirilis kemungkinan besar karena masalah kompleksitas integrasi dengan data dan keahlian yang sudah dimiliki pengguna. Muncul tantangan teknis tentang bagaimana orkestrator memutuskan untuk membuat agen baru atau menggunakan agen yang sudah ada di akun pengguna. Selain itu, diperlukan pelatihan model orkestrator yang lebih matang agar tidak terjadi konflik dalam pengambilan keputusan tugas. Video diakhiri dengan saran bagi pengembang untuk menggunakan alat pemantauan seperti Betastack guna memastikan stabilitas proyek saat menggunakan fitur-fitur baru.

Community Posts

View all posts