Era Baru AI Coding Telah Tiba

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Apakah Opus 4.6 merupakan satu-satunya peningkatan dari Anthropic?
00:00:03Anda sudah tahu tentang sub-agen, di mana setiap agen beroperasi sebagai entitas individu dengan
00:00:07jendela konteksnya sendiri.
00:00:09Namun sub-agen ini gagal ketika ada tugas yang membutuhkan koordinasi di antara mereka.
00:00:13Dalam kasus tersebut, orkestrator harus turun tangan, mengambil respons dari satu agen dan mendelegasikannya
00:00:17ke agen lain, atau para agen harus mengandalkan catatan di folder proyek.
00:00:21Karena celah komunikasi ini, tugas-tugas sederhana menjadi terlalu rumit.
00:00:25Untuk mengatasinya, Anthropic merilis peningkatan baru untuk sub-agen dan menamakannya Agent-Teams.
00:00:30Fitur ini diluncurkan bersamaan dengan Opus 4.6.
00:00:33Meskipun ini masih fitur eksperimental, kami telah menerapkannya di berbagai alur kerja,
00:00:37dan peningkatan terbesarnya adalah waktu penyelesaian tugas berkurang drastis.
00:00:41Tapi ini eksperimental karena suatu alasan dan masih ada beberapa kekurangan, dan kami menemukan
00:00:44beberapa solusi kecil untuk masalah-masalah tersebut.
00:00:47Agent-Teams adalah ide tentang beberapa instans ClaudeCode yang bekerja sama.
00:00:51Setiap anggota tim mengerjakan tugas yang terisolasi dan memiliki manajemen terpusat yang dikendalikan
00:00:55oleh satu agen.
00:00:56Sekarang, Anda mungkin berpikir ini terdengar mirip dengan sub-agen Claude yang sudah ada karena
00:01:00keduanya berjalan secara paralel dan membagi tugas, tetapi sebenarnya berbeda.
00:01:03Ini karena Agent-Teams memecahkan satu masalah yang dimiliki kerangka kerja sub-agen.
00:01:08Sub-agen tidak dapat berkomunikasi satu sama lain dan harus mengandalkan agen orkestrator
00:01:12untuk bertindak sebagai media komunikasi bagi mereka.
00:01:15Anggota tim, di sisi lain, dapat berkomunikasi satu sama lain.
00:01:18Ide inti di balik Agent-Teams adalah memiliki beberapa sesi ClaudeCode yang bekerja bersama.
00:01:22Satu sesi bertindak sebagai pemimpin tim, mengoordinasikan pekerjaan, memberikan tugas, dan menyintesis hasil,
00:01:27sementara anggota tim bekerja secara mandiri di jendela konteks mereka sendiri.
00:01:31Sub-agen memiliki jendela konteksnya sendiri, dan mereka melaporkan hasilnya kembali ke pemanggil.
00:01:34Namun untuk tim, cara kerjanya berbeda.
00:01:36Setiap anggota tim agen adalah sesi terminal yang sepenuhnya independen.
00:01:40Mereka tidak dibatasi atau dikoordinasikan oleh orkestrator yang hanya membagi tugas.
00:01:43Sebaliknya, sesi terminal ini dibuka dan ditutup oleh pemimpin tim utama.
00:01:47Mereka mampu mengerjakan tugas yang memerlukan diskusi dan kolaborasi antar agen
00:01:52karena kemampuan mereka untuk berkomunikasi.
00:01:54Jadi tim agen pada dasarnya terdiri dari pemimpin tim dan rekan tim.
00:01:57Pemimpin tim adalah agen utama yang membentuk tim dan mengoordinasikan pekerjaan mereka.
00:02:01Rekan tim adalah pekerja yang benar-benar melakukan tugas tersebut.
00:02:03Setiap rekan tim menerima daftar tugas, yang merupakan daftar item bersama.
00:02:07Setiap anggota mengidentifikasi apa yang perlu dilakukannya dari daftar ini dan mengeksekusinya.
00:02:10Untuk berkomunikasi, mereka juga memiliki kotak surat bersama yang memungkinkan mereka mengirim pesan satu sama lain.
00:02:15Sekarang pertanyaannya adalah bagaimana ini sebenarnya bekerja jika setiap anggota tim bersifat independen.
00:02:19Bagaimana mereka tahu apa yang sedang dilakukan anggota lainnya?
00:02:21Ini bisa bekerja karena semua informasi mengenai tim, anggota, dan tugas yang sedang dikerjakan setiap anggota
00:02:26disimpan secara lokal di folder .claud dan diidentifikasi berdasarkan nama tugas.
00:02:30Fitur ini masih eksperimental dan dinonaktifkan secara default, jadi akan ada beberapa bug
00:02:34dalam penanganan rekan tim selama fase ini.
00:02:36Untuk mencobanya, kami harus mengaktifkannya secara manual.
00:02:38Kami melakukan ini dengan menyetel bendera CLI claude code untuk agent teams eksperimental ke 1.
00:02:43Dengan bendera CLI ini diaktifkan, agent teams tersedia untuk digunakan dalam sesi selanjutnya.
00:02:47Dengan bendera ini aktif, kami dapat mengakses fitur tim di claude code.
00:02:51Karena ini adalah fitur eksperimental, kami perlu menggunakan kata-kata spesifik yang memberi tahu
00:02:55claude bahwa kami ingin menggunakan tim agen untuk pekerjaan tertentu.
00:02:58Tim kami mulai menggunakan fitur ini untuk memparalelkan tinjauan kode, membiarkan masalah kode
00:03:02diidentifikasi dan diperbaiki pada saat yang sama.
00:03:04Untuk melakukan ini, kami meminta claude menggunakan satu anggota tim untuk menemukan masalah di basis kode dan
00:03:08anggota lainnya untuk memperbaiki masalah yang diidentifikasi oleh anggota pertama.
00:03:11Kami harus memberikan petunjuk yang terperinci agar sistem mengikuti arahan yang benar.
00:03:15Jika sub-agen yang menangani ini, mereka akan menulis laporan ke beberapa file fisik
00:03:19untuk memberi tahu agen lain apa yang harus diperbaiki.
00:03:21Tapi di sini kami ingin mempercepat proses peninjauan dengan membiarkan hal ini terjadi tanpa beban
00:03:26menulis ke file lokal.
00:03:27Saat kami memberikan instruksi ke claude code, anggota tim muncul, masing-masing dikendalikan oleh
00:03:31pemimpin tim.
00:03:32Agen pemimpin memberikan instruksi kepada masing-masing agen, memberi tahu tugas apa yang harus dilakukan.
00:03:36Sekarang agen peninjau kode pertama mulai bekerja, dan setelah menganalisis tugas, ia berbagi pesan
00:03:40dengan agen perbaikan kode satu per satu bug.
00:03:42Agen ini memprioritaskan masalah keamanan kritis, dan setelah agen perbaikan kode menerima
00:03:47pesan dari peninjau kode, ia mulai menerapkan perbaikan sementara peninjau kode
00:03:51terus mencari masalah lainnya.
00:03:53Demikian pula, mereka terus berbicara satu sama lain dan melaporkan kembali perubahan yang telah diterapkan.
00:03:57Setelah masalah kritis selesai, kedua agen beralih untuk memperbaiki masalah
00:04:01dengan prioritas sedang.
00:04:02Peninjauan kode dan perbaikan kode terjadi secara bersamaan, yang menghemat banyak waktu.
00:04:06Hal baiknya adalah Anda juga dapat menetapkan atau memodifikasi tugas apa pun untuk anggota tim.
00:04:10Dengan fitur ini diaktifkan, Anda dapat mengarahkan pekerjaan anggota tim tertentu tersebut.
00:04:14Setelah agen selesai bekerja, kontrol dikembalikan ke agen utama, yang
00:04:18bertanggung jawab memastikan perubahan yang diperlukan diterapkan dengan benar dan untuk menutup
00:04:22agen-agen ini dengan baik, memastikan keluarnya mereka tidak menyebabkan kesalahan nantinya.
00:04:26Anda mungkin menyadari bahwa kami banyak melakukan pembangunan dalam video-video ini.
00:04:28Semua instruksi, kode, templat, hal-hal yang biasanya harus Anda
00:04:32jeda dan salin dari layar, semuanya ada di komunitas kami, di video ini, dan setiap video
00:04:36sebelumnya juga.
00:04:37Tautan ada di deskripsi.
00:04:38Menemukan dan memperbaiki dalam skala besar adalah hal yang bagus, tetapi sering kali ada kasus di mana Anda menemukan masalah
00:04:43dan tidak bisa mengetahui apa penyebabnya.
00:04:45Dalam kasus tersebut, kita dapat menggunakan tim agen untuk menguji berbagai perspektif dari aplikasi yang sama
00:04:49dan bekerja secara progresif untuk menemukan bug tersebut.
00:04:51Dengan cara ini, anggota tim dapat mengomunikasikan temuan mereka satu sama lain dan maju bersama.
00:04:55Kami meminta Claude untuk menemukan bug di basis kode dan menentukan penggunaan beberapa anggota tim,
00:04:59membiarkan mereka mendekati masalah dari perspektif yang berbeda.
00:05:02Sistem kemudian memunculkan empat sub-agen, masing-masing berfokus pada perspektif berbeda dari aplikasi yang sama.
00:05:06Mereka menerima instruksi serupa dari pemimpin tim dan menyelidiki kesalahan berdasarkan
00:05:09aspek spesifik aplikasi mereka, sementara pemimpin utama menunggu mereka selesai dan
00:05:14kemudian menganalisis temuan dari penelitian mereka.
00:05:16Tanpa tim, kita hanya akan memiliki satu utas, yang akan memakan waktu jauh lebih lama.
00:05:19Tetapi dengan agen-agen ini, prosesnya jauh lebih cepat.
00:05:22Investigasi selesai dengan cepat, dan semua penelitian oleh para agen selesai dalam waktu sekitar
00:05:272 hingga 3 menit, yang merupakan peningkatan signifikan dibandingkan pengecekan linear, yang
00:05:31bisa memakan waktu 5 hingga 10 menit.
00:05:33Satu hal yang perlu diperhatikan adalah pendekatan ini menghabiskan banyak token, karena setiap agen memiliki
00:05:37jendela konteksnya sendiri, jadi kita perlu berhati-hati tentang hal itu.
00:05:40Setelah para agen memberikan output mereka dan ditutup, pemimpin tim juga memverifikasi
00:05:45hasilnya dengan melakukan pengecekan sendiri.
00:05:46Keempat agen tersebut menemukan bug yang sama, dan mereka dengan tepat menunjukkan masalah dengan
00:05:50stale closure di use effect.
00:05:52Bagian tepat ini ditandai oleh keempat agen tersebut.
00:05:54Juga, jika Anda menyukai konten kami, pertimbangkan untuk menekan tombol hype, karena itu membantu
00:05:59kami membuat lebih banyak konten seperti ini dan menjangkau lebih banyak orang.
00:06:02Kerangka kerja agen ini telah mengubah cara kami mengerjakan tugas jangka panjang, karena dengan kemampuan mereka,
00:06:07agen tidak hanya harus mengandalkan pendokumentasian kemajuan mereka saja.
00:06:10Dengan agent teams, kita dapat menangani berbagai aspek aplikasi secara paralel, dan
00:06:14juga memiliki anggota yang didedikasikan untuk menangani penelitian.
00:06:16Saat kami memberikan instruksi ke Claude, sistem memunculkan 6 agen.
00:06:19Dua agen bekerja pada penelitian dan meletakkan fondasi, sementara sisanya untuk membangun
00:06:23halaman-halamannya.
00:06:24Agen pembangun terhambat oleh agen yang meletakkan fondasi, karena agen tersebut bertanggung jawab
00:06:28menginstal paket yang diperlukan dan menyiapkan lingkungan dengan semua dependensinya.
00:06:32Setiap agen menerima instruksi khusus yang menentukan pekerjaan mereka.
00:06:35Agen yang terhambat terus menunggu sinyal 'buka hambatan' dari pemimpin tim.
00:06:38Setelah penelitian dan fondasi selesai, agen yang tersisa tidak lagi terhambat dan mulai
00:06:43menerapkan bagian aplikasi masing-masing secara berdampingan.
00:06:46Mereka terus berkomunikasi satu sama lain untuk menjaga konsistensi antar setiap komponen.
00:06:49Pemimpin tim terus berkoordinasi dengan para agen, dan setelah ada agen yang selesai, pemimpin tim
00:06:53mengirim pesan penutupan ke agen tersebut, menangani keluarnya agen dengan baik.
00:06:57Seluruh proses ini menghabiskan sekitar 170 ribu token dari jendela konteks, tetapi pada akhirnya, kami
00:07:02mendapatkan aplikasi yang dibangun persis seperti yang kami inginkan, semuanya dari satu instruksi.
00:07:05Seperti yang kami sebutkan di video, saat tim kami menguji ini, kami menemukan banyak
00:07:09cara untuk membuat agent teams bekerja lebih baik bagi kami, dan sekali lagi, praktik terbaik ini tersedia
00:07:13di AI Labs Pro, jadi Anda bisa mencobanya sendiri.
00:07:16Rekomendasi pertama secara umum berlaku untuk semua agen, dan tidak hanya terbatas pada
00:07:20fitur agent team.
00:07:21Anda perlu secara eksplisit menentukan cakupan di mana agen harus bekerja.
00:07:25Anda dapat melakukannya baik dengan mendefinisikannya dalam instruksi, menentukan file mana yang harus dicari
00:07:29untuk melakukan tugas tersebut, atau dengan membuat dokumen di proyek yang berisi tugas-tugas
00:07:33individu seperti yang kami lakukan untuk alur kerja kami, di mana kami menyiapkan dokumen tugas yang tepat untuk setiap penugasan
00:07:38sehingga agen dapat bekerja secara mandiri dan dalam cakupan yang tepat.
00:07:41Hal lain yang perlu diingat adalah masing-masing agen ini harus mengerjakan tugas yang independen
00:07:45satu sama lain, karena jika mereka mengedit file yang sama pada saat yang sama, itu
00:07:49akan menciptakan konflik dan mungkin menyebabkan penimpaan konten.
00:07:52Selain itu, ada kalanya kami menemukan bahwa agen utama akan menjadi tidak sabar
00:07:56jika ada agen yang butuh waktu lama untuk menyelesaikan tugas dan mulai mengerjakan sendiri tugas tersebut
00:08:00alih-alih membiarkan rekan tim menyelesaikannya, jadi penting untuk mengingatkan agen utama
00:08:04untuk menunggu rekan tim selesai sebelum melanjutkan.
00:08:06Anda juga perlu menentukan ukuran tugas dengan tepat.
00:08:08Jika Anda memberikan tugas yang terlalu kecil, itu akan menciptakan beban koordinasi.
00:08:11Jika tugas terlalu besar, itu meningkatkan risiko pemborosan upaya, jadi tugas harus seimbang
00:08:16dan berdiri sendiri.
00:08:17Terakhir, Anda perlu memantau pekerjaan agen.
00:08:19Jika ada agen yang tidak bekerja sesuai harapan, Anda dapat menghentikan eksekusinya dan memberikan
00:08:23instruksi baru tentang apa yang seharusnya dilakukan.
00:08:25Mengikuti praktik-praktik ini membuat penggunaan fitur eksperimental ini jauh lebih efektif.
00:08:29Itu membawa kita ke akhir video ini.
00:08:31Jika Anda ingin mendukung saluran ini dan membantu kami terus membuat video seperti ini, Anda dapat
00:08:35melakukannya dengan menggunakan tombol super thanks di bawah.
00:08:38Seperti biasa, terima kasih telah menonton dan sampai jumpa di video berikutnya.

Key Takeaway

Agent-Teams merupakan evolusi AI coding yang memungkinkan kolaborasi multi-agen secara paralel dan mandiri untuk menyelesaikan tugas kompleks dengan efisiensi waktu yang jauh lebih tinggi dibandingkan metode sub-agen konvensional.

Highlights

Anthropic memperkenalkan fitur eksperimental 'Agent-Teams' bersamaan dengan rilis Opus 4.6 untuk mengatasi keterbatasan koordinasi pada sub-agen tradisional.

Berbeda dengan sub-agen yang terisolasi, Agent-Teams memungkinkan komunikasi antar-agen melalui kotak surat bersama dan manajemen data lokal di folder .claud.

Struktur tim terdiri dari satu 'Team Leader' sebagai orkestrator pusat dan beberapa 'Teammates' yang menjalankan tugas spesifik secara paralel.

Implementasi Agent-Teams terbukti mempercepat proses peninjauan dan perbaikan kode dari 5-10 menit menjadi hanya 2-3 menit melalui eksekusi linear.

Penggunaan fitur ini memerlukan manajemen token yang hati-hati karena setiap agen memiliki jendela konteks mandiri yang dapat menghabiskan kuota besar.

Praktik terbaik mencakup penentuan cakupan tugas yang spesifik, menghindari pengeditan file yang sama secara bersamaan, dan memberikan instruksi agar agen utama bersabar menunggu rekan tim.

Timeline

Evolusi dari Sub-Agen ke Agent-Teams

Bagian ini menjelaskan masalah utama pada sistem sub-agen lama di mana setiap entitas beroperasi secara terisolasi tanpa kemampuan koordinasi langsung. Anthropic menjawab tantangan ini dengan memperkenalkan Agent-Teams yang diluncurkan bersamaan dengan model Opus 4.6. Penulis menekankan bahwa dalam sistem lama, tugas sederhana menjadi rumit karena agen harus mengandalkan orkestrator manusia atau catatan file manual. Fitur baru ini bertujuan untuk menutup celah komunikasi tersebut agar tugas dapat didelegasikan dengan lebih lancar. Meskipun masih bersifat eksperimental, peningkatan ini menjanjikan pengurangan waktu penyelesaian tugas secara drastis dalam berbagai alur kerja pengembangan perangkat keras.

Mekanisme Kerja dan Struktur Tim Agen

Pembicara merinci struktur hierarki dalam Agent-Teams yang terdiri dari pemimpin tim dan rekan tim sebagai pekerja independen. Pemimpin tim bertanggung jawab untuk memberikan tugas, menyintesis hasil, dan mengelola sesi terminal yang dibuka atau ditutup sesuai kebutuhan. Uniknya, para agen ini memiliki kotak surat bersama (shared mailbox) yang memungkinkan mereka berkomunikasi secara langsung tanpa perantara eksternal. Semua informasi mengenai status tugas dan identitas anggota tim disimpan secara lokal di dalam direktori proyek pada folder khusus bernama .claud. Pemisahan jendela konteks antar anggota memastikan bahwa setiap agen tetap fokus pada bagian pekerjaannya sendiri namun tetap selaras dengan tujuan besar tim.

Aktivasi Fitur dan Demonstrasi Peninjauan Kode

Karena masih dalam tahap eksperimental, fitur ini harus diaktifkan secara manual melalui perintah CLI dengan menyetel bendera tertentu ke nilai satu. Video mendemonstrasikan bagaimana satu tim agen digunakan untuk melakukan peninjauan dan perbaikan kode secara simultan atau paralel. Satu agen bertugas mencari bug sementara agen lainnya segera memperbaiki masalah yang ditemukan tanpa menunggu seluruh proses pemindaian selesai. Proses ini menghilangkan hambatan menulis ke file fisik yang biasanya memperlambat alur kerja tradisional pada sistem AI. Pemimpin tim tetap memegang kendali penuh untuk memverifikasi bahwa semua perubahan telah diterapkan dengan benar sebelum menutup sesi agen-agen tersebut.

Analisis Bug Multi-Perspektif dan Efisiensi Waktu

Dalam skenario pelacakan bug yang sulit, Agent-Teams dapat dikerahkan untuk menganalisis aplikasi dari berbagai perspektif teknis secara bersamaan. Penggunaan empat sub-agen yang bekerja dalam satu waktu terbukti memangkas waktu investigasi dari 10 menit menjadi hanya sekitar 2 hingga 3 menit saja. Contoh spesifik yang diberikan adalah deteksi masalah 'stale closure' pada fungsi use effect yang berhasil diidentifikasi secara akurat oleh seluruh anggota tim. Namun, pembicara memberikan peringatan penting bahwa pendekatan ini sangat intensif dalam penggunaan token karena setiap agen membawa beban konteksnya masing-masing. Hal ini menunjukkan bahwa kecepatan tinggi harus diimbangi dengan pertimbangan biaya operasional API yang mungkin meningkat.

Pembangunan Aplikasi Skala Besar dan Praktik Terbaik

Bagian akhir video menunjukkan kemampuan Agent-Teams dalam membangun aplikasi lengkap dari satu instruksi tunggal dengan melibatkan hingga enam agen sekaligus. Ada pembagian peran yang jelas antara agen peneliti yang menyiapkan fondasi lingkungan dan agen pembangun yang mengimplementasikan halaman antarmuka. Video ditutup dengan serangkaian saran praktis seperti pentingnya menentukan cakupan file yang jelas dan menghindari konflik penulisan file yang sama oleh dua agen berbeda. Pengguna disarankan untuk memantau pekerjaan secara aktif dan melakukan intervensi jika ada agen yang menyimpang dari instruksi awal. Dengan mengikuti protokol ini, fitur eksperimental Anthropic dapat dimanfaatkan secara maksimal untuk produktivitas coding di masa depan.

Community Posts

View all posts