Fault Loop Ini Menangkap 90% Error dalam Coding

AAI LABS
Computing/SoftwareManagementInternet Technology

Transcript

00:00:00Apa yang sebenarnya terjadi saat kita memaksa agen koding untuk mematuhi aturan?
00:00:03Kita semua punya masalah yang sama saat bekerja dengan Claude dan agen koding lainnya.
00:00:07Mereka cenderung tidak mengikuti instruksi dan mengabaikan file Claude.md sepenuhnya.
00:00:11Bahkan saat kita mencoba memaksakan TDD, ia justru mencoba memodifikasi file pengujian itu sendiri.
00:00:15Lalu kami menemukan plugin yang sedang populer, meraih 58.000 bintang hanya dalam 24 jam.
00:00:21Tapi itu hanyalah gambaran betapa besarnya siklus hype di sekitar alat AI.
00:00:25Plugin ini menjanjikan penegakan metodologi pengembangan perangkat lunak yang ketat ke dalam alur kerja.
00:00:30Namun pertanyaannya adalah, apakah ia benar-benar memberikan hasil yang dijanjikan?
00:00:33Tim kami sudah melihat alur kerja serupa bermunculan dan sebagian besar hanya sekadar hype.
00:00:37Jadi kami mencoba plugin ini dalam alur kerja nyata untuk melihat apakah ini layak diterapkan atau hanya hype belaka.
00:00:43Superpowers adalah plugin yang menerapkan metodologi pengembangan perangkat lunak tradisional langsung ke dalam IDE AI Anda.
00:00:50Beberapa orang mungkin berpikir kerangka kerja tangkas seperti BMAD dan OpenSpec sudah melakukan hal yang sama.
00:00:56Namun yang satu ini berbeda karena bukan sekadar sistem agen yang digunakan untuk menulis spek proyek.
00:01:01Ini adalah penerapan metodologi agile ke dalam alur kerja dengan batasan ketat agar agen tidak lanjut sebelum tahap saat ini selesai.
00:01:10Batasan ini adalah pos pemeriksaan eksplisit untuk mencegah Claude melenceng dari instruksi.
00:01:15Filosofi inti di balik pendekatan plugin ini adalah TDD dan proses sistematis daripada sekadar menebak-nebak.
00:01:20Ia melakukan verifikasi sebelum mengeklaim proyek berhasil, dengan instruksi khusus pada area di mana AI biasanya gagal.
00:01:28Ia tidak akan lanjut ke langkah berikutnya sampai mendapatkan lampu hijau dari pengguna.
00:01:32Singkatnya, ia menggunakan semua praktik terbaik yang sering kami bahas, secara bawaan, tanpa perlu pengaturan manual.
00:01:40Plugin ini menekankan pengembangan berbasis tes (TDD) yang nyata serta prinsip DRY dan YAGNI yang umum dalam pemrograman.
00:01:50Plugin ini tersedia untuk semua platform AI.
00:01:52Karena tim kami menggunakan Claude Code, kami menyalin perintah marketplace dan menginstalnya langsung di proyek Claude Code kami.
00:02:02Setelah terinstal dan Claude Code dimulai ulang, plugin Superpowers siap digunakan dalam proyek.
00:02:08Setelah memulai ulang Claude Code, kami memberikan perintah untuk membuat perangkat lunak manajemen proyek mirip Trello.
00:02:15Ia mengaktifkan kemampuan brainstorming secara otomatis dan mengidentifikasi kebutuhan proyek alih-alih menebak-nebak.
00:02:24Ia mengajukan banyak pertanyaan untuk memperjelas tujuan aplikasi, target pengguna, serta tumpukan teknologi yang ingin digunakan.
00:02:33Seperti saat memilih database, ia menyarankan bahwa pilihan kami mungkin kurang tepat dan berisiko bagi keamanan.
00:02:44Ia terus mengklarifikasi semua detail hingga kami merasa puas dengan opsi yang tersedia.
00:02:48Setelah semuanya dikonfirmasi, langkah berikutnya adalah memberikan tiga pendekatan untuk kami pilih salah satunya.
00:02:55Kami memilih opsi yang disukai dan memberikan saran perubahan bersamaan dengan pemilihan tersebut.
00:02:58Setelah selesai, ia juga memberikan desain arsitekturnya kepada kami.
00:03:02Selanjutnya ia memberikan desain UX, termasuk penjelasan tentang bagaimana papan (boards) akan dikelola.
00:03:06Ia juga mengonfirmasi seluruh struktur proyek kepada kami.
00:03:09Setelah desain disetujui, ia mendokumentasikan semua data ke dalam folder docs.
00:03:13Di sinilah plugin ini unggul karena memiliki instruksi git bawaan untuk melakukan commit pada setiap perubahan.
00:03:22Setelah brainstorming selesai, kemampuan menulis rencana diaktifkan untuk membuat dan melakukan commit pada rencana implementasi.
00:03:29Rencana tersebut memecah aplikasi besar menjadi tugas-tugas kecil yang lebih mudah dikerjakan.
00:03:33Mungkin Anda berpikir mode rencana bawaan Claude sudah melakukan semua ini sendiri.
00:03:37Namun perbedaan utamanya adalah perencanaan Claude Code hanya berfungsi sebagai panduan bagi agen.
00:03:44Ia hanya menanyakan hal-hal yang dianggap perlu dan membuat keputusan kecil sendiri, seperti pemilihan pustaka UI.
00:03:52Sebaliknya, Superpowers bersifat memaksa, artinya Anda tidak bisa lanjut sampai tahap saat ini benar-benar selesai diimplementasikan.
00:04:01Setelah fase perencanaan selesai, ia menanyakan cara implementasi dan kami memilih implementasi berbasis sub-agen.
00:04:09Claude memang bisa membuat sub-agen sendiri, tapi di sini tiap sub-agen otomatis dibuatkan git worktree agar tidak saling mengganggu.
00:04:20Agen perlu diisolasi dengan worktree agar bekerja lebih baik, karena jika dalam direktori yang sama, mereka bisa menimpa pekerjaan satu sama lain.
00:04:28Dan inilah fitur utama yang ditanganinya secara otomatis dan bawaan.
00:04:31Setelah perencanaan final, Claude pindah ke fase implementasi.
00:04:34Ia memulai tugas, dan setelah selesai, ia membuat sub-tugas peninjauan terpisah untuk memverifikasi implementasi terhadap spek.
00:04:41Setelah melakukan commit ke git, ia menggunakan fitur superpower lainnya, yaitu peninjau kode (code reviewer).
00:04:46Tugas berikutnya baru akan dimulai jika kualitas kode disetujui, jika tidak, ia akan terus memperbaiki tugas sebelumnya.
00:04:54Setelah setiap tugas selesai, ditinjau, dan di-commit, ia menanyakan apakah ingin menggabungkannya ke main atau membuat PR.
00:05:04Kami memintanya untuk segera menggabungkannya kembali ke cabang utama (main).
00:05:06Ia kemudian menghapus semua worktree dan melakukan commit seluruh proyek ke cabang main itu sendiri.
00:05:11Proses ini memakan banyak jendela konteks; bagi kami, satu iterasi saja menghabiskan hampir 50% kapasitas konteks.
00:05:24Proyek yang dibuatnya cukup sederhana dan memiliki fungsionalitas dasar.
00:05:27Kami ingin daftar ini diurutkan berdasarkan status saat ini, yaitu: to do, in progress, dan done.
00:05:32Meskipun kartu-kartu individu sudah ada, kami ingin daftar tersebut juga bisa dipindahkan.
00:05:36Kami kembali ke Claude Code untuk memintanya, tapi awalnya ia bekerja seperti biasa tanpa kemampuan plugin.
00:05:42Ini mungkin karena terlalu banyak konteks yang terpakai, sehingga kami harus mengingatkannya untuk menggunakan plugin Superpowers.
00:05:48Setelah diingatkan, ia mulai mengerjakan tugas dengan cara terstruktur seperti sebelumnya.
00:05:52Setelah melewati semua langkah, Claude membuat agen di worktree terpisah yang bekerja lebih baik karena menggunakan pendekatan TDD.
00:06:02Agen-agen ini pertama-tama menulis pengujian untuk setiap bagian yang akan diimplementasikan.
00:06:05Setelah pengujian ditulis, dipastikan agen menulis kode tanpa mengubah file pengujian dan memastikan tes tersebut lulus.
00:06:13Plugin ini menggunakan instruksi perintah yang kuat untuk mencegahnya memodifikasi pengujian dan menghindari alasan Claude untuk melewati tahap.
00:06:23Perintah tersebut berupa instruksi eksplisit seperti “jika ada peluang 1% untuk menggunakan skill, gunakanlah”.
00:06:29Hal ini memastikan setiap tugas dilakukan dengan cara yang benar dan terstruktur.
00:06:32Satu hal yang perlu dicatat, agen-agen ini bekerja secara berurutan, sehingga butuh waktu lebih lama dibanding cara bawaan Claude.
00:06:41Namun karena pedoman ketat yang diterapkan, aplikasi dipastikan berfungsi sesuai harapan.
00:06:45Seperti yang disebutkan tadi, konteks terkuras sangat cepat dengan plugin ini, terkadang hanya menyisakan 5% konteks saja.
00:06:53Sebelum lanjut ke tugas lain, kami menjalankan perintah compact agar tidak kehilangan konteks saat Claude melakukan brainstorming.
00:07:01Setelah percakapan diringkas, kami memberikan perintah fitur berikutnya dan ia mulai bekerja dengan cara yang sama.
00:07:07Bagian terbaiknya adalah ia tidak bekerja berdasarkan tebakan, melainkan terus bertanya dari berbagai sudut pandang.
00:07:17Plugin ini memaksa Claude mengklarifikasi kasus-kasus ekstrem, seperti tampilan kolom kosong, yang biasanya hanya akan ditebak oleh Claude.
00:07:29Panduan untuk menggunakan plugin ini dengan lebih baik tersedia di AI Labs Pro.
00:07:33Bagi yang belum tahu, itu adalah komunitas kami untuk mendapatkan templat siap pakai yang bisa langsung digunakan di proyek Anda.
00:07:42Jika Anda merasa konten kami bermanfaat dan ingin mendukung channel ini, silakan cek link di deskripsi.
00:07:48Kekuatan lain dari plugin ini adalah kemampuannya untuk melakukan debugging sistematis.
00:07:52Kami menemukan bug pada penyimpanan data saat refresh dan meminta Claude menggunakan debugging sistematis dengan perintah yang samar.
00:08:01Ia memuat kemampuan debugging sistematis yang dibagi menjadi empat fase.
00:08:06Fase pertama mengidentifikasi akar masalah dengan mengajukan beberapa pertanyaan kepada kami.
00:08:10Dari jawaban kami, ia mencoba menyelidiki dan menelusuri arah yang kami berikan hingga menemukan file yang bermasalah.
00:08:16Setelah akar masalah ditemukan, fase kedua mengisolasi bug, sementara fase ketiga mempersempit alasan sebenarnya bug itu terjadi.
00:08:25Fase keempat adalah menerapkan perbaikan. Prosesnya lebih terstruktur daripada sekadar meraba-raba kode, dan diakhiri dengan pengujian.
00:08:35Banyak tugas yang tidak memerlukan alur kerja plugin penuh, seperti saat kami hanya ingin mengubah UI aplikasi.
00:08:47Untuk tugas-tugas semacam itu, kita bisa mengimplementasikannya dengan cara yang lebih sederhana.
00:08:51Karena belum punya konsep desain, kami memintanya memperbaiki UI dan hanya melakukan brainstorming serta perencanaan saja.
00:09:01Ia mulai dengan brainstorming dan menanyakan arah visual yang kami inginkan melalui pertanyaan klarifikasi desain.
00:09:08Claude kemudian berhenti setelah fase perencanaan, lalu kami memintanya mengimplementasikan rencana tersebut tanpa proses ketat.
00:09:15Seluruh UI aplikasi berubah jauh lebih cepat, namun ia tetap melakukan commit ke git dengan format yang sama seperti proses aslinya.
00:09:25Aplikasi berubah dari tata letak dasar menjadi lebih menarik dengan skema warna yang lebih baik dan layout yang fungsional.
00:09:32Inilah yang membuat framework ini praktis: gunakan cara biasa saat Claude sudah mahir, dan gunakan proses penuh saat ia cenderung gagal.
00:09:43Itulah akhir dari video ini. Jika ingin mendukung channel ini agar kami terus bisa membuat video seperti ini, gunakan tombol Super Thanks.
00:09:51Seperti biasa, terima kasih telah menonton dan sampai jumpa di video berikutnya.

Key Takeaway

Plugin Superpowers mentransformasi agen AI koding dari sekadar pemberi saran menjadi pengembang yang disiplin melalui penerapan metodologi Agile dan TDD yang memaksa kepatuhan pada instruksi.

Highlights

Plugin Superpowers menerapkan metodologi pengembangan perangkat lunak tradisional yang ketat seperti TDD, DRY, dan YAGNI ke dalam IDE bertenaga AI.

Fitur utama plugin ini adalah mekanisme 'pos pemeriksaan' yang memaksa agen AI menyelesaikan tahap saat ini sebelum diizinkan lanjut ke langkah berikutnya.

Penggunaan sub-agen yang diisolasi dalam 'git worktree' mencegah konflik kode dan memastikan setiap fitur dikembangkan serta diuji secara independen.

Sistem debugging sistematis empat fase membantu mengidentifikasi akar masalah dan memperbaiki bug melalui proses investigasi yang terstruktur.

Alur kerja ini sangat efektif untuk tugas kompleks yang rawan kegagalan AI, meskipun mengonsumsi jendela konteks (context window) dengan sangat cepat.

Fleksibilitas sistem memungkinkan pengguna memilih antara proses ketat untuk logika rumit atau proses sederhana untuk perubahan UI yang cepat.

Timeline

Masalah pada Agen AI dan Pengenalan Superpowers

Video dimulai dengan membahas kendala umum saat menggunakan Claude atau agen koding lainnya yang sering mengabaikan instruksi file konfigurasi. Pembicara memperkenalkan plugin Superpowers yang menjanjikan penegakan metodologi pengembangan perangkat lunak yang ketat untuk mengatasi siklus hype alat AI saat ini. Berbeda dengan sistem agen biasa, Superpowers bertindak sebagai pos pemeriksaan eksplisit yang mencegah AI menebak-nebak hasil tanpa verifikasi. Filosofi intinya adalah memindahkan praktik terbaik seperti TDD (Test-Driven Development) langsung ke dalam alur kerja bawaan IDE. Hal ini memastikan setiap langkah mendapatkan 'lampu hijau' dari pengguna sebelum agen diizinkan untuk melanjutkan ke fase berikutnya.

Instalasi dan Fase Brainstorming Proyek

Bagian ini menjelaskan proses instalasi plugin Superpowers pada platform Claude Code dan memulai proyek pembuatan aplikasi manajemen proyek mirip Trello. Saat memulai, plugin secara otomatis mengaktifkan kemampuan brainstorming yang berfungsi mengidentifikasi kebutuhan proyek secara mendalam melalui serangkaian pertanyaan klarifikasi. Agen tidak hanya menerima perintah, tetapi juga memberikan saran kritis terkait pemilihan teknologi dan risiko keamanan database yang dipilih. Setelah detail dikonfirmasi, sistem menyediakan tiga pendekatan arsitektur dan desain UX yang harus disetujui oleh pengguna. Semua dokumentasi hasil diskusi ini secara otomatis disimpan ke dalam folder dokumen dan di-commit ke Git menggunakan instruksi bawaan plugin.

Perencanaan dan Implementasi dengan Sub-Agen

Pembicara menjelaskan perbedaan antara mode rencana bawaan Claude dengan fitur perencanaan sistematis dari Superpowers yang memecah tugas besar menjadi sub-tugas kecil. Salah satu fitur unggulannya adalah penggunaan sub-agen yang diisolasi dalam git worktree untuk mencegah agen saling menimpa pekerjaan satu sama lain di direktori yang sama. Setiap tugas yang selesai harus melewati sub-tugas peninjauan (code reviewer) untuk memverifikasi kualitas kode terhadap spesifikasi sebelum diizinkan lanjut ke tugas baru. Jika kualitas kode tidak memadai, agen akan terus memperbaiki pekerjaan sebelumnya hingga standar terpenuhi secara otomatis. Namun, proses yang sangat terstruktur ini menghabiskan kapasitas konteks (context window) hingga 50% hanya dalam satu iterasi pengerjaan.

Penerapan TDD dan Manajemen Jendela Konteks

Dalam tahap ini, dilakukan pengujian fitur pengurutan kartu pada aplikasi, di mana AI awalnya sempat lupa menggunakan kemampuan plugin karena keterbatasan konteks. Setelah diingatkan, agen kembali bekerja dengan pendekatan TDD yang ketat, yakni menulis file pengujian terlebih dahulu sebelum menulis kode fungsional aplikasi. Plugin menggunakan instruksi perintah yang kuat untuk memastikan AI tidak memodifikasi file tes hanya agar terlihat 'lulus', melainkan benar-benar memperbaiki kode aplikasinya. Meskipun proses berurutan ini memakan waktu lebih lama dibanding cara standar, hasilnya dipastikan jauh lebih stabil dan berfungsi sesuai harapan. Untuk mengatasi masalah habisnya memori konteks yang tersisa 5%, pengguna disarankan menjalankan perintah 'compact' untuk meringkas percakapan sebelum memulai tugas baru.

Debugging Sistematis dan Pengembangan UI Cepat

Bagian akhir video mendemonstrasikan fitur debugging sistematis yang dibagi menjadi empat fase: identifikasi masalah, isolasi bug, analisis penyebab, dan penerapan perbaikan. Proses ini jauh lebih efektif daripada sekadar menebak letak kesalahan karena memaksa AI melakukan penelusuran file secara logis berdasarkan jawaban pengguna. Selain itu, pembicara menunjukkan bahwa pengguna bisa memilih alur kerja yang lebih santai untuk tugas sederhana seperti perbaikan UI yang tidak memerlukan logika rumit. Dengan hanya melakukan brainstorming dan perencanaan, UI aplikasi dapat diubah menjadi lebih modern dan fungsional dengan sangat cepat namun tetap mempertahankan dokumentasi git yang rapi. Video ditutup dengan kesimpulan bahwa framework ini sangat praktis karena memberikan fleksibilitas penggunaan sesuai dengan tingkat kesulitan tugas koding yang dihadapi.

Community Posts

View all posts