Anthropic Merilis Cara Baru untuk "Vibe Code"

AAI LABS
AI/미래기술컴퓨터/소프트웨어

Transcript

00:00:00Masalah utama agen AI adalah jendela konteks yang terbatas,
00:00:03yang membatasi ingatan mereka terhadap tindakan sebelumnya.
00:00:06Ketika kita memberi Claude tugas yang lebih besar,
00:00:08ia akan memadatkan berkali-kali saat mencoba satu fitur,
00:00:11melupakan tugas utama yang diminta untuk diimplementasikan,
00:00:14sehingga kurang efektif untuk tugas jangka panjang.
00:00:17Anthropic baru saja merilis solusi yang didasarkan pada cara kerja tim nyata di lingkungan rekayasa yang sebenarnya.
00:00:22Mereka mengidentifikasi dua alasan utama mengapa ini gagal dalam tugas-tugas panjang.
00:00:26Banyak dari kita pernah mencoba membuat seluruh aplikasi atau fitur besar dalam satu kali percobaan,
00:00:30dan melakukan terlalu banyak menyebabkan model kehabisan konteksnya.
00:00:34Setelah pemadatan berulang,
00:00:35jendela konteks di-refresh dengan fitur yang baru setengah diimplementasikan tanpa ingatan akan kemajuan fitur tersebut,
00:00:41dan ini menyebabkan implementasi yang tidak lengkap.
00:00:43Masalah kedua adalah,
00:00:44karena kemampuan pengujian yang kurang,
00:00:46Claude menandai fitur yang belum diuji sebagai selesai.
00:00:49Ia mengasumsikan fitur tersebut selesai,
00:00:51meskipun sebenarnya tidak berfungsi dengan baik.
00:00:53Solusi mereka adalah menggunakan agen inisialisasi dan agen pengodean secara harmonis,
00:00:56terinspirasi dari cara kerja tim perangkat lunak yang sebenarnya.
00:00:59Alur kerja ini awalnya ditujukan untuk agen yang Anda bangun sendiri,
00:01:02tetapi saya menyadari bahwa ini juga bisa diterapkan pada instans kode Claude.
00:01:06Agen pertama berfokus pada inisialisasi agen pengodean Anda dengan benar,
00:01:09dan Anda harus bersabar di sini karena butuh sedikit waktu.
00:01:12Saya punya proyek Next.js kosong dan ingin membuat kompiler Python online.
00:01:16Sebelum memulai,
00:01:17buat file Claude.md menggunakan perintah init.
00:01:20File ini adalah dokumen untuk basis kode Anda dan berada di root proyek Anda,
00:01:24berisi gambaran umum dan semua informasi penting.
00:01:27Selanjutnya, buat JSON daftar fitur di root proyek.
00:01:30Ini harus mencantumkan semua fitur dan langkah pengujian yang sesuai,
00:01:33dengan semua pengujian ditandai sebagai gagal di awal,
00:01:36sehingga Claude dipaksa untuk mengujinya.
00:01:38Kami menggunakan JSON daripada Markdown karena file JSON lebih mudah dikelola dalam konteks.
00:01:43Karena Claude hanya bisa menguji kode,
00:01:44bukan antarmuka yang kita lihat di browser,
00:01:46saya menghubungkan Puppeteer untuk pengujian browser.
00:01:49Setelah itu,
00:01:50buat skrip init untuk memandu memulai server dev dan file pelacak kemajuan agar sistem dapat melacak status penyelesaian proyek.
00:01:57Sebagai panduan,
00:01:58Claude perlu memperbarui progress.md setelah setiap eksekusi dan menguji setiap fitur setelah implementasi.
00:02:04Praktik terpenting adalah melakukan commit ke Git.
00:02:07Kita sering meremehkan betapa pentingnya melakukan commit dalam keadaan yang bisa digabungkan.
00:02:10Commit Git dengan log yang jelas menunjukkan apa yang sudah selesai dan memungkinkan Anda mengembalikan jika implementasi gagal.
00:02:15Terakhir,
00:02:16Claude tidak boleh mengubah daftar fitur selain menandai fitur sebagai sudah diimplementasikan.
00:02:20Setelah lingkungan siap, kita beralih ke bagian pengodean.
00:02:23Idenya adalah mengimplementasikan setiap fitur satu per satu dari JSON fitur.
00:02:27Claude juga membuat pesan commit yang deskriptif setelah setiap fitur yang diuji dan juga meluncurkan browser saat dibutuhkan.
00:02:33Setelah memverifikasi aplikasi berfungsi,
00:02:35ia memperbarui kolom JSON dari false menjadi true dan memperbarui progress.md dengan apa yang telah diselesaikan sejauh ini.
00:02:42Akhirnya,
00:02:42ia melakukan commit perubahan dan memverifikasi bahwa commit berhasil.
00:02:45Keuntungan dari pendekatan inkremental ini adalah bahkan jika sesi berakhir,
00:02:49Anda dapat melanjutkan tepat dari titik terakhir Anda berhenti.
00:02:51Semuanya dilacak dalam log Git,
00:02:53jadi Anda tidak perlu khawatir merusak kode.
00:02:55Claude dapat memahami proyek dari log Git dan file kemajuan,
00:02:58bukan dari kode itu sendiri,
00:03:00sehingga Anda dapat melanjutkan sesi dengan mudah.
00:03:02Prompt Anda berikutnya hanyalah untuk mengimplementasikan fitur berikutnya yang ditandai 'Belum selesai'.
00:03:06Pendekatan ini juga mengurangi kecenderungan Claude untuk menandai fitur selesai tanpa pengujian yang tepat.
00:03:11Setiap iterasi memastikan aplikasi dibangun secara menyeluruh dengan pengujian nyata,
00:03:15membantu mengidentifikasi bug yang tidak jelas hanya dari kode.
00:03:19Kami mengulangi siklus ini sampai semua fitur ditandai true.
00:03:22Anda mungkin berpikir ini mirip dengan metode BMAD.
00:03:24Ada kemiripan,
00:03:25tapi menurut saya alur kerja Claude lebih baik dalam beberapa hal.
00:03:28Ini lebih mudah karena Anda tidak memanggil agen secara terpisah,
00:03:31dan pemanfaatan konteks juga lebih baik.
00:03:33Setelah mengimplementasikan begitu banyak fitur,
00:03:36ia hanya menggunakan 84% konteks,
00:03:37padahal BMAD sudah akan memadatkan dua kali karena cerita besar yang dibuatnya.
00:03:42Meskipun begitu,
00:03:42BMAD masih merupakan sistem lengkap yang siap pakai,
00:03:45sementara ini masih merupakan ide yang perlu diimplementasikan.
00:03:48Tapi BMAD bisa menggunakan beberapa hal dari ini,
00:03:50seperti sistem Git.
00:03:51Setelah mengajari jutaan orang cara membangun dengan AI,
00:03:54kami mulai mengimplementasikan alur kerja ini sendiri.
00:03:57Kami menemukan bahwa kami bisa membangun produk yang lebih baik lebih cepat dari sebelumnya.
00:04:00Kami membantu mewujudkan ide-ide Anda,
00:04:02baik itu aplikasi maupun situs web.
00:04:04Mungkin Anda telah menonton video kami sambil berpikir,
00:04:06"Saya punya ide bagus,
00:04:07tapi saya tidak punya tim teknis untuk membangunnya.
00:04:09"Di situlah kami hadir."
00:04:10Anggap kami sebagai co-pilot teknis Anda.
00:04:12Kami menerapkan alur kerja yang sama yang telah kami ajarkan kepada jutaan orang langsung ke proyek Anda,
00:04:17mengubah konsep menjadi solusi nyata yang berfungsi tanpa pusingnya merekrut atau mengelola tim pengembang.
00:04:22Siap mempercepat ide Anda menjadi kenyataan?
00:04:25Hubungi kami di hello@autometer.dev.
00:04:27Itu mengakhiri video ini..
00:04:29Jika Anda ingin mendukung saluran ini dan membantu kami terus membuat video seperti ini,
00:04:33Anda bisa melakukannya dengan menggunakan tombol super thanks di bawah.
00:04:36Seperti biasa,
00:04:36terima kasih sudah menonton,
00:04:37dan sampai jumpa di video berikutnya.

Key Takeaway

Anthropic telah memperkenalkan alur kerja pengembangan kode berbasis agen yang inovatif untuk Claude, yang mengatasi keterbatasan konteks dan pengujian dengan meniru praktik tim rekayasa perangkat lunak nyata, memungkinkan implementasi fitur yang inkremental dan teruji.

Highlights

Anthropic mengatasi keterbatasan jendela konteks agen AI dengan alur kerja baru yang terinspirasi tim rekayasa perangkat lunak nyata.

Solusi ini melibatkan penggunaan agen inisialisasi untuk menyiapkan lingkungan dan agen pengodean untuk implementasi fitur.

Agen inisialisasi membuat dokumen proyek, daftar fitur JSON dengan langkah pengujian, dan mengintegrasikan alat pengujian seperti Puppeteer.

Agen pengodean mengimplementasikan fitur secara inkremental, melakukan pengujian, memperbarui status di JSON, dan melakukan commit Git yang deskriptif.

Pendekatan ini memungkinkan kelanjutan proyek yang mulus dari titik terakhir berhenti, dengan semua kemajuan dilacak melalui log Git dan file kemajuan.

Alur kerja ini secara signifikan mengurangi kecenderungan AI untuk menandai fitur selesai tanpa pengujian yang memadai, memastikan kualitas dan identifikasi bug.

Meskipun memiliki kemiripan dengan metode BMAD, alur kerja Claude ini menawarkan kemudahan penggunaan dan pemanfaatan konteks yang lebih efisien.

Timeline

Masalah Keterbatasan Jendela Konteks AI

Bagian ini memperkenalkan masalah mendasar pada agen AI, khususnya Claude, yaitu jendela konteks yang terbatas. Keterbatasan ini menyebabkan agen melupakan tugas utama dan tindakan sebelumnya saat mengerjakan tugas yang lebih besar, seringkali memadatkan informasi dan menghasilkan implementasi yang tidak lengkap. Akibatnya, efektivitas Claude untuk tugas jangka panjang menjadi sangat berkurang. Masalah ini menjadi hambatan utama dalam pengembangan fitur atau aplikasi yang kompleks.

Identifikasi Masalah dan Solusi Anthropic

Anthropic merilis solusi baru yang terinspirasi dari cara kerja tim rekayasa perangkat lunak. Mereka mengidentifikasi dua alasan utama kegagalan AI dalam tugas panjang: pertama, upaya untuk melakukan terlalu banyak sekaligus menyebabkan model kehabisan konteks dan implementasi yang tidak lengkap setelah pemadatan berulang. Kedua, kurangnya kemampuan pengujian membuat Claude menandai fitur yang belum diuji sebagai selesai, meskipun sebenarnya tidak berfungsi dengan baik. Solusi ini bertujuan untuk mengatasi kedua kelemahan krusial tersebut.

Konsep Solusi: Agen Inisialisasi dan Pengodean

Solusi yang diusulkan Anthropic melibatkan penggunaan dua agen secara harmonis: agen inisialisasi dan agen pengodean, meniru struktur tim perangkat lunak nyata. Alur kerja ini awalnya dirancang untuk agen yang dibangun sendiri, tetapi pembicara menyadari bahwa ini juga sangat relevan dan dapat diterapkan pada instans kode Claude. Pendekatan ini bertujuan untuk memecah tugas kompleks menjadi bagian yang lebih kecil dan terkelola, meningkatkan efisiensi dan akurasi.

Peran Agen Inisialisasi dalam Penyiapan Lingkungan

Agen inisialisasi bertanggung jawab untuk menyiapkan lingkungan proyek dengan benar. Ini termasuk membuat file Claude.md sebagai dokumen gambaran umum proyek dan file JSON daftar fitur yang mencantumkan semua fitur beserta langkah pengujiannya, dengan semua pengujian awalnya ditandai gagal. Penting juga untuk menghubungkan alat seperti Puppeteer untuk pengujian browser, karena Claude hanya dapat menguji kode, bukan antarmuka pengguna. Selain itu, skrip init dan file progress.md dibuat untuk memandu server dev dan melacak status penyelesaian, dengan panduan agar Claude memperbarui progress.md dan melakukan commit Git yang jelas setelah setiap eksekusi.

Proses Pengodean Inkremental oleh Agen Pengodean

Setelah lingkungan disiapkan, agen pengodean mengimplementasikan setiap fitur satu per satu dari daftar fitur JSON. Agen ini bertanggung jawab untuk membuat pesan commit Git yang deskriptif setelah setiap fitur yang diuji dan meluncurkan browser saat diperlukan untuk verifikasi. Setelah memverifikasi fungsionalitas aplikasi, agen memperbarui status fitur di JSON dari 'false' menjadi 'true', memperbarui progress.md, dan melakukan commit perubahan. Pendekatan inkremental ini memungkinkan kelanjutan proyek yang mulus bahkan jika sesi berakhir, karena semua kemajuan dilacak dalam log Git dan file kemajuan, mengurangi risiko kerusakan kode dan memastikan pengujian yang menyeluruh.

Perbandingan dengan BMAD dan Keunggulan Alur Kerja Claude

Pembicara membandingkan alur kerja baru ini dengan metode BMAD, mengakui adanya kemiripan. Namun, alur kerja Claude dianggap lebih unggul dalam beberapa aspek, terutama karena lebih mudah digunakan karena tidak memerlukan pemanggilan agen secara terpisah. Selain itu, pemanfaatan konteksnya lebih efisien; setelah mengimplementasikan banyak fitur, Claude hanya menggunakan 84% konteks, sementara BMAD kemungkinan sudah akan memadatkan konteks dua kali. Meskipun BMAD adalah sistem yang siap pakai, alur kerja Claude ini masih berupa ide yang perlu diimplementasikan, namun BMAD dapat mengambil inspirasi dari sistem Git yang digunakan dalam pendekatan ini.

Layanan Autometer.dev dan Penutup

Bagian terakhir video ini beralih ke promosi layanan Autometer.dev, sebuah perusahaan yang mengimplementasikan alur kerja serupa untuk membantu klien membangun produk lebih cepat. Mereka menawarkan diri sebagai 'co-pilot teknis' untuk mengubah ide menjadi solusi nyata tanpa kerumitan merekrut atau mengelola tim pengembang. Pembicara mengundang pemirsa untuk menghubungi mereka melalui hello@autometer.dev jika tertarik mempercepat ide mereka menjadi kenyataan. Video diakhiri dengan ucapan terima kasih kepada penonton dan ajakan untuk mendukung saluran melalui tombol 'super thanks'.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video