Log in to leave a comment
No posts yet
Anda mungkin membuka terminal dengan penuh semangat setelah melihat demonstrasi GSD (Get-Shit-Done) di YouTube. Namun, realitanya tidak semudah itu. Di hadapan puluhan ribu baris kode warisan (legacy code) dan dependensi yang rumit, agen AI seringkali kehilangan arah. Pada tahun 2026 ini, inti dari rekayasa perangkat lunak agen bukanlah pembuatan kode (code generation), melainkan kurasi konteks. Keberhasilan ditentukan oleh bagaimana Anda mencegah pembusukan konteks (context rot) yang terjadi di lingkungan produksi, melampaui sekadar tahap instalasi alat.
GSD v2 adalah sistem orkestra canggih yang digerakkan oleh 29 keahlian dan 12 agen spesialis. Di balik kekuatan sistem ini, tersembunyi batasan teknis yang wajib dikelola.
Model Claude sangat mahir dalam mengenali tag XML seperti <objective> atau <execution_context> sebagai batas struktural. Faktanya, metode GSD yang memanfaatkan tag XML dibandingkan dengan prompt yang tidak terstruktur telah meningkatkan tingkat penyelesaian SWE-bench (software engineering benchmark) dari semula 15-20% menjadi hingga 80.9%.
Namun, membungkus semua informasi dalam XML akan dengan cepat menghabiskan jendela token seiring bertambah panjangnya sesi. Ini akan langsung berujung pada lonjakan biaya. Solusinya adalah strategi untuk memecah sesi dan mempertahankan status (state) berbasis file di dalam direktori .planning.
Loop rencana-verifikasi GSD menjamin kode berkualitas tinggi, namun menyebabkan lonjakan jumlah panggilan API. Per Maret 2026, para insinyur di perusahaan teknologi global seperti Amazon atau Shopify telah mewajibkan penerapan routing berbasis kompleksitas.
| Tingkat Model | Pengunaan Utama | Estimasi Biaya (per 1M token) | Kontribusi Penghematan Biaya |
|---|---|---|---|
| Opus 4.5 | Desain arsitektur, penalaran mendalam | $20.00 - $200.00 | Menyediakan kecerdasan inti |
| Haiku 4.5 | Pembuatan kode tes, dokumentasi | $0.25 - $2.00 | Menangani tugas repetitif massal |
Menurut hasil penelitian, jika sub-agen dirancang untuk hanya merujuk pada informasi minimum yang diperlukan, total biaya API dapat dipangkas sebesar 40-70%. Kegagalan agen AI bukan berasal dari kurangnya kecerdasan, melainkan dari input konteks yang sembarangan.
Berbeda dengan proyek baru, basis kode yang sudah ada memiliki risiko tinggi bagi agen untuk menyebabkan efek samping yang tidak terduga. Isolasi kode lama sebagai read-only melalui pengaturan CLAUDE.md dan batasi secara ketat direktori yang dapat dimodifikasi oleh agen. Saat menerapkan GSD pada proyek Node.js berusia 3 tahun, tingkat keberhasilan meningkat drastis ketika spesifikasi didefinisikan terlebih dahulu dengan perintah /gsd:discuss-phase alih-alih melakukan modifikasi keseluruhan secara langsung.
Fenomena agen mengulangi kesalahan yang sama selama pengujian otomatisasi browser seperti Playwright adalah pola kegagalan yang paling umum. GSD v2 menghentikan mode otonom jika tugas yang sama diulang lebih dari 2 kali tanpa hasil. Pada saat itu, panggillah agen debug terpisah untuk menganalisis Lintasan Kegagalan (Failure Trajectory). Mencatat posisi saat ini dan pemblokir (blocker) di file /AGENTS.md memungkinkan konteks tetap terjaga meskipun sesi terputus.
Prinsip arsitektur harus disisipkan di dalam XML agar agen tidak tersesat dalam logika yang kompleks. Buatlah daftar Must-haves yang dapat diverifikasi secara mekanis di file PLAN.md. Misalnya, dengan menentukan batasan seperti larangan menambah pustaka baru atau kewajiban mematuhi versi API tertentu, Anda dapat mencegah utang teknis (agentic debt) sejak dini.
Tantangan terbesar dalam lingkungan multi-agen adalah ketidaksinkronan status antara file .planning lokal dan repositori jarak jauh. Alur kerja maju tahun 2026 menggunakan Git Worktrees untuk menyelesaikan masalah ini.
/mgw:sync dan kelola bagian yang tidak selaras sebagai laporan.Efisiensi konteks () dapat didefinisikan dengan rumus berikut:
GSD memaksimalkan efisiensi sistem secara keseluruhan dengan meminimalkan token duplikat () yang dimuat oleh setiap agen melalui paralelisasi.
Framework GSD bukan sekadar alat untuk mempercepat pengembangan. Ini adalah lapisan arsitektur yang membantu menurunkan biaya pengelolaan perangkat lunak modern dan memungkinkan insinyur lepas dari penulisan kode baris demi baris untuk fokus pada desain sistem dan rekayasa konteks. Menurut survei tahun 2026, 42% dari hasil rekayasa dibantu oleh AI. Wujudkan potensi Claude Code melalui desain yang berpusat pada batasan (constraint) dan manajemen status yang ketat.