Log in to leave a comment
No posts yet
Paradigma rekayasa perangkat lunak sedang berubah. Proyek yang dilakukan oleh Nicholas Carlini, seorang peneliti di Anthropic, bukan sekadar level menyuruh AI menulis kode. Dengan mengerahkan 16 instans Claude Opus 4.6, ia berhasil membangun kompilator C berbasis Rust dari nol dengan keterlibatan manusia yang minimal.
Hasilnya terdiri dari 100.000 baris kode, dan sukses membangun kernel Linux 6.9 serta menjalankan game klasik Doom. Namun, yang lebih penting daripada tampilan luarnya yang memukau adalah batasan dan potensi alur kerja agen (agentic workflow) yang ditemukan dengan menggelontorkan biaya API sebesar $20.000 (sekitar Rp315 juta). Melampaui tahap sekadar menulis prompt dengan baik, kita akan membedah realitas rekayasa tentang bagaimana mengendalikan dan mengolaborasikan AI secara sistemik.
Dalam pemrograman sistem yang kompleks, agen tunggal akan segera membentur batasan jendela konteks (context window). Hal ini dikarenakan seiring berjalannya waktu, catatan percakapan masa lalu dapat mengaburkan penilaian saat ini, yang memicu fenomena halusinasi. Untuk mengatasi hal ini, Carlini memperkenalkan Loop RALF (Refresh, Act, Learn, Feedback) bersama dengan 16 kontainer Docker yang independen.
README.md serta melakukan push ke Git untuk menyinkronkan pengetahuan.Risiko terbesar ketika 16 agen dikerahkan secara bersamaan adalah pemborosan sumber daya. Jika dua agen mencoba memperbaiki bug yang sama, selain terjadi konflik kode, biaya API juga akan ditagih dua kali lipat. Carlini mengimplementasikan mekanisme penguncian (Locking) ringan menggunakan flag teks di dalam repositori Git, alih-alih database terpisah yang kompleks.
Sebelum memulai tugas tertentu, agen akan membuat file dengan nama yang sama dengan nama tugas di direktori current_tasks/. Berkat sifat atomic commit pada Git, push dari agen lain yang mencoba membuat file yang sama akan ditolak. Sistem sederhana ini secara fundamental mencegah kondisi balapan (Race Condition) antar agen.
Bagian terbaik dari proyek ini adalah penggunaan GCC, sebuah alat yang sudah ada, sebagai Oracle. Ini adalah strategi untuk memaksakan jawaban yang benar secara sistemik, alih-alih membiarkan AI menebak jawaban. Ketika terjadi kesalahan saat membangun kernel Linux yang masif, Carlini mengotomatiskan algoritma pencarian biner (Binary Search).
Meskipun pencapaiannya luar biasa, performa kompilator yang dihasilkan bahkan tidak mencapai tahap optimasi terendah GCC (-O0). Pasukan agen Claude menunjukkan keterbatasan dalam domain rekayasa tingkat tinggi berikut:
Dari sudut pandang manajer rekayasa, $20.000 bukanlah jumlah yang mahal. Hal ini dikarenakan tugas yang seharusnya membutuhkan tim profesional berisi 5 orang selama lebih dari 3 bulan dapat diselesaikan hanya dalam 2 minggu. Ini membuktikan efisiensi biaya sekitar 10 kali lipat dibandingkan biaya tenaga kerja tradisional. Perusahaan yang ingin mengadopsi model ini harus mengikuti pohon keputusan berikut:
| Pertanyaan | Ya | Tidak |
|---|---|---|
| Apakah hasilnya dapat diverifikasi secara objektif melalui pengujian? | Lanjut ke tahap berikutnya | Tidak cocok diadopsi (risiko halusinasi) |
| Apakah ada alat bantu yang sudah ada (Oracle) sebagai pembanding? | Adopsi strategi Oracle | Perlu pemantauan manusia setiap saat |
| Apakah tugas dapat dibagi menjadi lebih dari 100 unit? | Operasikan agen paralel | Disarankan agen tunggal |
progress.json atau sejenisnya sebelum sesi berakhir.Eksperimen Anthropic menandakan bahwa peran insinyur telah bergeser dari penulis kode menjadi perancang dan auditor sistem. Kini, kompetensi yang penting bukanlah kemampuan menyusun algoritma secara langsung, melainkan kemampuan merancang batasan logika dan verification harness agar pasukan agen AI tidak keluar dari jalurnya.
Biaya $20.000 bukan sekadar pengeluaran, melainkan tonggak sejarah yang menunjukkan batas atas otomatisasi yang dapat dicapai AI ketika didukung oleh desain manusia yang canggih. Perusahaan kini harus fokus pada sistematisasi strategic steering oleh manusia, bukan hanya terpaku pada otonomi AI semata.