Pengamanan yang Harus Dipasang Sebelum Agen Coding Otonom Menghabiskan Anggaran Anda
14 de mayo de 2026
0
Computing/SoftwareComments (0)
Log in to leave a comment
No posts yet
Log in to leave a comment
No posts yet
Siapa pun yang pernah menjalankan agen otonom seperti Codex di lingkungan lokal pasti pernah merasakan ketakutan ini: terbangun di pagi hari dan mendapati agen tersebut terjebak dalam loop tak terbatas yang menghabiskan biaya API ratusan dolar, atau mengacak-acak file kode yang sebelumnya berjalan dengan baik. Berdasarkan data riset orkestrasi agentic tahun 2026, agen tanpa mekanisme kontrol eksplisit mengalami penurunan tingkat keberhasilan penyelesaian masalah kompleks dari 48,8% menjadi hanya 28%. Masalahnya bukan sekadar menggunakan model yang pintar, tetapi protokol operasional yang menetapkan guardrail agar agen tidak bertindak semaunya.
Semakin kompleks tahapannya, AI agent cenderung melupakan apa yang telah dilakukannya pada tahap sebelumnya. Hal ini dikarenakan adanya batasan pada context window model Transformer. Untuk mencegah hal ini, instruksikan agen untuk secara fisik mencatat statusnya ke dalam recovery_log.md di root proyek pada setiap iterasi.
File ini harus mencakup nama sub-tugas yang sedang diproses, 10 jalur file yang terakhir diubah, dan pesan kesalahan dari pengujian terakhir yang dijalankan. Dengan meninggalkan catatan seperti ini, Anda tidak perlu menjelaskan semuanya dari awal saat agen terhenti. Cukup dengan satu baris perintah, "Baca log dan lanjutkan dari titik terakhir berhenti," maka warm start dapat dilakukan. Menurut data lapangan, metode ini mengurangi waktu intervensi manual hingga lebih dari 30%.
Dasbor OpenAI atau Anthropic memiliki penundaan pembaruan hingga 20 menit. Artinya, saat agen mulai membanjiri token secara tidak terkendali, semuanya sudah terlambat. Anda harus menjalankan skrip budget_monitor.sh sendiri secara lokal yang memeriksa akumulasi biaya setiap 10 menit.
Biaya output model kelas GPT-5.5 berada di kisaran 75 dolar per 1 juta token. Untuk mengamankan dompet Anda, masukkan logika berikut ke dalam skrip: cegat dan jumlahkan token input/output dari permintaan API, dan segera kirimkan sinyal SIGTERM ke proses agen begitu mencapai ambang batas yang ditentukan. Sebelum proses berakhir, pastikan agen membuat laporan ringkasan kerja. Anda harus memiliki keyakinan bahwa proyek akan tetap berjalan sesuai anggaran yang ditetapkan bahkan saat Anda tidak di tempat.
Kode yang ditulis oleh agen bisa merusak seluruh sistem dalam sekejap. Pastikan agen menjalankan verify_goal.py dan lulus unit test sebelum melanjutkan ke tahap berikutnya. Statistik pengembangan tahun 2026 menunjukkan bahwa proyek yang menerapkan loop verifikasi otomatis semacam ini memiliki tingkat kecacatan pasca-rilis 7,2% lebih rendah.
Selain itu, buatlah file konfigurasi seperti AGENTS.md untuk membatasi cakupan direktori yang dapat disentuh oleh agen secara eksplisit. Menghalangi agen untuk mengubah konfigurasi lingkungan penting atau file skema DB saja sudah cukup untuk menghilangkan separuh dari stres debugging Anda. Agen harus menjadi asisten yang kompeten, bukan bertindak seolah-olah mereka adalah pemilik rumah.
Saat agen menyelesaikan tugas atau terhenti karena masalah anggaran, jangan biarkan ia mati begitu saja. Wajibkan agen untuk menulis handover_report.txt. Laporan ini harus mencakup tugas yang sudah selesai, tugas yang belum selesai, dan nilai argumen spesifik yang harus dimasukkan pada eksekusi berikutnya.
Ini sama seperti serah terima tugas antar manusia. Catatan tentang "sudah sampai mana dan apa yang harus dilakukan selanjutnya" harus ditinggalkan untuk menghindari duplikasi pekerjaan di sesi berikutnya dan menghemat uang. Otonomi agen hanya dapat bekerja dengan aman di atas pencatatan dan pengawasan yang ketat, bukan sekadar kepercayaan.