Log in to leave a comment
No posts yet
Kita berada di era di mana AI agent dapat menulis kode dan membangun infrastruktur. Namun, para pengembang di lapangan masih merasa cemas. Hal ini dikarenakan situasi di mana agent yang tadinya sempurna tiba-tiba memberikan jawaban yang tidak masuk akal atau mengabaikan alat yang diperintahkan secara jelas masih sering terjadi.
Hasil eksperimen terbaru dari tim Vercel AI SDK cukup mengejutkan. Tingkat kegagalan yang terjadi saat AI agent diberikan hak pilih alat, yaitu "Skills", mencapai angka 56%. Ini bukan masalah kecerdasan model. Ini adalah bukti bahwa cara kita memberikan informasi kepada AI secara fundamental salah. Rahasia untuk meningkatkan tingkat keberhasilan agent hingga 100% bukanlah penambahan alat, melainkan strategi konteks persistensi berbasis agents.md.
Banyak pengembang memberikan berbagai fungsi pemanggilan alat kepada agent dan berharap AI akan mengeluarkannya sendiri saat dibutuhkan. Namun, metode ini memiliki kelemahan fatal yang disebut "decision noise" (kebisingan keputusan).
Context window pada model AI mirip dengan memori jangka pendek manusia. Jika percakapan berlangsung lebih dari 5 kali, instruksi yang tertulis di system prompt awal akan tergeser dari prioritas. Ini disebut sebagai pembusukan konteks (context corruption). Agent akan terus bimbang setiap saat: "Apakah saya harus menggunakan alat sekarang, atau menjawab sesuai apa yang saya tahu?". Titik keputusan inilah yang menjadi single point of failure yang memicu kegagalan.
Solusi untuk mengubah tingkat kegagalan 56% menjadi 0% sangatlah sederhana. Alih-alih memberikan hak pilih kepada agent, kita menetapkan aturan dan informasi inti proyek ke dalam system prompt. Di sinilah letak peran file agents.md.
Menurut benchmark dari Vercel, ketika informasi yang sama diberikan sebagai alat, tingkat keberhasilannya adalah 79%. Namun, ketika dimasukkan langsung dalam bentuk indeks ke dalam agents.md, tingkat kelulusannya tercatat mencapai 100%.
| Metrik Analisis | Metode Pemanggilan Alat (Skills) | Konteks Persistensi (agents.md) |
|---|---|---|
| Pengambilan Keputusan | Agent memutuskan untuk memuat setiap saat | Informasi selalu berada di dalam sistem |
| Keandalan | Sekitar 53% ~ 79% (tidak stabil) | Dapat mencapai maksimal 100% |
| Beban Penalaran | Beban tinggi karena decision noise | Beban rendah karena penghapusan keputusan |
| Karakteristik | Metode On-demand | Metode Pasif |
Untuk memaksimalkan performa, agents.md harus dirancang bukan sekadar sebagai file teks biasa, melainkan sebagai README untuk mesin.
Larangan yang spesifik meningkatkan kualitas hasil kerja agent secara instan dibandingkan prinsip abstrak. Diperlukan perintah konkret seperti menggunakan MUI v3 dan manajemen status wajib menggunakan Jotai. Instruksi untuk tidak pernah menggunakan alert() dan memanfaatkan komponen dari library tertentu akan mencegah agent menyimpang.
Jangan biarkan agent membuang-buang token dengan memindai seluruh repositori. Berikan lokasi file inti sebagai indeks mini. Gambarkan peta yang jelas tentang apakah harus menggunakan pnpm saat build, serta di mana lokasi file rute dan file skema.
Performa justru akan menurun jika file terlalu besar. Vercel merekomendasikan metode pengindeksan dengan mengompresi dokumen 40KB menjadi 8KB. Intinya adalah mengoptimalkan dan menyampaikan jalur akses ke pengetahuan, daripada sekadar menyuapi agent dengan pengetahuan itu sendiri.
Sama seperti utang teknis yang menumpuk pada kode, "utang prompt" juga menumpuk dalam penggunaan AI. Jika instruksi yang diberikan setiap anggota tim kepada agent berbeda-beda, konsistensi hasil akan hancur. Dengan meletakkan agents.md di root proyek dan mengelolanya dengan Git, kontrol versi akan terintegrasi dan panduan standar tim dapat diterapkan secara sama terlepas dari model apa pun yang digunakan.
Di era AI agent, kemenangan ditentukan oleh context engineering daripada kecerdasan model. Daripada menunggu agent menjadi lebih pintar, membangun lingkungan di mana agent tidak mungkin melakukan kesalahan adalah jalan paling pasti untuk meningkatkan produktivitas. Mulailah sekarang dengan membuat agents.md di root proyek Anda dan membukukan aturan tim Anda.