Log in to leave a comment
No posts yet
Jangan biarkan Claude Code memindai seluruh folder proyek Anda. Semakin banyak jumlah file, semakin tinggi tingkat okupansi konteks awal, yang akan langsung berdampak pada isi dompet Anda. Berdasarkan kasus penggunaan Model Context Protocol (MCP) yang dirilis oleh Anthropic, menanyakan definisi tabel yang diperlukan saja dapat menghemat konsumsi token lebih dari 30% dibandingkan dengan injeksi teks biasa.
Caranya sederhana. Buat file .mcp.json di root proyek dan jalankan perintah berikut di terminal:claude mcp add db -- npx -y @bytebase/dbhub
Sekarang hubungkan PostgreSQL atau MongoDB secara langsung. Anda harus menegaskan kepada Claude: "Jangan baca seluruh skema, ambil saja DDL tabel yang terkait dengan fungsi yang sedang diperbaiki saat ini." Dengan membaca puluhan baris yang diperlukan saja alih-alih puluhan ribu baris skema, Anda dapat menekan biaya per sesi di bawah $1 sambil meningkatkan akurasi respons.
Fenomena halusinasi di mana agen berhenti menulis kode dan mulai mengoceh tidak jelas menjadi lebih buruk ketika tidak ada batasan fisik. Bahkan saat konteks penuh dan penilaian menjadi kabur, kode pengujian (test code) berfungsi sebagai oracle yang akurat. Faktanya, membangun loop umpan balik otomatis dapat mengurangi waktu debugging manual lebih dari 5 jam per minggu.
Pertama, gunakan perintah /test untuk memintanya menulis kode pengujian yang gagal untuk fitur yang akan diimplementasikan. Kemudian, pasang hook PostToolUse agar pengujian berjalan setiap kali file berubah. Hal yang penting di sini adalah memaksa agen dengan instruksi: "Jangan menyentuh kode pengujian, tuliskan hanya logika minimal di dalam body untuk meloloskan tes ini." Anda tidak perlu menyalin dan mengirimkan pesan kesalahan satu per satu. Biarkan dia melihat dan memperbaiki kesalahannya sendiri, maka kelengkapan kode yang siap deploy akan meningkat hingga 95%.
Semakin lama percakapan dalam sesi Claude Code, semakin banyak hasil eksekusi alat (tool) di masa lalu yang menumpuk, yang menyebabkan biaya melonjak. Ketika konteks melebihi 70%, muncul fenomena drift di mana agen mulai melupakan apa yang dikatakan di awal atau menulis kode yang tidak relevan. Saya memaksa pengosongan sesi pada titik 60%, yaitu saat bilah konteks berubah menjadi warna kuning.
Ini bukan sekadar mematikan sesi. Buatlah file bernama HANDOFF.md. Mintalah agen untuk merangkum poin-poin keputusan yang telah dibuat sejauh ini dan daftar tugas yang tersisa di sana. Setelah itu, bersihkan sesi dengan /clear dan mulai ulang. Anda cukup memintanya membaca HANDOFF.md yang baru saja dibuat. Saat menggunakan model berperforma tinggi seperti Claude 3.5 Sonnet, Anda dapat memotong biaya yang dibayarkan untuk riwayat masa lalu yang tidak perlu hingga setengahnya sambil tetap mempertahankan alur kerja.
Pengetahuan Claude terhenti pada titik waktu pelatihannya. Saat menangani framework yang sintaksnya sering berubah seperti Next.js App Router, jika agen menulis kode jadul, itu murni kesalahan pengguna. Menyalin dan menempel dokumentasi resmi adalah pemborosan token dan pekerjaan yang merepotkan.
Instal MCP untuk pencarian dokumen dengan perintah claude mcp add context7. Cukup tentukan versi dalam prompt seperti "use context7 to fetch the latest NextAuth v5 documentation". Buatlah agen menulis kode berdasarkan spesifikasi API yang diambil secara real-time. Anda dapat memangkas lebih dari 40% waktu yang terbuang akibat kesalahan sintaks kuno.
Jika diberikan tugas logika bisnis yang rumit, agen cenderung langsung mencoret-coret kode terlebih dahulu. Kemudian, jika muncul celah logis, agen akan menghabiskan puluhan ribu token lebih banyak untuk memperbaikinya. Anda harus menghemat biaya ini dengan mengimplementasikan fitur pemikiran yang diperluas (expanded thinking) dari Claude 4.5 terlebih dahulu melalui prompt.
Tuliskan di file CLAUDE.md: "Sebelum menulis kode, pastikan untuk menjelaskan logika langkah demi langkah di dalam tag <thinking>." Mintalah untuk mengidentifikasi 3 kemungkinan situasi pengecualian terlebih dahulu, dan tetapkan proses di mana modifikasi file hanya dimulai setelah Anda menyetujui logika tersebut. Menggunakan beberapa ratus token lebih banyak untuk melihat proses penalaran jauh lebih ekonomis daripada kehilangan puluhan ribu token untuk memperbaiki logika yang salah. Bagi pengembang tunggal (solo developer), tidak ada strategi orkestrasi yang lebih baik dari ini.