Log in to leave a comment
No posts yet
cache_control: {"type": "ephemeral"} tepat setelah bagian yang tidak berubah.\n * Data Dinamis di Bawah: Masukkan variabel yang selalu berubah, seperti konten pertanyaan, ID pengguna, dan waktu saat ini, di bawah marker cache atau di bagian paling bawah prompt.\n\nBiaya yang tadinya $0.06 untuk 20k token menjadi sepersepuluhnya, yaitu $0.006, jika mengenai cache. Untuk layanan yang menangani dokumen besar, ini adalah titik di mana struktur keuntungan Anda akan berubah total.\n\n-----\n\n## Chain of Draft (CoD) untuk Mencegah Penalaran yang Bertele-tele\n\nJika Anda meminta model untuk “berpikir langkah demi langkah (CoT)” saat menyelesaikan masalah kompleks, model akan mengeluarkan proses panjang seperti menulis buku harian. Itu semua adalah biaya. Alternatifnya adalah CoD (Chain of Draft). Instruksikan model untuk melakukan penalaran singkat seperti catatan kecil, maksimal 5 kata per poin.\n\nDalam tes penalaran aritmatika, saat CoT menggunakan 172,5 token, CoD berhasil menjawab dengan benar hanya dengan 31,3 token.\n\n### Cara Menerapkan CoD\n\n * Aktifkan Mode Draft: Nyatakan dalam system prompt, “Catat setiap langkah pemikiran dalam bentuk draf maksimal 5 kata.”\n * Sebutkan Sumber: Jika Anda khawatir tentang halusinasi, tambahkan syarat verifikasi minimal seperti “Sebutkan frasa bukti dengan tag .”\n * Klausul Pengecualian: Berikan celah untuk mengizinkan deskripsi mendetail hanya dalam kasus yang benar-benar kompleks untuk mencegah penurunan kualitas.\n\nAnda tetap mendapatkan akurasi sambil membuang hingga 92% token output. Latensi respons juga akan berkurang menjadi kurang dari setengahnya.\n\n-----\n\n## Pemantauan Biaya Real-time dan Analisis Keuntungan\n\nSemua optimalisasi ini hanya bermakna jika hasilnya terlihat. Layanan e-commerce dengan 300.000 panggilan per bulan dapat menekan biaya dari $4.500 menjadi $660 dengan menggabungkan Prompt Caching dan CoD. Ini berarti keuntungan operasional sekitar 5 juta won per bulan tercipta hanya dari beberapa baris revisi prompt..claudeignore untuk mencegah file yang tidak perlu masuk ke dalam konteks.$Cost = N \times (T_{in} \times P_{in} + T_{out} \times P_{out})$ ke dalam spreadsheet dan pantau hasilnya setiap minggu.\n\nHapus kata 'terima kasih' dari system prompt Anda hari ini juga dan ubah urutan data Anda. Ketidakenakan kecil itu akan mengubah tagihan bulanan Anda menjadi keuntungan.