Log in to leave a comment
No posts yet
Anda bisa berhenti mengelola Redis sendiri atau menumpuk log teks di DB untuk mengelola riwayat percakapan per pengguna. Bagi pengembang startup yang kewalahan mengelola infrastruktur, metode memasukkan seluruh konteks ke dalam model setiap saat hanyalah pemborosan token dan utang operasional. Anthropic Managed Agents menyimpan log peristiwa di sisi server hanya dengan satu session_id.
Caranya sederhana. Anda cukup membuat satu kolom anthropic_session_id pada tabel users yang sudah ada. Jika ID ini kosong saat pengguna masuk, panggil API untuk membuat sesi baru dan simpan di DB. Jika ID sudah ada, cukup kirimkan nilai tersebut untuk melanjutkan sesi.
Melakukan refactoring dengan cara ini akan mengurangi biaya sumber daya server hingga lebih dari 40%. Pengurangan jumlah input/output DB sudah pasti terjadi, namun yang terpenting, efisiensi caching prompt akan maksimal sehingga biaya token input yang sebelumnya dikirim berulang kali akan berkurang drastis. Dibandingkan dengan biaya menjalankan server sendiri untuk mempertahankan konteks, beban operasionalnya hampir mendekati nol.
Skenario terburuk saat memberikan izin Notion atau GitHub kepada agen adalah kebocoran API key. Jika kunci disimpan dalam variabel lingkungan server, semua izin dapat dicuri hanya dengan satu prompt injection. Managed Agents menggunakan model proksi yang disebut Credential Vault, sehingga agen itu sendiri pun tidak dapat melihat nilai kunci yang sebenarnya.
Jika Anda memikirkan keamanan, buatlah instans Vault independen untuk setiap proyek. Saat mendaftarkan API key layanan eksternal ke Vault, pastikan data sensitif tidak disertakan dalam nilai respons sama sekali. Saat memulai sesi, cukup tentukan vault_ids, dan infrastruktur Anthropic akan secara otomatis menyuntikkan kunci ke dalam header permintaan.
Dengan cara ini, risiko keamanan hilang karena tidak perlu menyimpan kunci di server lokal. Terutama tugas-tugas merepotkan seperti pembaruan token OAuth juga ditangani sendiri oleh Managed Agent, sehingga pengembang tidak perlu menulis logika yang rumit. Hal ini menurunkan probabilitas insiden keamanan hingga lebih dari 90% sekaligus membuat integrasi menjadi jauh lebih mudah.
Kenyamanan ini ada harganya. Managed Agents mengenakan biaya runtime sebesar 0,08 dolar per jam saat sesi dalam status aktif. Artinya, jika dibiarkan begitu saja, uang akan terbuang percuma. Namun, karena tidak ada biaya selama waktu menganggur (Idle Time), Anda memerlukan middleware yang mengelola siklus hidup sesi dengan ketat.
Terapkan tiga strategi otomatisasi untuk menghemat biaya. Pertama, jika tidak ada input pengguna selama 15 menit, segera ubah sesi ke status idle dan atur agar diarsipkan secara otomatis setelah 1 jam. Kedua, untuk tugas latar belakang (background tasks), sesi harus segera diakhiri dan dihapus setelah memberikan hasil. Ketiga, tetapkan batas pengeluaran bulanan di konsol Anthropic untuk memblokir lonjakan sesi yang tidak terduga dari sumbernya.
Kuncinya adalah mengurangi waktu aktif . Jika Anda menerapkan logika manajemen waktu menganggur dengan benar, Anda dapat menghemat biaya operasional keseluruhan sebesar 25% tambahan.
Jika respons agen lambat, pengguna akan segera pergi. Managed Agents mengurangi waktu pemrosesan hingga 85% dengan caching prompt, tetapi Anda harus menyelesaikan sendiri masalah waktu Cold Start yang muncul saat pertama kali meluncurkan sesi.
Untuk mempercepat waktu respons lebih dari 2 detik, segera cari sesi yang ada setelah menerima user_id dan mulai koneksi SSE (Server-Sent Events) secara instan. Mendesain instruksi prompt sistem sebanyak lebih dari 1.024 token juga merupakan salah satu metode. Dengan begitu, caching prompt akan aktif sehingga Time to First Token (TTFT) turun dari level 2,2 detik menjadi sekitar 0,8 detik.
Jika agen mengirimkan sinyal berhenti saat pemanggilan alat (tool calling), backend handler harus mencegatnya dan segera melanjutkan percakapan. Dengan menambahkan penanganan pengecualian (exception handling) dan logika koreksi mandiri (self-correction) seperti ini, tingkat keberhasilan tugas yang kompleks akan meningkat lebih dari 10 poin persentase. Lingkungan di mana Anda dapat fokus hanya pada logika bisnis tanpa mengkhawatirkan infrastruktur diciptakan dengan cara seperti ini.