Managed Agents dari Anthropic Berbeda (Inilah Alasannya)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업경영/리더십AI/미래기술

Transcript

00:00:00Tim Claude telah merilis Claude managed agents, yang mereka sebut sebagai evolusi berikutnya
00:00:09setelah agent SDK.
00:00:11Ini memungkinkan Anda membuat agen kustom tanpa menulis satu baris kode pun.
00:00:16Agen-agen ini berjalan di infrastruktur terkelola milik Anthropic, yang memiliki arsitektur keren
00:00:22yang sempurna untuk merilis agen yang aman, skalabel, dan siap produksi yang bisa melakukan
00:00:27apa pun yang Anda inginkan.
00:00:28Juga menjawab pertanyaan pelanggan berdasarkan basis pengetahuan Anda, atau bahkan riset rutin
00:00:32untuk Anda dan mengirimkannya pada waktu tertentu menggunakan Slack.
00:00:36Tapi mengapa ada yang menggunakan ini alih-alih menginstal kode Claude di VPS mereka sendiri?
00:00:40Klik subscribe dan mari kita bahas.
00:00:46Tapi sebelum itu, mari bicara sedikit tentang Anthropic karena mereka sangat sibuk
00:00:49beberapa minggu terakhir ini.
00:00:50Maksud saya, mereka baru-baru ini melarang orang menggunakan langganan Claude pada alat
00:00:55pihak ketiga seperti OpenClaw, yang menurut orang-orang karena adanya managed agents, tapi
00:01:00keduanya tidak persis sama.
00:01:01Maksud saya, saya akan katakan OpenClaw itu seperti Linux.
00:01:04Ini adalah agen untuk pengoprek.
00:01:06Anda memilih perangkat keras sendiri, model sendiri, menangani keamanan, dan segala hal
00:01:11di antaranya.
00:01:12Sedangkan Claude managed agents, berani saya katakan, seperti Apple, karena Anda tidak perlu
00:01:17melakukan semua hal itu.
00:01:19Claude menangani infrastruktur dan keamanannya, Anda cukup beri tahu apa yang Anda mau dalam
00:01:24bahasa Inggris sederhana, dan ia akan membangun agen sempurna Anda.
00:01:28Faktanya, izinkan saya menunjukkan betapa mudahnya melalui contoh yang sederhana namun sangat pribadi.
00:01:34Saya punya repo GitHub privat yang berisi semua informasi medis saya yang diambil dari
00:01:39aplikasi NHS.
00:01:40Dan saya ingin berkomunikasi dengan data itu atau mendapatkan informasi darinya menggunakan Slack.
00:01:45Jadi saya bisa menggunakannya dari desktop, ponsel, intinya di mana pun saya berada.
00:01:49Di antara dua hal itu, saya ingin Claude managed agent melakukan tugas pengambilan
00:01:54data, menggunakan alat untuk mendapat info yang tepat dan menerjemahkannya agar saya bisa paham.
00:02:01itu.
00:02:02Jadi untuk memulai, saya bisa ke konsol Claude, pilih opsi managed agents yang baru
00:02:07dan mengetik di sini dalam bahasa alami untuk membuat agen saya dari awal.
00:02:11Ini akan berkomunikasi dengan API Claude menggunakan perintah curl dan akan menghosting kode
00:02:16yang diperlukan di infrastruktur Anthropic.
00:02:19Tapi saya juga bisa menggunakan skill managed agent dalam bahasa apa pun yang saya suka.
00:02:23Dalam kasus ini, saya akan memilih TypeScript dan skill ini akan menggunakan SDK TypeScript ke Claude
00:02:29untuk membuatkan agen bagi saya.
00:02:31Untuk itu, Anda harus memiliki versi kode Claude ini atau yang lebih tinggi, yang memiliki
00:02:36skill managed agent bawaan.
00:02:38Dalam kasus saya, saya punya versi yang lebih tinggi dan bisa memicu skill tersebut menggunakan perintah
00:02:42slash Claude API diikuti dengan managed agents onboarding.
00:02:46Setelah saya tekan enter, ia bertanya apakah saya tahu agen jenis apa yang ingin saya bangun,
00:02:50saya tidak tahu, tapi kita lihat saja apa yang ia lakukan.
00:02:52Dan ia memberi tahu akan memandu saya melalui tiga langkah ini.
00:02:55Yaitu tools, skills, files, dan repos, lalu environment dan identity.
00:02:59Yang mengejutkan, ia menggunakan banyak konteks, jadi mungkin ada sedikit pemadatan, tapi
00:03:04kita lihat apa yang terjadi.
00:03:05Lalu, saya beri perintah untuk membuat agen medis yang membaca file markdown dari
00:03:10repo GitHub privat, memahami informasi layaknya dokter dan memungkinkan saya berkomunikasi
00:03:15dengannya menggunakan Slack.
00:03:17Lalu ia merekomendasikan saya menggunakan set alat bawaan, yaitu read glob grep dan tidak menggunakan
00:03:22write edit bash, karena dokter tidak punya alasan untuk mengubah repo, yang mana itu masuk akal.
00:03:27Ia juga menanyakan URL repo, jadi saya akan ikuti alat dan izin
00:03:31yang direkomendasikan, dan saya beri tautan ke reponya.
00:03:35Setelah itu, ia menyarankan apa yang harus ada di ronde B dan C, karena ini
00:03:39agen yang sangat dasar, semuanya cukup jelas.
00:03:41Lalu ia membuat sistem prompt untuk agen saya, serta menyarankan model yang harus
00:03:45digunakan.
00:03:46Sekarang saya akan memintanya menggunakan sonnet karena saya tidak ingin menghabiskan terlalu banyak uang untuk Opus.
00:03:49Saya akan jelaskan alasannya nanti, tapi selain itu, ini terlihat bagus dan saya akan berikan
00:03:53kredensial ini serta bahasa yang saya inginkan.
00:03:56Dan sekarang ia telah membuat dua file untuk saya dalam TypeScript.
00:03:59Yang pertama adalah setup, yang akan mengatur hal-hal seperti environment, agen,
00:04:04dan skill apa pun yang diperlukan di dalam infrastruktur Anthropic.
00:04:07Yang kedua adalah runtime, yang sebenarnya akan menjadi bagian yang berkomunikasi dengan
00:04:12server Anthropic dan memberikan informasi itu ke Slack.
00:04:15Jadi saya akan siapkan semuanya dan menunjukkan hasilnya saat sudah selesai.
00:04:19Setelah menjalankan file setup ini, ia memberi saya ID environment, yang ada di sebelah sini.
00:04:24Dan ia juga memberi saya ID agen, yang juga ada di sini.
00:04:27Seperti yang saya sebutkan tadi, hal-hal ini dibuat di infrastruktur Anthropic.
00:04:32Jadi di dalam konsol Claude, saya bisa melihat agen saya di sini, serta environment yang
00:04:36baru saja saya buat.
00:04:37Saya juga sudah membuat aplikasi Slack dan memasukkan semua informasinya ke dalam file .env untuk
00:04:42digunakan file apps.ts ini, artinya jika saya jalankan file itu, bot Slack saya akan berjalan.
00:04:48Jadi saya bisa bertanya padanya, model apa yang Anda gunakan?
00:04:50Dan setelah beberapa saat ia menjawab, saya Claude buatan Anthropic.
00:04:54Apakah ada masalah medis yang bisa saya bantu?
00:04:56Ini sangat keren.
00:04:57Tapi yang lebih keren lagi adalah saya bisa melihat sesi tersebut di konsol Claude.
00:05:01Ya, saya sudah mengujinya beberapa kali dan di sini kita mendapatkan detail lebih lanjut tentang apa yang terjadi.
00:05:04Jika saya tutup ini agar lebih besar, Anda bisa melihat pertanyaan yang diajukan pengguna.
00:05:09Lalu ia menggunakan alat pesan Slack dan kemudian agen tersebut menjawab.
00:05:12Saya lupa menyebutkan tadi bagaimana sistem harga untuk ini.
00:05:15Jika kita lihat dokumentasinya, kita bisa melihat bahwa semua token yang digunakan oleh managed agents
00:05:20dihargai dengan model harga yang digunakan API Claude, yang ada di sini.
00:05:25Sayangnya langganan pro max atau tim Anda tidak berguna untuk managed agents, selain
00:05:30membayar token, Anda juga harus membayar sesi, yaitu 8 sen per jam sesi.
00:05:35per jam.
00:05:36Dan ini hanya berlaku saat sesi sedang berjalan.
00:05:38Jadi jika saya kembali ke konsol Claude dan klik pada sesi, untuk semua sesi yang menganggur ini,
00:05:42saya tidak dikenakan biaya.
00:05:43Oke, mari kita lakukan sesuatu yang sedikit lebih menarik dengan bot ini.
00:05:46Saya akan bertanya, berdasarkan apa yang Anda ketahui tentang saya secara medis, apakah boleh saya makan
00:05:50cumi-cumi?
00:05:51Di sini ia telah menjalankan alat bash untuk mendapatkan informasi dari repo.
00:05:56Ia melakukan dua kali pembacaan file, dan beberapa detik kemudian, ia mengirim pesan Slack, yang memberitahu
00:06:01saya bahwa saya harus berhati-hati dengan cumi-cumi karena saya alergi udang, yang mana itu benar.
00:06:06Menurut saya ia memberi terlalu banyak informasi dengan menceritakan tentang lidah gatal hingga tenggorokan bengkak
00:06:11dan sebagainya.
00:06:12Tapi sejujurnya, ini bekerja dengan sangat baik.
00:06:13Bahkan, saya sempat sedikit memodifikasi agennya.
00:06:15Jika kita klik di sini pada konsol Claude, kita bisa melihat ada tiga versi yang menunjukkan
00:06:19bahwa agen ini telah diubah tiga kali.
00:06:21Saya mengubah sistem prompt agar terdengar lebih manusiawi dan mengubah modelnya
00:06:26dari Opus ke Sonnet.
00:06:27Tetapi di sini di UI, saya bisa mengubah sistem prompt agen, saya bisa mengubah model dan
00:06:32alat yang bisa diaksesnya, yang mana sangat berguna untuk pengujian.
00:06:35Jadi, kira-kira begitu saja.
00:06:36Selain beberapa penyesuaian kode kecil yang saya temukan dengan berdiskusi dengan Claude, itulah
00:06:41betapa mudahnya membangun sebuah agen.
00:06:44Tidak perlu belajar cara kerja Claude agent SDK.
00:06:47Anda cukup berkomunikasi dengan Claude menggunakan sebuah skill dan membuat agen Anda sendiri.
00:06:51Tapi bagaimana cara kerja semua ini di balik layar?
00:06:54Anthropic telah menulis artikel yang sangat detail tentang cara kerja semuanya, yang akan saya sertakan
00:06:58tautannya di deskripsi.
00:07:00Tapi saya akan katakan seluruh arsitekturnya terdiri dari tiga komponen utama.
00:07:05Yaitu session harness dan orchestration, ini bukan berarti sandbox dan tools kurang
00:07:09penting, tapi menurut saya tiga hal ini sangat unik.
00:07:12Harness, yang juga dikenal sebagai tangan dari sistem, adalah tempat model Claude digunakan.
00:07:17Dan ia juga dikenal sebagai router tanpa status karena ia merutekan panggilan alat, sumber daya, dan MCP ke
00:07:23tempat yang relevan atau menjalankan kode dan mengedit file di lingkungan sandbox.
00:07:28Sekarang saya akan bahas keuntungan memisahkan panggilan alat dari harness
00:07:32itu sendiri.
00:07:33Tapi sesi di sini seperti memori sistem dan berisi log tambahan dari
00:07:37harness.
00:07:38Anda mungkin berpikir harness-nya adalah kode Claude, tapi sebenarnya itu adalah harness kustom
00:07:43untuk managed agents.
00:07:44Saya juga akan jelaskan alasannya nanti.
00:07:47Dan terakhir, orchestrator adalah yang memutuskan mode apa yang harus dijalankan harness.
00:07:51Seperti rencana pembangunan dan sebagainya.
00:07:54Dan yang penting, ia membuat harness baru jika harness yang ada gagal.
00:07:58Bayangkan Anda punya harness di sini yang gagal atau mati.
00:08:02Orchestrator dapat membuat harness baru.
00:08:04Dan karena log sesi terpisah dari harness itu sendiri, harness baru dapat membaca
00:08:09log untuk mengetahui apa yang telah terjadi dan dari mana tepatnya ia harus melanjutkan.
00:08:13Bahkan, seluruh sistem ini dibangun untuk skala besar.
00:08:15Jadi Anda bisa memiliki model sebanyak yang Anda mau dan lingkungan sebanyak apa pun, dan arsitekturnya
00:08:20akan mampu menanganinya.
00:08:21Keuntungan lain dari arsitektur ini adalah aspek keamanannya.
00:08:25Jika saya kembali ke konsol Claude dan klik pada brankas kredensial, Anda bisa melihat bahwa
00:08:30kredensial disimpan di lokasi yang aman.
00:08:32Jika saya punya agen yang berjalan secara lokal, itu bisa berupa file .env atau sesuatu yang kustom yang
00:08:36saya pasang.
00:08:37Tapi jika saya menggunakan konsol Claude atau UI, maka semua kredensial disimpan
00:08:41di sini.
00:08:42Dan kehebatannya adalah kredensial ini dipanggil saat runtime.
00:08:45Jadi jika Anda memiliki kunci API spesifik MCP atau kunci spesifik alat, maka harness atau modelnya
00:08:50tidak tahu apa-apa tentang itu dan tidak bisa mengaksesnya.
00:08:54Misalnya, jika saya perlu memanggil alat cuaca MCP dan saya punya kunci API-nya, maka harness
00:09:00akan memanggil alat tersebut dan kunci API-nya akan ada di dalam panggilan alat itu sendiri atau MCP-nya.
00:09:05Dan itu akan digunakan saat runtime.
00:09:07Demikian pula, jika sandbox perlu menggunakan sebuah kunci, maka itu akan disimpan di brankas.
00:09:12Dan itu juga akan digunakan saat runtime dan model tidak akan mengetahuinya.
00:09:15Bahkan, ia bahkan tidak tahu tentang kunci API Anthropic miliknya sendiri, karena itu juga digunakan
00:09:20saat runtime.
00:09:21Saya sangat menyarankan membaca sisa artikel ini untuk mendapatkan gambaran detail tentang bagaimana
00:09:25semuanya disatukan, karena ini sangat unik.
00:09:28Sejujurnya, saya sangat senang membuat Claude managed agents.
00:09:31Maksud saya, ada orang-orang di luar sana yang berpikir ini akan mati, sama seperti agen
00:09:36OpenAI.
00:09:37Jika agen OpenAI belum mati, tolong beri tahu saya di kolom komentar karena saya tidak
00:09:39banyak mendengar tentang mereka.
00:09:40Tapi saya rasa ini akan bertahan lama murni karena sangat mudah untuk
00:09:45membuat sebuah agen.
00:09:46Anda tidak harus belajar tentang SDK, Anda tidak harus menggunakan terminal untuk membuatnya jika
00:09:51tidak mau, dan Anda bisa melakukan semua penyambungan ke server MCP dan alat-alat semuanya
00:09:56di dalam UI, yang mana sangat bagus bagi orang yang tidak ingin menulis kode apa pun.
00:10:01Tapi saya harus katakan satu hal yang agak mengecewakan adalah kenyataan bahwa Anda harus membayar menggunakan
00:10:06token API atau membayar menggunakan penagihan API, karena sebagai pelanggan Claude Pro,
00:10:12saya ingin sekali menggunakan batas saya, yaitu batas yang ada dalam jangkauan Pro pada managed agents,
00:10:17sehingga saya tidak perlu membayar untuk dua hal yang berbeda.
00:10:20Tapi sejujurnya, ini tidak terlalu mahal jika Anda menggunakan model yang lebih murah seperti Sonnet atau Haiku.
00:10:26Dan meskipun ini agak terkurasi, seperti yang Anda lihat, ia memberi Anda akses ke Notion,
00:10:31server Slack MCP dan sebagainya, tetapi jika Anda ingin membuat sesuatu yang tidak ada dalam
00:10:36batasan tersebut, maka Anda harus menulis kode Anda sendiri, yang mana OpenClaw
00:10:40sangat bagus untuk itu.
00:10:41Maksud saya, OpenClaw sangat terbuka, sesuai namanya, dan memiliki banyak kanal mulai dari Telegram hingga
00:10:46Discord ke WhatsApp, sedangkan jika Anda ingin melakukan hal yang sama dengan managed agents, Anda
00:10:51mungkin harus mengodekan solusi Anda sendiri atau meminta Claude untuk mengodekannya untuk Anda.

Key Takeaway

Claude Managed Agents menyediakan platform tanpa kode untuk membangun agen AI yang aman dan skalabel di atas infrastruktur Anthropic dengan biaya sesi sebesar 8 sen per jam di luar penggunaan token API.

Highlights

Claude Managed Agents memungkinkan pembuatan agen kustom tanpa kode melalui infrastruktur terkelola Anthropic.

Biaya penggunaan agen mencakup harga token API standar ditambah biaya sesi sebesar 8 sen per jam.

Arsitektur sistem memisahkan log sesi dari harness untuk memastikan pemulihan otomatis saat terjadi kegagalan sistem.

Keamanan data terjamin melalui brankas kredensial yang memanggil kunci API hanya pada saat runtime tanpa diketahui oleh model.

Pengguna dapat membangun agen medis yang terhubung ke repo GitHub privat dan berinteraksi melalui Slack hanya dalam hitungan menit.

Sistem mendukung skalabilitas penuh dengan kemampuan menangani banyak model dan lingkungan secara bersamaan.

Timeline

Evolusi agen AI tanpa kode

  • Claude Managed Agents adalah langkah berikutnya setelah agen SDK yang tidak memerlukan penulisan kode.
  • Agen berjalan sepenuhnya di infrastruktur Anthropic untuk menjamin keamanan dan skalabilitas produksi.
  • Kemampuan agen mencakup menjawab pertanyaan pelanggan berdasarkan basis pengetahuan hingga melakukan riset rutin via Slack.

Infrastruktur ini dirancang untuk memudahkan perilisan agen yang siap pakai tanpa kerumitan teknis. Pengguna dapat mengotomatiskan tugas-tugas administratif seperti pengiriman laporan riset pada waktu tertentu melalui integrasi aplikasi pihak ketiga. Pendekatan ini menghilangkan kebutuhan untuk mengelola server VPS sendiri.

Perbandingan Managed Agents dan OpenClaw

  • OpenClaw berfungsi seperti Linux yang ditujukan bagi pengguna yang ingin mengontrol perangkat keras dan keamanan secara mandiri.
  • Managed Agents beroperasi menyerupai ekosistem tertutup seperti Apple yang menangani seluruh infrastruktur dan keamanan.
  • Instruksi bahasa Inggris sederhana cukup untuk membangun fungsionalitas agen yang kompleks.

Perbedaan mendasar terletak pada tingkat kendali dan kemudahan penggunaan. Pengguna OpenClaw harus menangani pemilihan model dan manajemen keamanan sendiri. Sebaliknya, Managed Agents mengotomatiskan seluruh aspek teknis tersebut sehingga pengguna hanya perlu fokus pada logika bisnis agen.

Proses pembuatan agen medis kustom

  • Konsol Claude menyediakan opsi pembuatan agen melalui bahasa alami atau menggunakan SDK TypeScript.
  • Agen dapat dikonfigurasi dengan alat spesifik seperti read, glob, dan grep untuk membatasi akses pada repositori data.
  • Pemisahan file setup dan runtime memungkinkan pengelolaan lingkungan dan komunikasi API yang lebih terstruktur.

Pembuatan agen medis yang membaca data NHS dari GitHub privat membuktikan kemudahan integrasi ini. Setelah konfigurasi awal, sistem menghasilkan ID environment dan ID agen yang dapat dipantau langsung melalui konsol Claude. Interaksi melalui Slack menunjukkan bahwa agen mampu mengidentifikasi alergi udang pengguna berdasarkan data medis di repositori.

Struktur biaya dan manajemen sesi

  • Harga penggunaan didasarkan pada model harga API Claude dan tambahan biaya 8 sen per jam sesi aktif.
  • Sesi yang menganggur atau idle tidak dikenakan biaya tambahan kepada pengguna.
  • Langganan Claude Pro atau Team tidak mencakup biaya penggunaan Managed Agents.

Sistem penagihan dipisahkan dari langganan konsumen untuk mengakomodasi kebutuhan penggunaan skala besar. Pengguna dapat memilih model yang lebih ekonomis seperti Sonnet untuk menghemat biaya dibandingkan model Opus. UI konsol memungkinkan pengujian cepat dengan mengubah sistem prompt atau model tanpa harus menulis ulang kode.

Arsitektur teknis dan keamanan runtime

  • Arsitektur sistem terdiri dari tiga komponen utama yaitu session harness, orchestration, dan memory.
  • Orchestrator secara otomatis membuat harness baru jika terjadi kegagalan fungsi tanpa kehilangan data sesi.
  • Kredensial disimpan dalam brankas aman dan hanya diakses saat runtime sehingga model tidak pernah mengetahui kunci API asli.

Pemisahan antara harness sebagai 'tangan' sistem dan log sesi sebagai 'memori' memungkinkan ketahanan sistem yang tinggi. Jika sebuah harness mati, harness baru dapat membaca log sesi untuk melanjutkan tugas dari titik terakhir. Keamanan ditingkatkan dengan memastikan model tidak memiliki akses langsung ke kunci API Anthropic miliknya sendiri maupun kunci pihak ketiga seperti MCP.

Fleksibilitas dan keterbatasan platform

  • UI terpusat mempermudah koneksi ke server MCP dan alat tanpa perlu pengetahuan terminal.
  • Ketergantungan pada penagihan API menjadi kendala bagi pengguna yang ingin menggunakan kuota langganan Pro.
  • Kebutuhan kustomisasi yang sangat spesifik seperti integrasi Telegram atau WhatsApp masih memerlukan solusi pengkodean mandiri.

Meskipun sangat memudahkan bagi pengguna non-teknis, platform ini masih memiliki batasan dalam hal integrasi eksternal di luar ekosistem yang dikurasi. Pengguna yang memerlukan fleksibilitas ekstrem seperti pada OpenClaw mungkin merasa terbatas oleh opsi yang ada di UI. Namun, bagi sebagian besar kebutuhan bisnis, kemudahan pengaturan alat di dalam konsol menjadi keunggulan utama.

Community Posts

View all posts