gwscli: Kelola Semua Google Workspace di Satu CLI untuk AI Agent (feat. Claude Code)

BBetter Stack
컴퓨터/소프트웨어창업/스타트업AI/미래기술

Transcript

00:00:00Google Workspace baru saja menjadi jauh lebih baik bagi agen AI karena mereka telah merilis
00:00:04alat CLI tangguh yang memungkinkan agen Anda berinteraksi dengan API Google Workspace apa pun.
00:00:09Jadi, membaca file dari Drive, mengirim email, bahkan membuat slide, semuanya dibangun dari awal
00:00:14untuk agen AI, artinya mereka menggunakan token sesedikit mungkin dan membuat perintah secara dinamis saat
00:00:19runtime sehingga API-nya selalu mutakhir. Namun kini, dengan perusahaan besar seperti Google
00:00:24membuat CLI untuk sesuatu yang sebelumnya dan masih merupakan server MCP, apa artinya
00:00:29bagi masa depan MCP? Tekan tombol subscribe dan mari kita cari tahu.
00:00:33Bulan lalu saya membuat video tentang Playwright yang membuat CLI untuk sesuatu yang sebelumnya adalah server MCP.
00:00:42Sekarang sepertinya Google Workspace melakukan hal yang sama dan orang-orang di Twitter sangat antusias.
00:00:46Ini adalah alat CLI yang dibangun oleh Justin yang telah menulis postingan blog yang membahas semua yang dia lakukan
00:00:52untuk membuatnya khusus bagi para agen, yang akan kita bahas nanti. Tapi ia memiliki lebih dari 100
00:00:57keahlian yang bisa Anda unduh dari skills SH, yang tentu saja membuat g-man sangat senang.
00:01:01Namun sebelum kita masuk ke apa yang bisa dilakukannya, kita perlu membahas pengaturannya karena jika kita tahu apa pun
00:01:06tentang alat terkait Google Cloud, pengaturannya tidak begitu sederhana. Biar saya tunjukkan.
00:01:10Pertama dan yang terpenting, Anda perlu akses ke Google Cloud Console. Anda bisa membuat
00:01:15proyek baru atau menggunakan yang sudah ada. Saya membuat yang baru. Lalu Anda perlu menginstal gcloud CLI,
00:01:21yang bisa dilakukan dengan brew jika Anda menggunakan Mac. Dan dengan terinstalnya Google Workspace CLI,
00:01:26Anda harus menjalankan perintah ini untuk melakukan pengaturan, yang cukup jelas.
00:01:31Gunakan email Anda untuk autentikasi, pilih proyek GCP atau siapkan satu, lalu pilih API yang ingin
00:01:37Anda akses. Setelah selesai pada tahap ini, Anda harus pergi ke kredensial layanan API
00:01:42dan buat ID klien auth baru, yang saya yakin bisa untuk jenis aplikasi apa pun. Saya memilih web,
00:01:48tapi saya yakin ini akan berfungsi dengan desktop karena yang Anda butuhkan hanyalah ID klien dan rahasia ini.
00:01:53Setelah itu, tahap berikutnya adalah bagian yang agak rumit karena setelah
00:01:57menjalankan perintah ini, Anda harus memilih lingkup autentikasi Anda. Untuk demo ini, saya memilih semuanya,
00:02:02yang sebenarnya tidak ideal, tapi saya hanya sedang menguji API-nya. Lalu Anda akan mendapatkan URL besar untuk autentikasi di
00:02:08browser Anda. Sekarang, pertama-tama pastikan tidak ada saltik di sini karena Anda mungkin
00:02:12akan mendapat error, tapi Anda perlu mencatat port setelah localhost, yang dalam kasus saya adalah 51065.
00:02:18Lalu kembali ke cloud console, klik API dan layanan, layar persetujuan auth,
00:02:23lalu klik klien, pilih klien web Anda. Dan di bagian bawah yang bertuliskan URI pengalihan
00:02:28yang diotorisasi, ubah ini menjadi nomor port tersebut. Jadi 51065, dan kita belum selesai.
00:02:33Buka audiens, gulir ke bawah dan tambahkan alamat email Anda di sini jika belum ada.
00:02:37Nah, jika Anda sudah memiliki aplikasi yang dipublikasikan, Anda tidak akan mengalami masalah ini,
00:02:40tetapi karena saya hanya menguji API-nya, saya menggunakannya dalam mode pengujian.
00:02:44Jadi saya perlu menambahkan email saya dan email semua pengguna yang ingin menggunakan CLI di sini.
00:02:48Setelah itu selesai, Anda dapat menyalin URL ini dan ikuti langkah-langkah untuk mengonfigurasi CLI.
00:02:52Dan setelah selesai, Anda seharusnya mendapatkan status sukses. Jika Anda tidak melihat layar ini,
00:02:56tunggu beberapa detik dan coba lagi, karena memang butuh waktu untuk mendaftarkan URI pengalihan tersebut.
00:03:01Seluruh proses ini, hanya pengaturannya saja, memakan waktu paling lama bagi saya untuk dipahami,
00:03:06yang menunjukkan bahwa saya tidak terlalu sering menggunakan alat Google Cloud, tetapi setelah selesai,
00:03:11Anda akan melihat detail Anda di sini, yang berarti kesenangan yang sesungguhnya bisa dimulai. Lihat ini.
00:03:15Sekarang saya akan mulai dengan yang sederhana dan meminta Claude memberikan informasi tentang 10 email terakhir saya.
00:03:19Semoga tidak ada hal sensitif di sana. Dan dengan menggunakan GWS CLI,
00:03:24ia memberikan informasi tentang setiap email dengan pengirim, subjek, tanggal, dan label.
00:03:28Dan kita bisa melihat untuk tugas ini, ia hanya menggunakan 9% dari keseluruhan konteks murni karena
00:03:33tidak ada alat MCP di sini. Sebagian besar konteks digunakan oleh pesan. Oke, mari kita coba
00:03:38sesuatu yang lain. Saya akan meminta Claude menulis draf email dengan subjek "I love Claude" dan isi
00:03:44berupa puisi yang indah. Sekali lagi, ia menggunakan GWS CLI, menulis beberapa Python menggunakan bash. Dan setelah selesai,
00:03:50kita bisa melihat, saya punya draf email baru di sini yang ditulis oleh Claude. Biar saya perbesar sedikit. Isinya
00:03:56email dengan puisi yang mengatakan betapa saya mencintai Claude. Ada sesuatu yang sangat menarik tentang
00:04:00cara Claude menggunakan GWS CLI. Jika kita melihat perintah yang telah dilakukan sebelumnya,
00:04:05kita bisa melihat di sini ada banyak subperintah dan ada flag params dengan JSON di dalamnya.
00:04:11Yang menarik dari hal ini adalah jika saya, sebagai manusia, ingin melakukan hal yang sama
00:04:16dengan mengetikkan "gws help" untuk melihat semua subperintah, saya tidak mendapatkan semuanya. Hanya segelintir.
00:04:23Dan jika saya ingin mendalami perintah tertentu, saya harus menggunakan help untuk mendapatkan lebih banyak
00:04:28informasi tentangnya dan terus melakukannya berulang-ulang. Namun agen tersebut mampu mendapatkan
00:04:32informasi ini dengan sangat cepat. Dan bahkan mengetahui parameter yang tepat untuk mendapatkan data yang benar,
00:04:37maksud saya, lihat ini. Saya mengetik perintahnya di sini. Ia menggunakan help sekali dan mampu memahami
00:04:43semuanya hanya dari itu. Sekarang kita akan membahas lebih detail tentang bagaimana ia bisa melakukannya,
00:04:48tetapi kita bisa melihat di sini bahwa bagian bantuan CLI menguraikan penggunaan dan menyebutkan layanan,
00:04:53sumber daya, dan subsumber daya. Jadi kita bisa melihat layanan di bawah sini. Dan jika Anda ingin informasi lebih lanjut,
00:04:57kita juga bisa melihat skema gws dengan sumber daya layanan dan metodenya. Oke, mari kita coba satu
00:05:03hal lagi. Saya akan meminta Claude membuat dokumen slide baru dengan satu slide berisi
00:05:08judul "Claude cat" dan empat slide lainnya berisi gambar kucing. Sekali lagi, ia menggunakan gws CLI meminta
00:05:15bantuan, lalu menggali bantuan untuk perintah slide dan presentasi. Dan sekarang selesai membuat
00:05:20presentasi kita. Mari kita lihat di browser. Ini dia. Anda bisa melihat saya sudah pernah membuat
00:05:24percobaan dengan "Claude dogs", tapi mari kita coba yang ini. Dan kita punya judul "Claude cats" dengan subjudul,
00:05:30koleksi yang menggemaskan dengan lima slide berisi gambar kucing. Ini sangat keren. Dan kita
00:05:36hanya menggunakan 15% dari konteksnya. Jadi kita bisa terus melakukan berbagai hal yang berbeda. Seperti di sini,
00:05:42saya telah membuat dokumen Google Sheets berisi populasi setiap negara bagian AS dengan
00:05:47total di bagian bawah dan bahkan menjadwalkan acara di kalender saya. Sekarang Anda mungkin menyadari saya melakukan
00:05:52semua ini tanpa menginstal keahlian spesifik Google Workspace apa pun, tetapi proyek ini memang memiliki banyak
00:05:58keahlian yang tersedia berisi pembantu, persona, dan resep untuk tindakan yang lebih kompleks seperti memblokir
00:06:05waktu fokus dan menjadwalkan ulang rapat. Jadi bagaimana Justin membuatnya bekerja begitu baik? Pertama, dia
00:06:10memprioritaskan JSON bertingkat, yang sulit dibaca manusia, tetapi jauh lebih mudah bagi agen. Dia juga
00:06:16membuat dokumentasi yang dapat dikueri saat runtime, yang kita bahas tadi, tetapi bagian skema
00:06:21di sini membuatnya sehingga jika sesuatu diperbarui atau agen memasukkan parameter yang salah,
00:06:26ia tahu persis ke mana harus memeriksa yang benar tanpa kebingungan. Parameter
00:06:31atau bidang juga dapat digunakan untuk mengurangi jumlah informasi yang kembali dari API.
00:06:36Jadi agen dapat membatasi informasi hanya pada apa yang dibutuhkannya daripada mendapatkan informasi tambahan
00:06:42yang tidak diperlukannya, yang mengurangi jumlah token yang digunakan. Dan tentu saja ia menggunakan keahlian untuk
00:06:47panduan khusus agen, yang tidak saya gunakan dalam demo, tetapi mereka memberikan informasi lebih banyak daripada yang
00:06:53bisa didapatkan agen dengan menggunakan flag help. Jadi jelas bahwa server MCP mulai ditinggalkan, keahlian dan CLI mulai diminati,
00:06:59kan? Yah, tidak juga karena dengan MCP, agen dapat memanggil fungsi secara langsung alih-alih
00:07:06harus menyusun perintah shell dan meneruskan JSON, yang dilakukan oleh CLI. Alat MCP juga
00:07:11lebih baik untuk merantai langkah-langkah kompleks. Dan tentu saja Anda tidak memerlukan terminal untuk menjalankannya,
00:07:16itulah sebabnya Google Workspace CLI memang memiliki opsi MCP. Namun, CLI menggunakan jauh lebih sedikit token,
00:07:24bahkan dengan alat pencarian alat yang diaktifkan. Mereka portabel, artinya mereka dapat bekerja dengan agen
00:07:28harness apa pun atau tanpa agen harness, jika Anda tidak ingin menggunakannya. Dan mudah untuk mereproduksi
00:07:34perintah secara independen untuk debugging. Jadi saya rasa itu sangat tergantung pada kasus penggunaan Anda, tetapi saya memang mengalami
00:07:40beberapa masalah saat menggunakan CLI, seperti URL yang dihasilkan mengandung saltik, yang saya tidak tahu bagaimana
00:07:47itu bisa terjadi. Seluruh masalah pengalihan URL localhost port ini memakan waktu cukup lama bagi saya untuk dipahami. Saya tidak
00:07:52yakin apakah itu spesifik untuk alat Google Cloud atau hanya CLI-nya, tapi itu tidak menyenangkan. Dan saya sempat mengalami
00:07:59masalah dengan token yang tidak diperbarui dengan benar sehingga saya bahkan membuat masalah GitHub untuk itu. Yah,
00:08:05Claude yang menulisnya untuk saya. Sebenarnya saya tidak menulis apa pun, tetapi untuk proyek yang usianya
00:08:10kurang dari seminggu dengan lebih dari 10 ribu bintang di GitHub, proyek ini sudah memiliki masa depan yang menjanjikan.
00:08:16Dan berbicara tentang masa depan yang menjanjikan, jika Anda ingin membuat aplikasi Electron yang didukung oleh Bun,
00:08:21sehingga Anda mendapatkan kecepatan dan ukuran bundel yang kecil, lihat video yang saya buat
00:08:26tentang Electrobahn yang menunjukkan kepada Anda cara menggunakannya untuk proyek Vite sederhana.

Key Takeaway

gwscli adalah antarmuka baris perintah inovatif yang memungkinkan agen AI mengelola Google Workspace secara efisien dengan konsumsi token minimal dan kemampuan navigasi API yang dinamis.

Highlights

Google meluncurkan gwscli, alat CLI tangguh yang dirancang khusus agar agen AI dapat berinteraksi dengan seluruh API Google Workspace.

Alat ini memprioritaskan efisiensi token dengan menggunakan JSON bertingkat dan pembuatan perintah dinamis saat runtime.

Proses penyiapan melibatkan Google Cloud Console, gcloud CLI, dan konfigurasi OAuth yang cukup teknis terkait port localhost.

Agen AI seperti Claude Code dapat menggunakan gwscli untuk membaca email, membuat draf, menyusun slide presentasi, hingga mengelola Google Sheets.

gwscli menawarkan dokumentasi yang dapat dikueri (skema) sehingga agen dapat memperbaiki parameter secara mandiri jika terjadi kesalahan.

Meskipun mendukung MCP (Model Context Protocol), format CLI dianggap lebih portabel dan hemat biaya konteks untuk penggunaan tertentu.

Proyek ini mendapatkan popularitas luar biasa dengan meraih lebih dari 10.000 bintang di GitHub dalam waktu kurang dari satu minggu.

Timeline

Pengenalan gwscli untuk Agen AI

Video dimulai dengan pengenalan gwscli sebagai alat baru yang memungkinkan agen AI berinteraksi dengan file Drive, email, dan slide melalui API Google Workspace. Pembicara menekankan bahwa alat ini dibangun dari awal untuk mengoptimalkan penggunaan token dan mendukung pembuatan perintah secara runtime agar API selalu mutakhir. Muncul pertanyaan mengenai masa depan Model Context Protocol (MCP) karena perusahaan besar seperti Google kini beralih ke solusi CLI. Justin, pengembang di balik proyek ini, telah menyertakan lebih dari 100 keahlian yang dapat diunduh untuk memperluas fungsionalitas agen. Bagian ini memberikan konteks penting tentang mengapa integrasi langsung ke ekosistem Google Cloud sangat berharga bagi pengembang AI saat ini.

Prosedur Instalasi dan Konfigurasi yang Rumit

Pembicara menjelaskan langkah-langkah teknis untuk menyiapkan gwscli yang dimulai dengan akses ke Google Cloud Console dan instalasi gcloud CLI melalui Homebrew. Pengguna harus membuat proyek baru, mengonfigurasi kredensial OAuth, dan memilih ID klien untuk aplikasi web atau desktop. Bagian yang paling menantang adalah penanganan URI pengalihan di mana pengguna harus mencatat nomor port localhost yang spesifik agar autentikasi browser berhasil. Pembicara juga mengingatkan pentingnya menambahkan alamat email pengguna ke dalam daftar pengguna uji di layar persetujuan OAuth agar tidak terjadi error akses. Kesabaran diperlukan karena sinkronisasi URI pengalihan di server Google terkadang membutuhkan waktu beberapa saat sebelum status sukses muncul.

Demonstrasi Claude Mengelola Email dan Dokumen

Dalam demonstrasi praktis, Claude Code diminta untuk mengambil informasi dari 10 email terakhir menggunakan perintah gwscli. Hasilnya menunjukkan detail pengirim, subjek, dan label dengan hanya menghabiskan 9% dari jendela konteks AI karena efisiensi format CLI. Selanjutnya, Claude berhasil menulis draf email berisi puisi tentang dirinya sendiri melalui skrip Python yang dijalankan di terminal. Pembicara menyoroti keunikan agen AI yang mampu memahami parameter JSON yang kompleks dan subperintah tersembunyi jauh lebih cepat daripada manusia. Dokumentasi CLI yang dapat dikueri memungkinkan agen untuk melakukan eksplorasi mandiri terhadap layanan dan sumber daya API tanpa instruksi manual yang panjang.

Pembuatan Slide dan Penggunaan Keahlian Khusus

Eksperimen berlanjut dengan permintaan pembuatan presentasi Google Slides yang berisi gambar kucing secara otomatis. Claude menggunakan bantuan gwscli untuk menavigasi perintah presentasi dan berhasil menyusun lima slide dengan judul serta konten yang relevan dalam waktu singkat. Pembicara juga menyebutkan kemampuan untuk mengelola Google Sheets dan kalender, termasuk fitur canggih seperti penjadwalan ulang rapat melalui 'skills' atau keahlian yang tersedia. Justin merancang sistem ini untuk memprioritaskan JSON bertingkat yang memudahkan mesin memproses data meskipun sulit dibaca oleh mata manusia secara langsung. Penggunaan filter bidang dalam API membantu membatasi informasi yang kembali, sehingga secara drastis mengurangi biaya token yang harus dibayar pengguna.

Perbandingan CLI vs MCP dan Kesimpulan

Bagian akhir video membandingkan keunggulan antara format CLI dan server MCP konvensional dalam ekosistem AI. Meskipun MCP memungkinkan pemanggilan fungsi secara langsung tanpa perintah shell, CLI unggul dalam hal portabilitas, kemudahan debugging, dan efisiensi token yang lebih tinggi. Pembicara mengakui adanya beberapa kendala teknis seperti masalah pembaruan token dan kesalahan pada URL localhost yang sempat ia laporkan ke GitHub melalui bantuan Claude. Meskipun proyek ini masih sangat baru, pertumbuhan bintang di GitHub menunjukkan antusiasme komunitas yang besar terhadap alat otomatisasi ini. Video ditutup dengan rekomendasi untuk menonton konten lain mengenai pembuatan aplikasi Electron menggunakan Bun bagi mereka yang tertarik pada performa tinggi.

Community Posts

View all posts