Transcript

00:00:00Kini setelah agen AI menjadi semakin berguna dan semakin populer, setidaknya
00:00:05untuk beberapa tugas, saya rasa sangat menarik melihat bagaimana kita seolah kembali ke titik awal.
00:00:11Begini maksud saya. Jika kita melihat sejarah komputer dan internet
00:00:16secara keseluruhan, kita mungkin bisa menggambar grafik kemudahan penggunaan yang tampak seperti ini.
00:00:23Tentu saja ini hanya rekaan, tapi Anda pasti paham poin saya. Kita mulai di tahun 1970-an
00:00:30atau sekitar masa itu โ€“ jangan terlalu terpaku pada tahun pastinya โ€“ tapi di masa
00:00:36awal ketika Anda dan saya โ€“ yah, saya bahkan belum lahir โ€“ tapi ketika rumah tangga biasa belum
00:00:41punya komputer, berinteraksi dengan komputer sebagian besar hanya melalui teks lewat terminal,
00:00:47intinya melalui baris perintah (command-line). Dan antarmuka grafis yang kaya serta situs web
00:00:54yang canggih โ€“ sistem operasi yang dibuat untuk pengguna biasa โ€“ itu baru
00:01:01mulai ada sekitar tahun 90-an, 2000-an dan tentu saja terus berevolusi hingga hari ini.
00:01:09Ini masih terus berevolusi, jangan salah paham, saya tidak bilang semua ini akan
00:01:14hilang, tapi satu hal yang terlihat jelas adalah bahwa dengan adanya agen AI,
00:01:22terdapat tren kuat kembali ke input khusus teks, antarmuka terminal, alat CLI, markdown,
00:01:31JSON, dan semua hal dasar itu. Dan maksud saya bukan sekadar kita punya alat seperti
00:01:37Claude Code yang tidak benar-benar memiliki antarmuka grafis โ€“ meski ada
00:01:43aplikasi desktopnya tapi utamanya digunakan sebagai alat baris perintah โ€“ bukan itu saja maksud saya.
00:01:48Sebaliknya, maksud saya adalah semua agen AI ini, alat-alat agenik ini โ€“ apa pun sebutannya โ€“
00:01:54sangat mahir berinteraksi dengan alat baris perintah lainnya, program lain yang
00:02:02bisa mereka panggil via baris perintah, mereka butuh teks sederhana, teks terformat seperti markdown,
00:02:09di situlah mereka benar-benar bersinar. Itulah mengapa semakin banyak perusahaan โ€“ seperti
00:02:15beberapa jam lalu saat saya merekam ini, Google merilis semakin banyak alat baris perintah.
00:02:21Google merilis Google Workspace CLI. Percaya atau tidak, itu tidak ada
00:02:27sampai sekarang, dan ini alat yang bisa digunakan untuk berinteraksi dengan layanan Google Workspace seperti Gmail,
00:02:35Google Drive, melalui CLI resmi. Sebenarnya sudah ada solusi lain โ€“ seperti
00:02:41GOG CLI karya Peter Steinberger, pembuat OpenClaw โ€“ dia membuatnya karena
00:02:48dia ingin cara berbasis CLI yang programatik untuk berinteraksi dengan layanan Google dan itu belum ada
00:02:54sampai beberapa jam yang lalu, tapi sekarang sudah ada. Dan ini bukan video bersponsor oleh Google
00:02:59atau semacamnya, hanya menarik melihat semakin banyak perusahaan penyedia
00:03:04layanan yang merilis alat seperti ini. Server MCP mungkin adalah hal yang serupa,
00:03:11meski menurut saya MCP punya berbagai kekurangan dan saya sangat yakin kita akan melihat alat CLI
00:03:18dan API โ€“ dan pada akhirnya alat CLI hanyalah pembungkus API โ€“ di masa depan sebagai cara utama
00:03:27menggunakan layanan melalui alat agenik. Dan inilah contoh nyata dari maksud saya.
00:03:32Selama beberapa hari dan minggu terakhir, saya mencoba-coba agen PyCoding.
00:03:37Agen PyCoding ini, bisa dibilang, adalah alternatif dari Codeium atau Claude Code. Ini lebih simpel dalam arti positif,
00:03:46fiturnya lebih terbatas tapi sangat ampuh dan Anda bisa menggunakannya dengan langganan Codeium misalnya.
00:03:51Video ini bukan utamanya tentang agen ini dan tidak masalah apakah Anda memakai ini
00:03:57atau Claude atau Cursor atau apa pun, semuanya bisa membantu Anda. Tapi saya juga sangat suka alat ini
00:04:01dan yang terpenting, sama seperti Claude Code dan Codeium, Anda juga bisa menggunakan
00:04:07alat ini untuk tugas non-coding terlepas dari namanya. Contohnya, sebenarnya agen Py inilah
00:04:13pusat logika dari OpenClaw bisa dibilang begitu.
00:04:19Lalu OpenClaw tentu saja menambahkan lebih banyak hal seperti memori dan saluran seperti
00:04:24Telegram serta WhatsApp dan semua hal seru lainnya. Tapi ini adalah salah satu alat
00:04:30agenik yang bisa Anda jalankan di sistem Anda untuk melakukan sesuatu. Anda juga bisa
00:04:35membangun agen Anda sendiri tentunya. Dan saya punya kursus tentang itu di mana saya juga membahas
00:04:40bagaimana agen AI sebenarnya bekerja dan apa bedanya dengan alur kerja (workflow), karena sering kali
00:04:44Anda mungkin hanya butuh alur kerja dan bukan agen sungguhan. Saya punya kursus jika Anda ingin mendalaminya.
00:04:49Saya juga punya kursus tentang Claude Code dan Codeium jika ingin mempelajari lebih lanjut
00:04:54tentang alat-alat ini. Namun apa pun alat yang Anda gunakan, yang sangat menarik dan jelas
00:04:58terlihat adalah betapa baiknya mereka berinteraksi dengan alat CLI lainnya. Hal ini sangat masuk akal
00:05:03karena mereka sudah melihat banyak pekerjaan CLI menggunakan alat seperti curl, seperti
00:05:10perintah baris perintah seperti cd, ls, Anda tahu semua perintah Linux itu. Mereka sudah banyak melihat itu
00:05:16di data pelatihannya. Dan mereka tidak hanya melihat perintah standar Linux yang
00:05:21tentu saja mereka hafal di luar kepala. Tapi yang terpenting, mereka melihat cara menggunakan alat tersebut.
00:05:28Cara merangkai alat CLI bersama-sama. Cara mengalirkan (piping) hasil dari satu alat ke alat lainnya.
00:05:35Mereka melihat semua itu dan sangat ahli di sana. Mereka juga tahu bahwa mereka bisa memakai --help
00:05:41untuk mempelajari lebih lanjut tentang sebuah alat. Dan itu membuat mereka dalam posisi yang bagus untuk
00:05:47menggunakan alat baru juga. Alat yang belum pernah mereka lihat di data pelatihan seperti Google Workspace CLI baru ini.
00:05:52Tentu saja jika Anda ingin menggunakan itu melalui agen, ia tidak melihatnya di data pelatihan.
00:05:57Ia tidak tahu cara menggunakannya. Tapi jika Anda mengarahkannya, mungkin memberinya tautan
00:06:01ke dokumentasi resmi, bahkan jika tidak dilakukan, ia kemungkinan besar akan bisa mencari tahu
00:06:05cara menggunakannya dengan memakai --help dan mulai dari sana. Karena itu hanyalah alat CLI biasa.
00:06:11Dan model bahasa besar pada akhirnya sangat ahli dalam memahami, mendeskripsikan, dan
00:06:17menggunakan alat-alat CLI ini.
00:06:20Contohnya tempo hari, kemarin tepatnya, saya punya masalah kecil. Saya harus mengunggah
00:06:26dokumen PDF ke sebuah situs web. Dan Anda tahu situs-situs yang minta Anda unggah banyak dokumen
00:06:32sekaligus dalam satu file dan ukuran filenya tidak boleh lebih dari 5 megabyte? Ya,
00:06:38saya sedang di salah satu situs itu. Dan tentu saja saya harus mengompres dokumen PDF tersebut.
00:06:43Saya bisa saja mencari situs web yang bisa melakukannya untuk saya. Tapi saya bukan penggemar berat
00:06:49mengunggah data saya ke situs web sembarangan. Jadi ya, saya ragu. Saya juga bisa mengecek
00:06:55apakah ada alat di sistem saya yang bisa membantu. Tapi saya sudah tidak punya langganan Adobe
00:07:01lagi, jadi itu akan butuh riset. Dan mungkin pada akhirnya saya akan tetap mengunggahnya
00:07:07ke situs yang meragukan. Nah, tidak dengan AI. Tentu saja, saya bisa saja memakai Codeium atau Claude
00:07:13atau Cursor atau apa pun untuk membuat alat konversi/kompresi kecil. Itu mungkin saja
00:07:19berhasil juga. Tapi yang saya lakukan, saya jalankan agen Py yang saya gunakan dengan
00:07:26langganan Codeium saya. Dan saya hanya memintanya melihat file PDF itu dan tolong kompres
00:07:33sambil tetap menjaga kualitasnya sebisa mungkin.
00:07:36Hanya itu. Itulah satu-satunya perintah saya. Dan ia mulai bekerja, menjalankan
00:07:41serangkaian perintah di baris perintah, menjalankan beberapa skrip kecil. Dan omong-omong, saya
00:07:46menjalankan ini di sistem saya, tapi saya memasang ekstensi pembatas (guardrails). PI atau Py
00:07:53punya konsep ekstensi yang bisa dipasang. Jadi saya memasang ekstensi yang mencegah
00:07:59agen tersebut menghapus isi hard drive saya, setidaknya dengan cara yang langsung. Dan saya juga
00:08:06mengawasinya dengan cermat saat ia menjelaskan apa yang akan dilakukannya. Jadi saya biarkan ia beraksi
00:08:11dan ia menjalankan banyak hal di sini. Dan akhirnya selesai. Dan benar saja, ia berhasil
00:08:18mengompres dokumen ini dan ukurannya jadi jauh lebih kecil. Itu mungkin contoh sederhana saja.
00:08:25Dan ada alternatif lain. Poin saya adalah ia melakukan itu semua di baris perintah,
00:08:29di terminal pada akhirnya dengan menggunakan perintah dan program kita di sana. Dan tentu saja,
00:08:36semua itu masuk akal karena kita bicara tentang program yang menggunakan komputer. Dan
00:08:41semua antarmuka grafis dan situs web yang canggih itu dibangun untuk manusia, untuk Anda dan
00:08:46saya. Dan itu tidak akan hilang tentu saja. Tapi jika kita ingin punya alat utilitas kecil, agen AI
00:08:53yang berjalan di sistem kita yang setidaknya bisa melakukan beberapa tugas yang kita kerjakan sekarang, maka
00:08:59kita perlu memberi mereka cara menggunakan komputer dengan lebih efisien. Karena
00:09:03antarmuka grafis, aplikasi, atau situs web yang dibuat untuk manusia bukanlah cara ideal bagi program komputer
00:09:09tentu saja. Ia harus mengambil tangkapan layar, mencari tahu di mana letak tombolnya,
00:09:13menggerakkan mouse ke tombol, mengeklik tombol itu, mengambil tangkapan layar lagi untuk melihat apa isi
00:09:18halaman barunya. Itu sangat tidak efisien, membuang banyak token, dan memakan waktu lama. Maksud saya,
00:09:24itulah mengapa kita punya konsep API jauh sebelum kedatangan agen AI dan model bahasa
00:09:31besar. Karena jika kita menulis program, tidak peduli itu situs web atau aplikasi.
00:09:37Jika kita menulis program dan ingin berinteraksi dengan program lain, dengan layanan lain,
00:09:43tentu saja di masa lalu kita sudah menggunakan API dan tidak mencoba menulis skrip yang menggunakan
00:09:49situs web yang ditujukan untuk manusia. Itulah mengapa API ada, dan CLI, program baris
00:09:56perintah, pada akhirnya hanyalah pembungkus API, setidaknya dalam kasus CLI seperti
00:10:03Google Workspace CLI. Tapi itulah jenis program yang kita butuhkan dan inginkan untuk digunakan
00:10:10oleh agen karena ia tidak peduli pada tombol-tombol cantik atau semacamnya. Ia ingin
00:10:15cara sederhana untuk memanggil berbagai perintah untuk menyelesaikan tugas. Dan itulah mengapa ini
00:10:22masuk akal. Itulah juga mengapa markdown menjadi lebih penting sekarang dari sebelumnya dan mengapa
00:10:28kebanyakan halaman dokumentasi sudah menawarkan tombol salin seperti ini, yang memudahkan
00:10:32untuk menyalin konten sebagai markdown sehingga Anda bisa menempelnya ke model bahasa besar
00:10:38favorit Anda atau sesi chat atau alat coding. Mengapa beberapa situs web juga mendukung penambahan .md di akhir
00:10:46URL untuk mendapatkan artikel ini dalam format markdown karena kita menuju masa depan di mana
00:10:52setidaknya beberapa layanan dan konten akan utamanya ditujukan untuk dikonsumsi oleh agen.
00:10:58Maksud saya, ambil contoh dokumentasi sebuah pustaka atau kerangka kerja seperti TanStack Start. Jika Anda
00:11:03membangun situs TanStack Start hari ini, dan tentu saja tidak masalah tumpukan teknologi apa pun
00:11:09yang Anda pakai, Anda paham maksud saya, maka Anda kemungkinan besar akan melakukannya dengan bantuan agen coding, cursor,
00:11:15atau apa pun. Dan jika Anda ingin memberi tahu agen tersebut cara menggunakan pustakanya, jika Anda ingin
00:11:20mengarahkan mereka ke artikel dokumentasi tertentu, Anda tidak ingin mengarahkan mereka ke situs web seperti
00:11:25ini. Anda tidak ingin mereka mengunduh kode HTML, yang membuang banyak token secara cuma-cuma.
00:11:32Dan itulah alasan yang sama mengapa alat CLI menjadi semakin
00:11:38penting karena kita bergerak menuju masa depan di mana setidaknya beberapa tugas
00:11:42akan dilakukan dengan bantuan agen AI atau secara eksklusif oleh agen AI. Yang tentu saja juga
00:11:49berarti jika Anda membangun semacam layanan yang tidak utamanya ditujukan untuk
00:11:54dikonsumsi manusia, Anda harus sangat mempertimbangkan untuk membangun CLI serta menawarkan
00:12:02API dan apa pun yang diperlukan agar di masa depan, orang bisa menggunakan layanan Anda melalui agen.
00:12:09Dan tentu saja, kita masih sangat awal di sini. Mayoritas orang tidak peduli tentang
00:12:14agen sama sekali. Dan masih terlalu dini untuk mengatakan seberapa hebat agen AI nantinya dan jenis
00:12:20tugas apa yang bisa mereka tangani di masa depan. Mungkin kita agak terjebak di level saat ini
00:12:26di mana mereka bisa melakukan beberapa hal, tapi jelas tidak semuanya dan masih butuh pengawasan manusia.
00:12:31Tapi bahkan dalam kondisi itu pun, ada tugas-tugas yang bisa dilakukan oleh agen dan Anda bisa
00:12:37membuatnya lebih berguna dan lebih kuat dengan memberinya alat yang tepat yang memudahkan
00:12:42agen berinteraksi dengan layanan kita, dengan situs web, dan sebagainya. Itulah mengapa kita seolah
00:12:49kembali ke awal. Jelas, itu tidak berarti bahwa antarmuka grafis
00:12:55dan situs web akan hilang dan mungkin akan selalu ada aplikasi atau situs web yang
00:13:01ditujukan untuk dikonsumsi manusia yang tidak masuk akal jika dikonsumsi oleh agen. Maksud saya,
00:13:07sesuatu seperti Netflix. Saya tidak melihat keuntungan besar jika sebuah agen memberi tahu saya isi
00:13:13film tertentu. Saya rasa saya ingin menontonnya sendiri. Tapi untuk banyak layanan, terutama di bisnis
00:13:21SaaS atau di area layanan profesional, itu jelas merupakan jalan ke depan. Saya rasa
00:13:28ini jelas masih hari-hari awal, tapi sudah merupakan perkembangan yang jelas bisa kita lihat di sini. Setidaknya
00:13:34itulah pendapat saya. Tapi seperti biasa, saya ingin tahu apa pendapat Anda juga. Jadi tolong bagikan.
00:13:39Beri tahu saya pendapat Anda, apa yang mungkin saya lupakan atau lewatkan. Dan ya, mari
00:13:44kita lihat bagaimana dunia alat CLI dalam satu atau dua tahun ke depan.

Key Takeaway

Evolusi teknologi saat ini menunjukkan tren kembali ke antarmuka baris perintah (CLI) karena agen AI jauh lebih efisien dalam berinteraksi dengan teks dan API dibandingkan dengan antarmuka grafis yang dirancang untuk manusia.

Highlights

Munculnya tren kembali ke antarmuka berbasis teks (CLI) karena efisiensi bagi agen AI.

Agen AI lebih mahir memproses Markdown, JSON, dan perintah terminal dibandingkan antarmuka grafis (GUI).

Perusahaan besar seperti Google mulai merilis alat CLI khusus (seperti Google Workspace CLI) untuk mendukung ekosistem agenik.

Kemampuan Large Language Models (LLM) untuk memahami dokumentasi secara mandiri melalui perintah --help.

Pentingnya menyediakan API dan CLI bagi pengembang layanan agar produk mereka dapat dikonsumsi oleh AI di masa depan.

Penggunaan agen AI (seperti PyCoding) untuk tugas praktis sehari-hari seperti kompresi PDF secara lokal dan aman.

Timeline

Kembalinya Era Command-Line (CLI)

Pembicara menjelaskan sejarah penggunaan komputer yang dimulai dari terminal berbasis teks pada tahun 1970-an sebelum beralih ke antarmuka grafis (GUI) yang canggih. Meskipun GUI terus berevolusi, kehadiran agen AI memicu tren untuk kembali ke input teks, alat CLI, dan format data sederhana seperti Markdown atau JSON. Agen AI dianggap sangat bersinar saat berinteraksi dengan program yang dapat dipanggil melalui baris perintah karena efisiensi pemrosesan informasinya. Fenomena ini dianggap menarik karena seolah-olah perkembangan teknologi kembali ke titik awal demi mengakomodasi kebutuhan kecerdasan buatan. Hal ini menandai pergeseran fokus dari desain yang berpusat pada manusia menuju desain yang ramah bagi mesin.

Respons Perusahaan dan Google Workspace CLI

Google baru saja merilis Google Workspace CLI yang memungkinkan interaksi programatik dengan layanan seperti Gmail dan Google Drive melalui terminal. Sebelumnya, pengguna harus mengandalkan solusi pihak ketiga seperti GOG CLI untuk melakukan tugas-tugas berbasis baris perintah pada ekosistem Google. Rilis resmi ini menunjukkan bahwa perusahaan besar mulai menyadari pentingnya menyediakan alat yang mudah diakses oleh agen AI. Pembicara memprediksi bahwa CLI dan API akan menjadi cara utama bagi alat agenik untuk menggunakan layanan di masa depan. Bagian ini menekankan bahwa CLI pada dasarnya adalah pembungkus API yang sangat efektif untuk otomatisasi tingkat lanjut.

Demonstrasi Agen PyCoding dan Keunggulan CLI

Pembicara berbagi pengalamannya menggunakan agen PyCoding sebagai alternatif untuk alat seperti Claude Code atau Cursor. Agen AI ini sangat ahli dalam merangkai berbagai alat CLI Linux standar seperti curl, cd, dan ls karena data pelatihannya yang melimpah. Salah satu kemampuan unik agen AI adalah kemampuannya menggunakan perintah --help untuk mempelajari alat baru yang bahkan tidak ada dalam data pelatihan aslinya. Hal ini memberikan fleksibilitas tinggi bagi agen untuk beradaptasi dengan alat baru seperti Google Workspace CLI melalui dokumentasi. Kemampuan memahami dan mendeskripsikan alat CLI menjadikan LLM sebagai operator sistem yang sangat kompeten dan mandiri.

Studi Kasus: Kompresi PDF Lokal dengan AI

Dalam sebuah contoh nyata, pembicara menggunakan agen AI untuk mengompres file PDF berukuran besar tanpa harus mengunggahnya ke situs web pihak ketiga yang meragukan. Dengan menggunakan agen Py yang terhubung ke langganan Codeium, ia memberikan instruksi sederhana untuk memperkecil ukuran file sambil menjaga kualitas. Agen tersebut secara otomatis menjalankan serangkaian skrip dan perintah terminal di sistem lokal untuk menyelesaikan tugas tersebut. Untuk keamanan, pembicara menggunakan sistem guardrails atau pembatas guna mencegah agen melakukan tindakan berbahaya seperti menghapus data di hard drive. Hasilnya, dokumen berhasil dikompresi dengan efisien di bawah pengawasan manusia, membuktikan kekuatan alat berbasis terminal.

Efisiensi Programatik vs. Antarmuka Manusia

Antarmuka grafis dan situs web modern dirancang khusus untuk kenyamanan visual manusia, namun sangat tidak efisien bagi program komputer atau agen AI. Jika agen harus mengambil tangkapan layar dan mencari posisi tombol secara visual, hal itu akan membuang banyak token dan waktu pemrosesan. Oleh karena itu, penggunaan API dan CLI menjadi solusi ideal karena memberikan cara langsung dan sederhana bagi mesin untuk berkomunikasi. Tren penggunaan Markdown juga semakin meningkat karena memudahkan proses penyalinan konten dokumentasi ke dalam model bahasa besar. Masa depan menunjukkan bahwa layanan dan konten akan mulai dioptimalkan untuk dikonsumsi oleh agen, bukan hanya manusia.

Membangun Masa Depan yang Ramah Agen AI

Bagi pengembang layanan SaaS atau profesional, sangat disarankan untuk mulai membangun CLI dan API agar layanan mereka dapat digunakan oleh agen AI di masa depan. Meskipun saat ini agen AI masih membutuhkan pengawasan manusia dan belum bisa menangani semua tugas, arah perkembangannya sudah sangat jelas. Tidak semua layanan akan beralih ke model ini, contohnya layanan hiburan seperti Netflix yang tetap membutuhkan keterlibatan manusia secara langsung. Namun, untuk alat produktivitas dan utilitas, integrasi dengan agen AI melalui baris perintah adalah langkah strategis yang krusial. Pembicara menutup dengan ajakan untuk memantau perkembangan ekosistem CLI dalam beberapa tahun ke depan seiring semakin matangnya teknologi agenik.

Community Posts

View all posts