Vercel Baru Saja Mengungkap Keunggulan Terbesar Claude Code

AAI LABS
Computing/SoftwareSmall Business/StartupsAdult EducationInternet Technology

Transcript

00:00:00Sejak model AI menjadi semakin canggih, banyak orang mulai membangun produk yang keren,
00:00:04mengintegrasikan model ke dalamnya, dan menyelesaikan banyak masalah bagi kita. Namun, sistem ini mengonsumsi banyak
00:00:09token, terutama jika Anda mengintegrasikannya menggunakan API. Solusi untuk masalah ini jauh lebih
00:00:15sederhana dari yang Anda duga. Arsitektur terbaik bukanlah pipeline yang rumit atau tuning skala besar,
00:00:20melainkan filosofi lama yang menjadi dasar sistem Unix, yaitu "segalanya adalah file".
00:00:25Saya tahu filosofi itu awalnya bukan tentang biaya model, melainkan tentang perangkat dan file. Namun,
00:00:30ternyata solusi untuk masalah biaya tinggi ini menggunakan prinsip yang persis sama. Inilah
00:00:35yang dibahas oleh seorang software engineer di Vercel. Sebelum kita cari tahu kenapa file adalah solusinya,
00:00:41mari kita pahami beberapa hal tentang cara kerja model-model ini. Model telah dilatih
00:00:46pada kode dalam jumlah yang sangat besar. Itulah alasan mengapa mereka sangat mahir memahami kode,
00:00:50struktur direktori, dan skrip bash asli yang digunakan developer untuk menavigasi file dan mencari
00:00:56apa yang mereka butuhkan. Saat sebuah agen menggunakan grep dan ls, ia tidak sedang melakukan sesuatu yang baru. Ia hanya
00:01:01melakukan apa yang sudah dikuasainya, namun dengan cara yang lebih terkontrol. Pendekatan ini tidak terbatas pada kode; agen
00:01:06bisa menavigasi direktori apa pun, baik berisi kode maupun tidak, karena mereka sudah terbiasa
00:01:11dengan perintah dan memahami sistem file. Setiap kali agen membutuhkan sesuatu, ia akan mencari di sistem file
00:01:17menggunakan perintah bash asli seperti ls dan find. Setelah agen menemukan file yang tepat melalui find,
00:01:23ia mencari konten yang relevan di dalam file tersebut menggunakan pencocokan pola dengan grep dan cat.
00:01:27Hanya potongan kecil informasi yang relevan yang dikirim ke model, sementara sisanya tetap berada di luar memori,
00:01:32sehingga context window tetap bersih. Ini berarti kita tidak membuang-buang token untuk data
00:01:36tidak relevan yang tidak dibutuhkan model. Dengan pendekatan ini, agen mengembalikan output yang terstruktur.
00:01:41Pola ini bekerja sangat baik sehingga Vercel akhirnya merilis alat bash sumber terbuka yang khusus dibuat
00:01:46berdasarkan prinsip ini, memberikan agen kemampuan untuk menjelajahi sistem file seperti yang dilakukan developer.
00:01:51Saat membangun sistem model bahasa besar, ada dua cara untuk memberikan informasi yang tepat
00:01:56kepada model, yaitu melalui sistem prompt yang mendetail dengan harapan agen akan mematuhinya,
00:02:00atau dengan memasukkan banyak data ke dalam basis data vektor dan menggunakan pencarian semantik untuk mengekstraknya.
00:02:06Namun setiap pendekatan memiliki keterbatasan. Sistem prompt memiliki batasan token window, yang membatasi
00:02:10jumlah informasi yang bisa kita kirim sekaligus. Untuk menangani kumpulan data yang lebih besar, kita menggunakan pencarian semantik,
00:02:15yang mencari informasi berdasarkan kesamaan makna terhadap kueri. Namun pencarian vektor digunakan untuk
00:02:20kemiripan semantik, bukan pencarian yang presisi. Ia mengembalikan potongan data yang cocok dengan konteks
00:02:25umum dari kueri, bukan nilai spesifik yang kita cari. Hal ini membuat model harus mengekstrak
00:02:30konten yang benar dari semua potongan tersebut sendiri. Namun, sistem file menawarkan pendekatan yang berbeda.
00:02:35Dengan sistem file, strukturnya benar-benar memetakan domain Anda. Anda sering memiliki hubungan
00:02:40antar file dalam struktur folder yang mencerminkan hubungan antar folder induknya.
00:02:45Dengan sistem file, Anda tidak perlu meratakan hubungan ini ke dalam potongan vektor yang dipahami model,
00:02:49yang membantu menghindari hilangnya hubungan yang biasanya hilang dalam pencarian semantik. Koneksi hierarkis
00:02:54ini tetap terjaga secara alami, mempertahankan logika organisasi yang sudah ada dalam data Anda.
00:02:59Keuntungan lainnya adalah pengambilan data yang presisi karena alat grep dan bash mengembalikan kecocokan yang tepat,
00:03:05berbeda dengan pencarian vektor yang mengembalikan semua potongan yang sekadar mirip dengan kueri dan menyerahkannya
00:03:10kepada model untuk diputuskan. Anda hanya mendapatkan nilai yang dibutuhkan. Konteksnya menjadi minimal
00:03:15saat agen menggunakan alat bash karena mereka menerima potongan spesifik yang dibutuhkan, tanpa memasukkan potongan
00:03:20lain ke dalam memori. Hal ini memungkinkan agen tetap fokus pada informasi yang tepat tanpa
00:03:25tersesat dalam data yang tidak terkait. Sebenarnya, ide ini bukanlah sesuatu yang asing bagi Anda.
00:03:30Konsep ini sudah digunakan di dalam Claude Code dan semua agen CLI, di mana mereka menggunakan fungsi bash untuk
00:03:36mempersempit temuan menggunakan pencocokan pola. Kami juga telah menggunakan sistem file dan
00:03:41kemampuan Claude Code untuk tujuan riset dari setiap ide yang kami evaluasi. Kami biasanya
00:03:46memasukkan alat perangkat lunak yang kami temukan ke dalam pipeline ini, yang berisi beberapa fase dengan
00:03:51kriteria evaluasi yang harus dilewati riset tersebut. Semua ini didefinisikan dalam file markdown
00:03:56yang berisi persyaratan dan tujuan dari alat yang kami uji, cara menulis dokumen akhir,
00:04:01serta semua informasi yang diperlukan untuk setiap fase. Kami juga memberikan beberapa dokumen sampel kepada Claude,
00:04:06yang berfungsi sebagai panduan gaya penulisan, dan dokumen akhirnya disimpan di folder hasil riset.
00:04:11Untuk memandu riset tersebut, kami memiliki file Claude.md yang menjelaskan cara memproses ide tersebut
00:04:17melewati setiap fase satu per satu, hingga akhirnya memberikan kami dokumen riset yang memenuhi semua standar.
00:04:22Setiap kali ada sesuatu yang perlu diriset, saya cukup membuka Claude dan memberitahunya ide atau alat yang ingin
00:04:27diriset. Claude kemudian menjalankannya melalui proses validasi enam fase, mulai dari memahami
00:04:32alat atau ide tersebut lalu memprosesnya melalui tiap fase satu per satu. Setelah ide tersebut melewati
00:04:37semua fase, Claude menghasilkan laporan akhir yang bisa kami baca untuk memverifikasi potensi ide tersebut.
00:04:42Pendekatan sistem file ini menghemat banyak waktu kami dengan mengotomatisasi proses riset yang biasanya
00:04:47harus dilakukan langkah demi langkah. Jika Anda ingin mencoba pipeline ini untuk kebutuhan Anda sendiri,
00:04:52Anda bisa mendapatkan templat siap pakai untuk membuat pipeline riset sendiri yang serupa dengan milik kami
00:04:57di komunitas yang baru kami luncurkan bernama AI Labs Pro. Untuk video ini dan semua
00:05:03video sebelumnya, Anda akan mendapatkan templat siap pakai, prompt, serta perintah dan skill yang bisa langsung
00:05:08Anda gunakan dalam proyek Anda. Jika Anda merasa konten kami bermanfaat dan ingin mendukung channel ini,
00:05:12ini adalah cara terbaik untuk melakukannya. Link ada di deskripsi. Saya sempat membaca studi kasus mereka
00:05:17yang menjelaskan cara membangun agen ringkasan penjualan menggunakan arsitektur ini.
00:05:22Mereka juga telah menjadikannya sumber terbuka, dan itu memberi saya ide menarik untuk dicoba sendiri.
00:05:27Saya sedang membangun proyek kebijakan perusahaan di mana saya memiliki banyak data perusahaan dalam
00:05:32format file JSON, Markdown, dan TXT, yang semuanya dipisahkan berdasarkan departemen. Biasanya, saya akan
00:05:39menerapkan sistem ini menggunakan database vektor seperti Chroma, tetapi saya memutuskan untuk mencoba alat ini. Saya
00:05:44kemudian menerapkan arsitektur ini. Di sisi backend, saya menyertakan path ke folder dokumen
00:05:49yang berisi data perusahaan dan memberikan agen akses ke perintah ls, cat, grep, dan find,
00:05:55berserta panduan cara menggunakan alat tersebut dan kapan harus menggunakan tiap perintah. Saya menggunakan model Gemini 1.5 Flash,
00:06:01memberikannya alat bash dari Vercel, dan memberikan path ke dokumen di dalam alat tersebut.
00:06:06Hasilnya, saat saya menguji agen dengan pertanyaan apa pun terkait data tersebut, ia memberikan
00:06:11jawaban berdasarkan konten yang tepat dari kebijakan perusahaan, termasuk buku panduan karyawan
00:06:16dan dokumen kebijakan cuti. Untuk memverifikasi cara kerjanya, saya memantau penggunaan alatnya di terminal.
00:06:21Agen tersebut pertama-tama menggunakan perintah ls untuk melihat dokumen apa saja yang tersedia, lalu menggunakan grep dengan
00:06:27pencocokan pola untuk mencari kata "hari libur" atau istilah serupa. Rangkaian perintah ini menangani kueri kami dan
00:06:32memberikan hasil dengan tingkat akurasi yang sama dengan sistem RAG. Jika Anda ingin kode sumber untuk
00:06:38proyek ini, Anda bisa menemukannya di komunitas kami untuk diunduh dan dicoba sendiri.
00:06:43Pertanyaan pertama yang muncul di benak saya saat mempelajari alat ini adalah,
00:06:47apakah benar-benar aman memberikan kemampuan kepada agen untuk mengeksekusi perintah di server? Kita baru saja
00:06:52melihat kerentanan pada React Server Components Desember lalu, yang mendapat skor 10.0, tertinggi pada skalanya,
00:06:57dan itu melibatkan eksekusi kode di server. Jadi ini adalah kemampuan yang sangat kuat dan berpotensi berbahaya bagi agen.
00:07:03Lalu mengapa saya memercayai alat ini? Karena alat ini berjalan di sandbox dan memiliki isolasi.
00:07:08Ia hanya mengakses direktori spesifik yang kita berikan dan tidak mengubah hal lainnya. Dalam artikelnya,
00:07:14mereka juga menyebutkan bahwa agen menjelajahi file tanpa akses ke sistem produksi, sehingga kode produksi Anda
00:07:19tetap aman meskipun agen mencoba menjalankan perintah berbahaya di server. Ada dua jenis isolasi yang disediakan.
00:07:24Yang pertama adalah lingkungan in-memory. Dalam pengaturan ini, ia hanya menggunakan alat bash yang menjalankan
00:07:29skrip bash terbatas pada file yang diberi akses, persis seperti yang kami lakukan saat membuat agen kami.
00:07:35Jenis kedua adalah lingkungan sandbox yang sepenuhnya kompatibel, menawarkan isolasi mesin virtual penuh
00:07:40menggunakan Vercel Sandbox. Kita bisa memilih salah satunya sesuai kebutuhan kita.
00:07:46Pendekatan in-memory lebih ringan dan cepat untuk kasus penggunaan sederhana, sedangkan isolasi VM penuh lebih baik
00:07:51saat Anda membutuhkan jaminan keamanan yang lebih kuat. Meskipun pendekatan ini sangat bagus untuk menghemat biaya per pemanggilan model,
00:07:56ini bukanlah solusi yang tepat untuk semua jenis masalah. Metode ini tidak ideal jika Anda perlu mencocokkan
00:08:01makna kata karena alat bash digunakan untuk pencocokan yang tepat (exact matching). Seperti yang kita lihat saat memanggil agen,
00:08:06ia menggunakan kata kunci spesifik untuk menemukan data yang diperlukan. Ini juga tidak cocok untuk struktur file yang tidak teratur
00:08:11di mana agen harus bersusah payah dengan banyak pemanggilan alat. Struktur yang mudah dinavigasi oleh agen akan jauh lebih baik.
00:08:17Saran pribadi saya adalah gunakan alat bash saat Anda memiliki data yang sangat terstruktur dan permintaan Anda
00:08:22sebagian besar sudah jelas tujuannya. Gunakan RAG jika Anda lebih peduli pada makna dari apa yang tertulis
00:08:27di dalam file atau saat kueri Anda cenderung tidak beraturan. Sebelum kita akhiri, ada pesan singkat dari
00:08:32sponsor kita, Brilliant. Engineer terbaik tidak hanya tahu sintaksis, mereka mampu memecahkan masalah dari
00:08:37prinsip dasar. Itulah alasan kami bermitra dengan Brilliant. Filosofi mereka adalah Anda belajar paling baik
00:08:42dengan cara praktik langsung. Mereka memprioritaskan penyelesaian masalah secara aktif agar Anda terbiasa dengan konsepnya
00:08:47daripada sekadar menghafal. Misalnya, dalam kursus mereka yang berjudul "How AI Works", Anda tidak hanya membaca,
00:08:52tetapi memanipulasi logika yang sebenarnya. Anda akan mempraktikkan hal teknis seperti menghitung loss di loss space
00:08:57dan memvisualisasikan interpolasi, membangun intuisi mendalam yang tidak bisa didapatkan hanya dari video ceramah.
00:09:02Melalui kursus teknis interaktif mereka, Anda mendapatkan cara paling efektif untuk benar-benar menguasai konsep
00:09:07yang kami bicarakan. Anda juga akan mendapatkan diskon 20% untuk langganan tahunan premium, yang membuka seluruh katalog
00:09:12kursus matematika, data, dan ilmu komputer untuk membantu peningkatan skill Anda. Klik link di deskripsi
00:09:17atau pindai kode QR di layar untuk mendapatkan uji coba gratis selama 30 hari. Kita telah sampai di penghujung
00:09:22video ini. Jika Anda ingin mendukung channel ini dan membantu kami terus membuat video seperti ini,
00:09:28Anda bisa melakukannya melalui tombol Super Thanks di bawah. Seperti biasa, terima kasih telah menonton dan sampai jumpa di video berikutnya.
00:09:32do so by using the super thanks button below. As always, thank you for watching and I'll see you in the next one.

Key Takeaway

Vercel memperkenalkan arsitektur berbasis sistem file dan alat bash untuk agen AI guna meningkatkan presisi pengambilan data, menjaga integritas hierarki informasi, dan secara signifikan mengurangi biaya operasional dibandingkan metode database vektor tradisional.

Highlights

Filosofi "segalanya adalah file" dari Unix diterapkan untuk mengatasi tingginya biaya token pada model AI.

Vercel merilis alat bash sumber terbuka yang memungkinkan agen AI menavigasi sistem file menggunakan perintah asli seperti ls

Timeline

Masalah Biaya API dan Filosofi Unix

Video dimulai dengan menyoroti masalah utama dalam pengembangan produk AI, yaitu konsumsi token yang sangat tinggi saat menggunakan API. Pembicara menjelaskan bahwa solusi untuk biaya mahal ini sebenarnya sangat sederhana dan berakar pada filosofi lama sistem Unix, yakni "segalanya adalah file". Arsitektur ini dianggap lebih unggul daripada pipeline yang rumit atau tuning model dalam skala besar. Filosofi ini awalnya ditujukan untuk perangkat keras, namun kini menjadi kunci efisiensi model bahasa besar. Vercel melihat potensi besar dalam menerapkan prinsip dasar ini untuk mengoptimalkan interaksi agen AI dengan data.

Cara Kerja Agen AI dengan Sistem File

Bagian ini menjelaskan bahwa model AI sangat mahir memahami kode karena telah dilatih pada dataset pemrograman yang masif. Saat agen menggunakan perintah bash asli seperti ls, grep, dan find, mereka sebenarnya beroperasi dalam lingkungan yang sudah sangat mereka kuasai. Dengan menggunakan perintah tersebut, agen hanya mengambil potongan informasi yang paling relevan untuk dikirim ke model, sehingga context window tetap bersih. Hal ini mencegah pemborosan token pada data tidak relevan yang tidak dibutuhkan untuk menjawab kueri. Vercel akhirnya merilis alat bash sumber terbuka untuk mendukung metode navigasi sistem file yang mirip dengan cara kerja developer manusia.

Keunggulan Sistem File vs Database Vektor

Pembicara membandingkan penggunaan sistem file dengan metode tradisional seperti sistem prompt mendetail atau database vektor (RAG). Meskipun pencarian semantik berguna untuk kemiripan makna, ia sering kali kurang presisi dan gagal mempertahankan hubungan hierarkis antar data. Sistem file memungkinkan struktur data memetakan domain secara langsung, sehingga logika organisasi tetap terjaga secara alami tanpa perlu meratakan data menjadi potongan vektor. Keuntungan utamanya adalah pengambilan data yang sangat presisi karena alat seperti grep memberikan kecocokan yang tepat (exact matching). Pendekatan ini memastikan agen tetap fokus pada informasi spesifik tanpa tersesat dalam data yang tidak terkait.

Implementasi Praktis pada Claude Code dan Riset

Konsep sistem file ini sudah diterapkan secara nyata di dalam Claude Code dan berbagai agen CLI untuk mempersempit pencarian informasi. Pembicara membagikan cara mereka menggunakan pipeline riset enam fase yang diatur melalui file Markdown dan Claude.md. Proses ini mengotomatisasi evaluasi ide, mulai dari pemahaman konsep hingga pembuatan laporan akhir yang memenuhi standar kualitas tertentu. Penggunaan alat ini diklaim mampu menghemat banyak waktu yang biasanya dihabiskan untuk riset manual langkah demi langkah. Penonton juga diajak untuk mencoba templat pipeline riset ini melalui komunitas AI Labs Pro yang baru diluncurkan.

Studi Kasus: Kebijakan Perusahaan dan Gemini 1.5 Flash

Dalam segmen ini, pembicara mendemonstrasikan penerapan arsitektur tersebut pada proyek kebijakan perusahaan yang menggunakan berbagai format file seperti JSON, Markdown, dan TXT. Alih-alih menggunakan database vektor seperti Chroma, ia menggunakan model Gemini 1.5 Flash yang dipadukan dengan alat bash dari Vercel. Agen tersebut berhasil memberikan jawaban akurat mengenai buku panduan karyawan dan kebijakan cuti dengan menavigasi direktori menggunakan perintah ls dan grep. Pemantauan terminal menunjukkan bahwa agen secara mandiri mencari pola kata kunci spesifik untuk menemukan jawaban. Hasil akhirnya menunjukkan tingkat akurasi yang setara dengan sistem RAG namun dengan proses yang lebih ramping.

Keamanan, Sandbox, dan Batasan Arsitektur

Bagian terakhir membahas aspek keamanan yang krusial saat memberikan akses perintah server kepada agen AI. Mengingat adanya risiko eksekusi kode berbahaya, alat ini dirancang untuk berjalan dalam lingkungan sandbox atau isolasi mesin virtual (VM) penuh melalui Vercel Sandbox. Meskipun sangat efisien untuk data terstruktur dan permintaan yang jelas, metode ini diakui tidak cocok untuk pencarian berbasis makna atau struktur file yang berantakan. Pembicara menyarankan penggunaan RAG jika kueri pengguna bersifat tidak beraturan dan memerlukan pemahaman semantik yang mendalam. Video ditutup dengan rekomendasi belajar di platform Brilliant dan ajakan untuk mendukung channel melalui fitur Super Thanks.

Community Posts

View all posts