00:00:00Sejak model AI menjadi semakin canggih, banyak orang mulai membangun produk yang keren,
00:00:04mengintegrasikan model ke dalamnya, dan menyelesaikan banyak masalah bagi kita. Namun, sistem ini mengonsumsi banyak
00:00:09token, terutama jika Anda mengintegrasikannya menggunakan API. Solusi untuk masalah ini jauh lebih
00:00:15sederhana dari yang Anda duga. Arsitektur terbaik bukanlah pipeline yang rumit atau tuning skala besar,
00:00:20melainkan filosofi lama yang menjadi dasar sistem Unix, yaitu "segalanya adalah file".
00:00:25Saya tahu filosofi itu awalnya bukan tentang biaya model, melainkan tentang perangkat dan file. Namun,
00:00:30ternyata solusi untuk masalah biaya tinggi ini menggunakan prinsip yang persis sama. Inilah
00:00:35yang dibahas oleh seorang software engineer di Vercel. Sebelum kita cari tahu kenapa file adalah solusinya,
00:00:41mari kita pahami beberapa hal tentang cara kerja model-model ini. Model telah dilatih
00:00:46pada kode dalam jumlah yang sangat besar. Itulah alasan mengapa mereka sangat mahir memahami kode,
00:00:50struktur direktori, dan skrip bash asli yang digunakan developer untuk menavigasi file dan mencari
00:00:56apa yang mereka butuhkan. Saat sebuah agen menggunakan grep dan ls, ia tidak sedang melakukan sesuatu yang baru. Ia hanya
00:01:01melakukan apa yang sudah dikuasainya, namun dengan cara yang lebih terkontrol. Pendekatan ini tidak terbatas pada kode; agen
00:01:06bisa menavigasi direktori apa pun, baik berisi kode maupun tidak, karena mereka sudah terbiasa
00:01:11dengan perintah dan memahami sistem file. Setiap kali agen membutuhkan sesuatu, ia akan mencari di sistem file
00:01:17menggunakan perintah bash asli seperti ls dan find. Setelah agen menemukan file yang tepat melalui find,
00:01:23ia mencari konten yang relevan di dalam file tersebut menggunakan pencocokan pola dengan grep dan cat.
00:01:27Hanya potongan kecil informasi yang relevan yang dikirim ke model, sementara sisanya tetap berada di luar memori,
00:01:32sehingga context window tetap bersih. Ini berarti kita tidak membuang-buang token untuk data
00:01:36tidak relevan yang tidak dibutuhkan model. Dengan pendekatan ini, agen mengembalikan output yang terstruktur.
00:01:41Pola ini bekerja sangat baik sehingga Vercel akhirnya merilis alat bash sumber terbuka yang khusus dibuat
00:01:46berdasarkan prinsip ini, memberikan agen kemampuan untuk menjelajahi sistem file seperti yang dilakukan developer.
00:01:51Saat membangun sistem model bahasa besar, ada dua cara untuk memberikan informasi yang tepat
00:01:56kepada model, yaitu melalui sistem prompt yang mendetail dengan harapan agen akan mematuhinya,
00:02:00atau dengan memasukkan banyak data ke dalam basis data vektor dan menggunakan pencarian semantik untuk mengekstraknya.
00:02:06Namun setiap pendekatan memiliki keterbatasan. Sistem prompt memiliki batasan token window, yang membatasi
00:02:10jumlah informasi yang bisa kita kirim sekaligus. Untuk menangani kumpulan data yang lebih besar, kita menggunakan pencarian semantik,
00:02:15yang mencari informasi berdasarkan kesamaan makna terhadap kueri. Namun pencarian vektor digunakan untuk
00:02:20kemiripan semantik, bukan pencarian yang presisi. Ia mengembalikan potongan data yang cocok dengan konteks
00:02:25umum dari kueri, bukan nilai spesifik yang kita cari. Hal ini membuat model harus mengekstrak
00:02:30konten yang benar dari semua potongan tersebut sendiri. Namun, sistem file menawarkan pendekatan yang berbeda.
00:02:35Dengan sistem file, strukturnya benar-benar memetakan domain Anda. Anda sering memiliki hubungan
00:02:40antar file dalam struktur folder yang mencerminkan hubungan antar folder induknya.
00:02:45Dengan sistem file, Anda tidak perlu meratakan hubungan ini ke dalam potongan vektor yang dipahami model,
00:02:49yang membantu menghindari hilangnya hubungan yang biasanya hilang dalam pencarian semantik. Koneksi hierarkis
00:02:54ini tetap terjaga secara alami, mempertahankan logika organisasi yang sudah ada dalam data Anda.
00:02:59Keuntungan lainnya adalah pengambilan data yang presisi karena alat grep dan bash mengembalikan kecocokan yang tepat,
00:03:05berbeda dengan pencarian vektor yang mengembalikan semua potongan yang sekadar mirip dengan kueri dan menyerahkannya
00:03:10kepada model untuk diputuskan. Anda hanya mendapatkan nilai yang dibutuhkan. Konteksnya menjadi minimal
00:03:15saat agen menggunakan alat bash karena mereka menerima potongan spesifik yang dibutuhkan, tanpa memasukkan potongan
00:03:20lain ke dalam memori. Hal ini memungkinkan agen tetap fokus pada informasi yang tepat tanpa
00:03:25tersesat dalam data yang tidak terkait. Sebenarnya, ide ini bukanlah sesuatu yang asing bagi Anda.
00:03:30Konsep ini sudah digunakan di dalam Claude Code dan semua agen CLI, di mana mereka menggunakan fungsi bash untuk
00:03:36mempersempit temuan menggunakan pencocokan pola. Kami juga telah menggunakan sistem file dan
00:03:41kemampuan Claude Code untuk tujuan riset dari setiap ide yang kami evaluasi. Kami biasanya
00:03:46memasukkan alat perangkat lunak yang kami temukan ke dalam pipeline ini, yang berisi beberapa fase dengan
00:03:51kriteria evaluasi yang harus dilewati riset tersebut. Semua ini didefinisikan dalam file markdown
00:03:56yang berisi persyaratan dan tujuan dari alat yang kami uji, cara menulis dokumen akhir,
00:04:01serta semua informasi yang diperlukan untuk setiap fase. Kami juga memberikan beberapa dokumen sampel kepada Claude,
00:04:06yang berfungsi sebagai panduan gaya penulisan, dan dokumen akhirnya disimpan di folder hasil riset.
00:04:11Untuk memandu riset tersebut, kami memiliki file Claude.md yang menjelaskan cara memproses ide tersebut
00:04:17melewati setiap fase satu per satu, hingga akhirnya memberikan kami dokumen riset yang memenuhi semua standar.
00:04:22Setiap kali ada sesuatu yang perlu diriset, saya cukup membuka Claude dan memberitahunya ide atau alat yang ingin
00:04:27diriset. Claude kemudian menjalankannya melalui proses validasi enam fase, mulai dari memahami
00:04:32alat atau ide tersebut lalu memprosesnya melalui tiap fase satu per satu. Setelah ide tersebut melewati
00:04:37semua fase, Claude menghasilkan laporan akhir yang bisa kami baca untuk memverifikasi potensi ide tersebut.
00:04:42Pendekatan sistem file ini menghemat banyak waktu kami dengan mengotomatisasi proses riset yang biasanya
00:04:47harus dilakukan langkah demi langkah. Jika Anda ingin mencoba pipeline ini untuk kebutuhan Anda sendiri,
00:04:52Anda bisa mendapatkan templat siap pakai untuk membuat pipeline riset sendiri yang serupa dengan milik kami
00:04:57di komunitas yang baru kami luncurkan bernama AI Labs Pro. Untuk video ini dan semua
00:05:03video sebelumnya, Anda akan mendapatkan templat siap pakai, prompt, serta perintah dan skill yang bisa langsung
00:05:08Anda gunakan dalam proyek Anda. Jika Anda merasa konten kami bermanfaat dan ingin mendukung channel ini,
00:05:12ini adalah cara terbaik untuk melakukannya. Link ada di deskripsi. Saya sempat membaca studi kasus mereka
00:05:17yang menjelaskan cara membangun agen ringkasan penjualan menggunakan arsitektur ini.
00:05:22Mereka juga telah menjadikannya sumber terbuka, dan itu memberi saya ide menarik untuk dicoba sendiri.
00:05:27Saya sedang membangun proyek kebijakan perusahaan di mana saya memiliki banyak data perusahaan dalam
00:05:32format file JSON, Markdown, dan TXT, yang semuanya dipisahkan berdasarkan departemen. Biasanya, saya akan
00:05:39menerapkan sistem ini menggunakan database vektor seperti Chroma, tetapi saya memutuskan untuk mencoba alat ini. Saya
00:05:44kemudian menerapkan arsitektur ini. Di sisi backend, saya menyertakan path ke folder dokumen
00:05:49yang berisi data perusahaan dan memberikan agen akses ke perintah ls, cat, grep, dan find,
00:05:55berserta panduan cara menggunakan alat tersebut dan kapan harus menggunakan tiap perintah. Saya menggunakan model Gemini 1.5 Flash,
00:06:01memberikannya alat bash dari Vercel, dan memberikan path ke dokumen di dalam alat tersebut.
00:06:06Hasilnya, saat saya menguji agen dengan pertanyaan apa pun terkait data tersebut, ia memberikan
00:06:11jawaban berdasarkan konten yang tepat dari kebijakan perusahaan, termasuk buku panduan karyawan
00:06:16dan dokumen kebijakan cuti. Untuk memverifikasi cara kerjanya, saya memantau penggunaan alatnya di terminal.
00:06:21Agen tersebut pertama-tama menggunakan perintah ls untuk melihat dokumen apa saja yang tersedia, lalu menggunakan grep dengan
00:06:27pencocokan pola untuk mencari kata "hari libur" atau istilah serupa. Rangkaian perintah ini menangani kueri kami dan
00:06:32memberikan hasil dengan tingkat akurasi yang sama dengan sistem RAG. Jika Anda ingin kode sumber untuk
00:06:38proyek ini, Anda bisa menemukannya di komunitas kami untuk diunduh dan dicoba sendiri.
00:06:43Pertanyaan pertama yang muncul di benak saya saat mempelajari alat ini adalah,
00:06:47apakah benar-benar aman memberikan kemampuan kepada agen untuk mengeksekusi perintah di server? Kita baru saja
00:06:52melihat kerentanan pada React Server Components Desember lalu, yang mendapat skor 10.0, tertinggi pada skalanya,
00:06:57dan itu melibatkan eksekusi kode di server. Jadi ini adalah kemampuan yang sangat kuat dan berpotensi berbahaya bagi agen.
00:07:03Lalu mengapa saya memercayai alat ini? Karena alat ini berjalan di sandbox dan memiliki isolasi.
00:07:08Ia hanya mengakses direktori spesifik yang kita berikan dan tidak mengubah hal lainnya. Dalam artikelnya,
00:07:14mereka juga menyebutkan bahwa agen menjelajahi file tanpa akses ke sistem produksi, sehingga kode produksi Anda
00:07:19tetap aman meskipun agen mencoba menjalankan perintah berbahaya di server. Ada dua jenis isolasi yang disediakan.
00:07:24Yang pertama adalah lingkungan in-memory. Dalam pengaturan ini, ia hanya menggunakan alat bash yang menjalankan
00:07:29skrip bash terbatas pada file yang diberi akses, persis seperti yang kami lakukan saat membuat agen kami.
00:07:35Jenis kedua adalah lingkungan sandbox yang sepenuhnya kompatibel, menawarkan isolasi mesin virtual penuh
00:07:40menggunakan Vercel Sandbox. Kita bisa memilih salah satunya sesuai kebutuhan kita.
00:07:46Pendekatan in-memory lebih ringan dan cepat untuk kasus penggunaan sederhana, sedangkan isolasi VM penuh lebih baik
00:07:51saat Anda membutuhkan jaminan keamanan yang lebih kuat. Meskipun pendekatan ini sangat bagus untuk menghemat biaya per pemanggilan model,
00:07:56ini bukanlah solusi yang tepat untuk semua jenis masalah. Metode ini tidak ideal jika Anda perlu mencocokkan
00:08:01makna kata karena alat bash digunakan untuk pencocokan yang tepat (exact matching). Seperti yang kita lihat saat memanggil agen,
00:08:06ia menggunakan kata kunci spesifik untuk menemukan data yang diperlukan. Ini juga tidak cocok untuk struktur file yang tidak teratur
00:08:11di mana agen harus bersusah payah dengan banyak pemanggilan alat. Struktur yang mudah dinavigasi oleh agen akan jauh lebih baik.
00:08:17Saran pribadi saya adalah gunakan alat bash saat Anda memiliki data yang sangat terstruktur dan permintaan Anda
00:08:22sebagian besar sudah jelas tujuannya. Gunakan RAG jika Anda lebih peduli pada makna dari apa yang tertulis
00:08:27di dalam file atau saat kueri Anda cenderung tidak beraturan. Sebelum kita akhiri, ada pesan singkat dari
00:08:32sponsor kita, Brilliant. Engineer terbaik tidak hanya tahu sintaksis, mereka mampu memecahkan masalah dari
00:08:37prinsip dasar. Itulah alasan kami bermitra dengan Brilliant. Filosofi mereka adalah Anda belajar paling baik
00:08:42dengan cara praktik langsung. Mereka memprioritaskan penyelesaian masalah secara aktif agar Anda terbiasa dengan konsepnya
00:08:47daripada sekadar menghafal. Misalnya, dalam kursus mereka yang berjudul "How AI Works", Anda tidak hanya membaca,
00:08:52tetapi memanipulasi logika yang sebenarnya. Anda akan mempraktikkan hal teknis seperti menghitung loss di loss space
00:08:57dan memvisualisasikan interpolasi, membangun intuisi mendalam yang tidak bisa didapatkan hanya dari video ceramah.
00:09:02Melalui kursus teknis interaktif mereka, Anda mendapatkan cara paling efektif untuk benar-benar menguasai konsep
00:09:07yang kami bicarakan. Anda juga akan mendapatkan diskon 20% untuk langganan tahunan premium, yang membuka seluruh katalog
00:09:12kursus matematika, data, dan ilmu komputer untuk membantu peningkatan skill Anda. Klik link di deskripsi
00:09:17atau pindai kode QR di layar untuk mendapatkan uji coba gratis selama 30 hari. Kita telah sampai di penghujung
00:09:22video ini. Jika Anda ingin mendukung channel ini dan membantu kami terus membuat video seperti ini,
00:09:28Anda bisa melakukannya melalui tombol Super Thanks di bawah. Seperti biasa, terima kasih telah menonton dan sampai jumpa di video berikutnya.
00:09:32do so by using the super thanks button below. As always, thank you for watching and I'll see you in the next one.