Inilah Lapisan Memori AI Coding yang Selama Ini Hilang (Graphify)

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Ini mungkin salah satu cara paling gila untuk menghidupkan basis kode Anda.
00:00:04Jika Anda memakai Claude Code atau Cursor pada proyek nyata, Anda pikir bagian tersulitnya adalah menulis kode.
00:00:09Padahal bukan. Bagian tersulitnya adalah memahami repositori Anda sendiri.
00:00:13Anda mengajukan satu pertanyaan dan AI Anda menghabiskan token hanya untuk mencari tahu apa yang terjadi.
00:00:18Prosesnya lambat, mahal, dan separuh waktu hasilnya masih mentah.
00:00:22Bagaimana jika alih-alih mengirim seluruh proyek setiap saat, Anda memberi AI sebuah peta?
00:00:27Itulah tepatnya yang dilakukan Grafi, dan ini bisa memangkas penggunaan token hingga lebih dari 70%.
00:00:32Izinkan saya menunjukkan cara kerja semua ini.
00:00:34Saat ini, AI melihat proyek Anda seperti ini. Hanya tumpukan berkas.
00:00:44Tidak ada koneksi nyata. Tidak ada struktur. Tidak ada memori.
00:00:48Jadi setiap kali Anda bertanya, ia harus mempelajari kembali semuanya dari awal.
00:00:53Itulah mengapa jawabannya terasa mendekati, tapi tidak tepat.
00:00:56Dan ya, inilah tepatnya yang ditunjukkan Karpathy tentang masalah folder mentah.
00:01:01Grafi muncul tepat setelah itu. Ini lebih seperti lapisan memori.
00:01:06Jika Anda menyukai alat dan tips coding seperti ini, pastikan untuk berlangganan.
00:01:09Kami memiliki video baru yang dirilis setiap saat.
00:01:11Baiklah, sekarang saya tunjukkan. Saya punya repo kecil di sini. Diagram dok kode.
00:01:16Biasanya, saya harus menjelaskan semua ini ke AI setiap waktu.
00:01:20Sebagai gantinya, saya jalankan satu perintah, Grafi, di sini. Tunggu sebentar. Sekarang lihat ini.
00:01:27Setelah Claude mengeksekusi Grafi, ini bukan sekadar berkas lagi. Ini adalah grafik sungguhan.
00:01:33Semuanya terhubung. Saya bisa mengeklik dan membedah apa yang sebenarnya terjadi
00:01:38dan apa yang saling tertaut di dalam berkas HTML yang dihasilkannya.
00:01:42Lalu alih-alih meminta AI membaca semuanya lagi, saya bisa bertanya apa yang terhubung ke lapisan API.
00:01:50Dan sekarang ia menjawab menggunakan hubungan, menggunakan berkas MD yang dihasilkan dari panggilan ini.
00:01:56Ini bukan tebakan, melainkan hubungan. Dan inilah bagian yang mengejutkan saya.
00:02:00Sebelum ini, sekitar 14.000 token, oke, sebanyak itulah yang digunakan.
00:02:04Setelah ini, setelah eksekusi pertama, jumlahnya turun menjadi mungkin cuma beberapa ratus.
00:02:09Pertanyaan sama, biaya jauh berbeda. Semua karena peta yang dihasilkan ini.
00:02:14Jadi apa yang sebenarnya dilakukan? Grafi pada dasarnya seperti Google Maps untuk basis kode Anda.
00:02:20Alih-alih teks mentah, Anda mendapatkan titik koordinat dan koneksi.
00:02:24Di baliknya, ia memakai tree-sitter untuk memahami struktur, lalu LLM untuk mengekstrak makna.
00:02:30Kemudian ia bisa mengelompokkan semuanya, dan ini bukan hanya soal kode.
00:02:35Ia membaca PDF, diagram, bahkan audio dan video. Semuanya lokal, tidak ada yang keluar dari mesin.
00:02:41Apa yang Anda dapatkan sangat sederhana. Grafik visual, laporan tertulis,
00:02:46dan basis pengetahuan yang benar-benar bisa kita jelajahi.
00:02:49Grafik visual ini sangat penting bagi kita untuk melihat bagaimana segala sesuatunya terhubung.
00:02:54Nah, di sinilah hal ini mengubah cara kerja coding AI yang biasanya.
00:02:57Kebanyakan alat memakai RAG, yang intinya mencari potongan teks yang serupa.
00:03:03Grafi tidak melakukan itu. Ia membangun hubungan yang nyata.
00:03:07Fungsi ini memanggil yang itu. Modul ini bergantung pada yang sana.
00:03:11Ide ini berasal dari dokumen ini, bahkan ia memberi tahu tingkat keyakinannya.
00:03:16Jadi alih-alih "ini terlihat terkait", kita mendapat "ini sebenarnya terhubung"
00:03:21dalam representasi visual nyata tentang apa yang saling bertautan.
00:03:24Dan perbedaan terbesarnya, ia juga mengingatnya karena ia menghasilkan berkas MD,
00:03:30yang bisa ia rujuk kembali. Kita tidak mulai dari nol setiap saat.
00:03:33Ia hanya memperbarui apa yang berubah sehingga AI Anda akhirnya punya konteks yang menetap.
00:03:38Baiklah, saya rasa semua ini cukup keren.
00:03:42Tapi apa saja kelebihan dan kekurangannya di sini?
00:03:44Pertama-tama, efisiensinya berlipat ganda.
00:03:47Setiap pertanyaan jadi lebih murah. Dan karena ia menghubungkan kode,
00:03:51dokumen, dan diagram, Anda mulai menemukan hubungan yang tidak Anda ketahui keberadaannya.
00:03:56Itu sangat berguna untuk orientasi pada proyek berantakan yang diberikan kepada kita.
00:04:00Bagus sekali. Nah, kekurangannya adalah ini.
00:04:03Jalankan pertama kali bisa lambat dan memakan token, terutama dengan banyak dokumen.
00:04:08Setelah itu, data akan di-cache. Tapi ya, dampak awalnya memang nyata.
00:04:12Ini juga masih baru, jadi dukungan jangka panjang masih belum pasti dan terbatas.
00:04:17Saat Anda menginstalnya, namanya grafyy dengan dua huruf 'y', bukan satu.
00:04:20Jadi perhatikan ejaan Anda. Hubungannya tidak selalu sempurna,
00:04:23tetapi ia melabelinya dengan jelas: diekstrak, disimpulkan, atau ambigu,
00:04:28sehingga Anda tahu apa yang benar-benar bisa dipercaya. Dan jika repo Anda kecil,
00:04:32ini akan terasa agak berlebihan. Jadi, apakah ini layak?
00:04:35Maksud saya, ya, jika Anda memakai AI untuk proyek nyata, ini keren.
00:04:38Menurut saya ini layak. Karena masalah terbesar Anda bukan menjalankan kode,
00:04:42melainkan memahaminya di berbagai berkas, waktu, dan konteks.
00:04:46Dan itulah yang diperbaiki oleh alat ini. Hemat token saja sudah membuatnya layak dicoba,
00:04:51tapi kemenangan terbesarnya adalah: AI Anda berhenti menebak dan mulai menalar.
00:04:56Jika Anda bekerja solo, riset, atau punya sistem besar, ini adalah peningkatan serius.
00:05:01Jika Anda cuma mengerjakan skrip kecil, ini mungkin berlebihan,
00:05:04jadi Anda tidak perlu mencobanya. Tapi bagi kebanyakan pengembang,
00:05:07ini akan menjadi alat yang luar biasa. Jika Anda menyukai alat coding dan tips
00:05:10yang mempercepat alur kerja, pastikan untuk berlangganan saluran Better Stack.
00:05:14Sampai jumpa di video lainnya.

Key Takeaway

Grafify mengubah pemahaman AI terhadap basis kode dari sekadar tumpukan berkas mentah menjadi grafik hubungan terstruktur yang mampu menghemat biaya token hingga 70% dan meningkatkan akurasi penalaran melalui konteks permanen.

Highlights

  • Grafify memangkas penggunaan token hingga lebih dari 70% dengan menyediakan peta basis kode alih-alih mengirim seluruh proyek ke AI.

  • Penggunaan token menurun drastis dari 14.000 menjadi hanya beberapa ratus untuk pertanyaan yang sama setelah eksekusi pertama.

  • Sistem ini menggunakan tree-sitter untuk memahami struktur kode dan LLM untuk mengekstrak makna hubungan antar komponen secara lokal.

  • Grafify memproses berbagai format data termasuk kode, PDF, diagram, audio, dan video tanpa mengirim data ke luar mesin pengguna.

  • Setiap hubungan antar berkas dilabeli dengan tingkat kepercayaan tertentu seperti diekstrak, disimpulkan, atau ambigu untuk akurasi data.

  • Basis pengetahuan disimpan dalam format berkas MD yang diperbarui secara inkremental sehingga AI memiliki konteks permanen yang tidak perlu diulang dari nol.

Timeline

Masalah Pemahaman Konteks pada AI Coding

  • Hambatan utama dalam AI coding bukanlah penulisan kode melainkan pemahaman terhadap repositori yang kompleks.
  • AI menghabiskan banyak token dan waktu hanya untuk memetakan struktur proyek setiap kali pertanyaan diajukan.
  • Struktur berkas mentah tanpa memori menyebabkan jawaban AI sering kali tidak tepat karena kurangnya pemahaman koneksi antar komponen.

Repositori dipandang oleh AI hanya sebagai sekumpulan berkas yang terisolasi tanpa struktur atau memori yang jelas. Hal ini menyebabkan proses pencarian informasi menjadi lambat dan mahal karena AI harus mempelajari kembali seluruh basis kode dari awal untuk setiap interaksi. Karpathy mengidentifikasi fenomena ini sebagai masalah folder mentah yang menghambat efisiensi alat seperti Claude Code atau Cursor.

Mekanisme Kerja Grafify Sebagai Lapisan Memori

  • Grafify berfungsi sebagai lapisan memori yang mengubah berkas kode menjadi grafik hubungan yang saling tertaut.
  • Visualisasi grafik memungkinkan pengguna membedah interaksi dalam berkas HTML dan API secara langsung.
  • Efisiensi token meningkat drastis karena AI merujuk pada hubungan yang sudah dipetakan alih-alih membaca ulang seluruh teks.

Satu perintah tunggal mengubah tumpukan berkas menjadi struktur grafik yang dapat dijelajahi. Contoh nyata menunjukkan penurunan konsumsi dari 14.000 token menjadi beberapa ratus token saja untuk pertanyaan yang identik. Penghematan ini terjadi karena AI tidak lagi menebak melainkan menggunakan hubungan nyata yang tersimpan dalam berkas MD hasil ekstraksi.

Teknologi di Balik Pemetaan Struktur dan Konten

  • Tree-sitter digunakan untuk memahami struktur teknis sementara LLM bertugas mengekstrak makna fungsional dari kode.
  • Sistem ini membangun hubungan eksplisit seperti pemanggilan fungsi dan ketergantungan modul, bukan sekadar kemiripan teks seperti pada RAG konvensional.
  • Semua proses pemrosesan data dilakukan secara lokal di mesin pengguna untuk menjaga keamanan informasi.

Grafify bekerja seperti Google Maps untuk basis kode dengan menyediakan titik koordinat dan koneksi antar elemen. Selain kode, alat ini mampu mengasimilasi informasi dari PDF, diagram, hingga media audio dan video ke dalam satu basis pengetahuan. Perbedaan utama dengan Retrieval-Augmented Generation (RAG) adalah fokus pada hubungan hierarkis dan fungsional yang memiliki tingkat keyakinan yang jelas.

Analisis Kelebihan, Kekurangan, dan Relevansi Penggunaan

  • Efisiensi biaya dan kemudahan orientasi pada proyek yang berantakan menjadi keunggulan utama alat ini.
  • Proses inisialisasi awal memerlukan waktu dan konsumsi token yang signifikan sebelum data dapat disimpan dalam cache.
  • Alat ini sangat efektif untuk sistem skala besar namun dianggap berlebihan jika hanya digunakan untuk skrip kecil.

Peningkatan efisiensi berlipat ganda karena setiap pertanyaan menjadi lebih murah setelah pemetaan awal selesai. Meskipun ada dampak awal pada kinerja dan biaya saat pertama kali dijalankan, hasilnya adalah AI yang berhenti menebak dan mulai menalar berdasarkan konteks yang menetap. Grafify (ejaan dengan dua huruf 'y') direkomendasikan bagi pengembang solo maupun tim yang mengelola sistem besar dengan keterkaitan antar berkas yang rumit.

Community Posts

View all posts