Toolkit dari CEO Y Combinator yang Membuat Claude Code Menjadi Luar Biasa

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00CEO YCombinator telah membangun toolkit-nya sendiri untuk Claude code yang disebut GStack, rahasianya
00:00:06untuk melibas hampir seratus PR dalam tujuh hari, yang mencakup sembilan alur kerja khusus,
00:00:13mode headless browsing menggunakan Playwright, integrasi Greptile, QA yang peka terhadap perbedaan, dan masih
00:00:18banyak lagi.
00:00:19Tapi tweet terbaru Gary tentang masa depan pemrograman telah membuat banyak pengembang merasa sangat
00:00:24kesal.
00:00:25Jadi apa artinya itu bagi masa depan GStack?
00:00:28Subscribe dan mari kita cari tahu.
00:00:33Gary Tan telah menjabat sebagai CEO YCombinator sejak 2023 dan sebelumnya ia mendirikan sebuah perusahaan
00:00:39modal ventura pada tahun 2011.
00:00:42Jadi ia memiliki segudang pengalaman dalam meninjau presentasi ide dan mencari tahu apa
00:00:46yang membuat sebuah teknologi baru menjadi unik.
00:00:49Dan ia menuangkan semua pengetahuan itu ke dalam toolkit Claude code miliknya sendiri, yang bisa
00:00:53Anda ketahui dari nama-nama yang ia berikan pada banyak alur kerjanya.
00:00:57Sebenarnya, mari kita coba gunakan GStack.
00:00:59Agar GStack bisa berfungsi, Anda perlu menginstal Claude code serta BUN, tetapi setelah
00:01:03Anda menginstalnya dengan benar di Claude code dengan perintah teks persis seperti ini atau
00:01:08hanya dengan mengunduh skill-nya, informasi ini akan ditambahkan ke file Claude MD Anda.
00:01:12Milik saya tadinya kosong.
00:01:13Itulah mengapa hanya ini yang ada di sini, tetapi jika Anda sudah memiliki teks, maka ini akan ditambahkan
00:01:17ke dalamnya.
00:01:18Ini juga menempatkan semua skill yang relevan ke dalam direktori skills jika Anda ingin membaginya dengan
00:01:21rekan tim Anda dan kemudian menginstal Playwright dengan browser yang sesuai.
00:01:25Sekarang saya akan menggunakan GStack untuk menambahkan fitur ke aplikasi React Vite ini guna
00:01:30memberikan kemampuan kepada pengguna untuk mengunduh gambar tweet dengan URL tertentu.
00:01:34Anda mungkin pernah melihat saya menambahkan fitur ini di video sebelumnya.
00:01:37Saya akan menyertakan tautannya di deskripsi jika Anda ingin melihat hasilnya,
00:01:41tapi kita akan lihat apakah GStack bisa melakukannya lebih baik.
00:01:44Pertama saya harus mulai dalam mode plan, lalu gunakan skill plan CEO review dan berikan GStack
00:01:49beberapa informasi tentang fitur tersebut.
00:01:51Sekarang saya akan mengatakan tambahkan fitur yang mengambil tangkapan layar tweet dari URL yang diberikan
00:01:56oleh pengguna.
00:01:57Saya juga ingin pengguna bisa menyesuaikan dan mengunduh gambar tersebut dan saya ingin Claude menghormati
00:02:02tata letak dan gaya yang sudah ada.
00:02:03Setelah saya tekan enter, GStack pertama-tama memeriksa apakah ada pembaruan pada skill tersebut dan kemudian
00:02:08memeriksa log git sebelum melanjutkan.
00:02:10Nah, mode ini memikirkan kembali masalah dari perspektif seorang pendiri/CEO dan mencoba memikirkan
00:02:16versi terbaik dari apa yang ingin kita bangun serta menantang asumsi
00:02:20tentang cakupan dan nilainya.
00:02:21Setelah itu selesai, ia memungkinkan kita memilih seberapa besar kita ingin menantang
00:02:26cakupan aslinya.
00:02:27Dan di sini saya akan memilih ekspansi cakupan karena memiliki fitur yang paling banyak.
00:02:30Kemudian ia membiarkan kita memilih keputusan arsitektur yang kritis.
00:02:33Saya akan memilih yang direkomendasikan karena itu yang termudah.
00:02:36Lalu ia mengajukan beberapa pertanyaan lagi, yang sekali lagi, saya akan pilih
00:02:39pendekatan yang direkomendasikan.
00:02:40Dan sekarang setelah selesai, ia menghasilkan rencana besar yang menunjukkan mode cakupan yang dipilih
00:02:44dan semua yang akan dilakukannya dalam cakupan tersebut.
00:02:47Ia juga menuliskan beberapa hal yang tidak masuk dalam cakupan untuk fitur ini.
00:02:50Dan di bawah sini kita memiliki rencana implementasi, yang memiliki diagram arsitektur, keputusan
00:02:55kunci, dan berbagai langkah.
00:02:57Ini adalah rencana yang sangat mendalam, mirip dengan apa yang saya dapatkan dari Superpowers jika saya
00:03:01melalui rute yang sama.
00:03:02Catatan, ada juga skill plan engineering review di GStack, yang mengubah Claude menjadi seorang
00:03:07manajer teknik atau tech lead untuk membuat diagram arsitektur, menentukan
00:03:12tumpukan teknologi, mendefinisikan kasus tepi, dan sebagainya.
00:03:15Tapi sepertinya skill plan CEO review sudah melakukannya terlebih dahulu.
00:03:20Jadi kita langsung lompat ke implementasi.
00:03:22Dan sekarang setelah selesai, kita bisa menjalankan perintah slash review untuk meninjau kasus tepi yang terlewat,
00:03:27menemukan bug yang mungkin lolos dari CI dan pada dasarnya menangkap masalah sebelum masuk ke produksi.
00:03:32Sekali lagi, itu memeriksa pembaruan baru di dalam skrip, memeriksa diff-nya.
00:03:36Dan sekarang ia memeriksa kelengkapan tugas sebelum memberi kita ringkasan yang menyatakan bahwa
00:03:40tidak ada masalah yang ditemukan.
00:03:41Dan sekarang kita bisa menjalankan perintah slash ship, yang mensinkronkan dengan cabang utama, menjalankan pengujian
00:03:46dan menyelesaikan tinjauan Greptile jika ada.
00:03:49Dan di sini kita bisa melihat ia langsung membuat pull request tanpa saya perintahkan.
00:03:54Lalu pada tahap ini kita bisa menjalankan perintah slash QA, yang akan menguji hanya perubahan yang telah
00:03:58kita buat berdasarkan diff.
00:03:59Dan di sini kita bisa melihat ia memulai server secara lokal, dan menelusuri situs web untuk menguji
00:04:05fitur yang baru saja diimplementasikan menggunakan tangkapan layar dan banyak lagi.
00:04:09Ia menemukan beberapa kesalahan 500 dari tangkapan layar dan menemukan bug pada parsing JSON, yang
00:04:15sepertinya sudah diperbaiki.
00:04:16Nah, ini dia.
00:04:17Ia sudah memverifikasi dan mengirimkan perbaikannya.
00:04:20Dan sekarang ia menulis laporan akhir dengan masalah-masalah yang berhasil diselesaikan.
00:04:24Ini sangat keren.
00:04:25Oke.
00:04:26Sekarang sudah selesai.
00:04:27Mari kita coba fiturnya.
00:04:28Sekarang kita punya halaman tangkapan layar.
00:04:30Mari kita ambil tweet dari Tana.
00:04:32Yang ini, dan saya akan tempelkan di sini.
00:04:34Ini bukan tweet yang paling menarik, tapi ini hanya untuk menguji apakah ini berfungsi.
00:04:37Dan wah, oke, ini sangat mengesankan.
00:04:40Kita punya tweet-nya di sini.
00:04:42Kita bisa memilih di antara pencahayaan dan ia mengambil gambar lagi.
00:04:44Oh, wah.
00:04:45Oke.
00:04:46Jadi kita punya mode terang dan gelap.
00:04:47Kita lihat apakah itu sudah masuk cache.
00:04:49Dan ternyata sudah, sangat keren.
00:04:51Saya bisa menyembunyikan tindakan dan ini dia.
00:04:53Jadi saya bisa menampilkan dan menyembunyikan gambar dan saya bisa mengganti latar belakangnya.
00:04:58Ini sangat keren.
00:04:59Kita punya gaya LinkedIn, Twitter, blog, gradasi ungu, dan kita bahkan bisa menyesuaikannya
00:05:03atau mengubah sudut gradasinya.
00:05:07Wah.
00:05:08Ini sangat lengkap dan kita bisa mengubah rasio aspeknya.
00:05:11Kita punya 9:16, 16:9, 1:1, dan sebagainya.
00:05:16Sekarang mari kita unduh gambarnya.
00:05:18Dan ini dia.
00:05:19Jika saya klik ini sekarang, Anda bisa melihat semua tab saya.
00:05:22Kita punya gambarnya di sini.
00:05:23Saya akan membukanya di pratinjau.
00:05:24Dan ini hasilnya.
00:05:25Ini adalah gambar yang baru saja saya ambil dengan fitur yang saya bangun dengan GStack, yang sangat
00:05:29luar biasa mengesankan, tapi masih ada hal lain yang bisa kita lakukan karena jika kita kembali ke PR,
00:05:34kita bisa melihat Greptile punya ringkasan, ia menemukan kehabisan sumber daya server, kondisi balapan,
00:05:40tidak ada masa berlaku cache, dan sebagainya.
00:05:42Dan alih-alih saya meminta Claude untuk melihat masalah tersebut dan menyelesaikannya, kita hanya perlu
00:05:47menjalankan perintah slash review.
00:05:49Ia menemukan semua komentar tersebut.
00:05:50Ia memberi saya beberapa opsi di bawah sini tentang cara memperbaikinya, yang akan saya tinjau.
00:05:53Dan sekarang ia telah memperbaiki semua masalah.
00:05:55Yah, kecuali satu positif palsu, dan telah mengirimkan kodenya, Greptile sepertinya puas.
00:06:00Sebagai orang yang rutin menggunakan Superpowers, saya sudah bisa melihat manfaat GStack, meskipun
00:06:05beberapa aspeknya cukup kompleks.
00:06:08Tapi bagaimana dengan komentar Gary di Twitter yang mengatakan bahwa Markdown adalah kode baru?
00:06:13Yah, saya bisa memahami maksudnya.
00:06:15Saya rasa dia tidak mengatakan seseorang dengan gelar ilmu komputer telah membuang waktu mereka hanya
00:06:20karena Anda bisa menulis Markdown dan ia akan menuliskan kodenya.
00:06:22Saya pikir ini lebih berkaitan dengan instruksi karena model-model baru semakin mahir dalam
00:06:27mematuhi instruksi Markdown. Dulu ada masa ketika saya memerlukan hook Claude
00:06:32code hanya untuk memastikan ia menggunakan Bun untuk instalasi alih-alih NPM.
00:06:36Tapi sekarang saya bisa menaruhnya di Claude MD dan dengan model yang bagus seperti Opus, ia cenderung patuh 90
00:06:42hingga 95% dari seluruh waktu.
00:06:44Jadi saya pikir apa yang ingin dia katakan adalah jika Anda memiliki file Markdown yang cukup detail dan terstruktur
00:06:49dengan baik, model tersebut dapat membuat perangkat lunak yang bagus berdasarkan instruksi tersebut.
00:06:55Tapi ini bukan berarti GStack hanyalah sekumpulan instruksi Markdown.
00:06:59Setiap skill memiliki direktorinya sendiri, bahkan kemampuan untuk meningkatkan versi GStack.
00:07:03Dan jika kita fokus pada skill browse, kita bisa melihat ada file template dan file
00:07:08skill yang sebenarnya.
00:07:09Dan ini tidak ada hubungannya dengan Go templates, terlepas dari apa yang dikatakan halaman GitHub-nya.
00:07:14Cara kerjanya adalah jika kita pergi ke scripts lalu ke genskill, file TypeScript
00:07:20akan membaca file template dan mengganti setiap placeholder di dalamnya dengan Markdown asli.
00:07:26Tapi saya tidak akan fokus pada setiap skill secara individual karena semuanya cukup detail.
00:07:30Tapi yang akan saya soroti adalah bahwa skill browse memiliki lebih dari sekadar file skill MD karena
00:07:35kita punya direktori test di sini dan kita juga punya direktori source yang berisi
00:07:40implementasi sebenarnya untuk manajemen browser dan sebagainya.
00:07:42Jadi kita sudah bisa melihat bahwa perintah-perintah di sini cukup rumit.
00:07:46Tapi jika kita melihat changelog-nya, ini menunjukkan beberapa fitur yang sangat menarik seperti
00:07:49observabilitas end-to-end, penyimpanan evaluasi inkremental, dan sebagainya, yang digunakan untuk mengembangkan
00:07:55aplikasi tersebut.
00:07:56Ia membagikan tinjauan dalam format to-do.
00:07:58Ia mendukung pemotongan elemen dan area tangkapan layar, belum lagi semua integrasi yang dimilikinya
00:08:03dengan Greptile dan fakta bahwa ia dibangun dengan mempertimbangkan Conductor.
00:08:07Jadi pertanyaan sejuta dollarnya adalah, apakah saya pribadi akan menggunakan GStack?
00:08:11Dan saya akan katakan, sebenarnya saya akan mencobanya selama 30 hari.
00:08:15Jadi saya akan menghapus plugin Superpowers dan menjadikan GStack sebagai alat kode utama saya untuk menyiapkan
00:08:21fitur dan memperbaiki bug, lalu lihat bagaimana hasilnya.
00:08:23Siapa tahu?
00:08:24Saya mungkin saja mengkloning alat open source Vercel berikutnya dan memulai keributan lagi di Twitter.

Key Takeaway

GStack mengubah Claude Code menjadi agen pengembang yang sangat otonom dan efisien dengan mengintegrasikan perencanaan strategis tingkat CEO, peninjauan teknis, dan pengujian otomatis dalam satu alur kerja terpadu.

Highlights

GStack adalah toolkit Claude Code yang dikembangkan oleh CEO Y Combinator, Gary Tan, untuk mengotomatiskan alur kerja pemrograman.

Fitur utama GStack mencakup sembilan alur kerja khusus, termasuk mode headless browsing menggunakan Playwright dan integrasi Greptile.

Toolkit ini memungkinkan AI untuk mengambil peran sebagai CEO atau Engineering Manager dalam merencanakan arsitektur dan cakupan fitur.

GStack dapat secara otomatis membuat pull request, menjalankan pengujian QA lokal, dan memperbaiki bug berdasarkan feedback.

Filosofi di balik toolkit ini adalah 'Markdown adalah kode baru', yang menekankan pentingnya instruksi terstruktur untuk model AI.

Integrasi dengan Greptile membantu mendeteksi masalah kompleks seperti kondisi balapan (race conditions) dan manajemen cache.

Timeline

Pendahuluan dan Kemampuan GStack

Video dimulai dengan memperkenalkan GStack, sebuah toolkit khusus untuk Claude Code yang dibuat oleh CEO Y Combinator, Gary Tan. Toolkit ini diklaim mampu membantu pengembang menyelesaikan hampir seratus Pull Request hanya dalam waktu tujuh hari melalui alur kerja yang sangat teroptimasi. Fitur-fitur canggih yang disebutkan meliputi headless browsing dengan Playwright, integrasi Greptile untuk analisis kode, dan QA yang peka terhadap perbedaan kode. Bagian ini juga menyinggung kontroversi tweet Gary Tan mengenai masa depan pemrograman yang membuat banyak pengembang merasa cemas. Narator mengajak penonton untuk melihat bagaimana GStack akan mempengaruhi masa depan pengembangan perangkat lunak secara keseluruhan.

Instalasi dan Penyiapan Lingkungan

Gary Tan membawa pengalaman luasnya sebagai pendiri modal ventura ke dalam perancangan GStack untuk memastikan teknologi ini unik dan fungsional. Untuk menggunakan GStack, pengguna perlu menginstal Claude Code dan runtime JavaScript BUN sebagai persyaratan utama di sistem mereka. Proses instalasi dilakukan melalui perintah teks khusus yang secara otomatis memperbarui file konfigurasi Claude MD dan menambahkan direktori skills. Selain itu, toolkit ini juga menginstal Playwright beserta browser yang diperlukan untuk mendukung fungsionalitas browsing otomatis. Persiapan ini sangat krusial agar semua 'skill' yang ada dalam GStack dapat berfungsi secara kolaboratif dalam tim pengembang.

Perencanaan Fitur dengan Mode CEO Review

Narator mendemonstrasikan penggunaan GStack untuk menambahkan fitur pengunduhan gambar tweet ke aplikasi React Vite. Proses dimulai dengan 'mode plan' menggunakan skill 'CEO review' yang menganalisis masalah dari perspektif seorang pendiri perusahaan. AI menantang asumsi awal mengenai cakupan fitur dan menawarkan opsi ekspansi cakupan atau keputusan arsitektur yang direkomendasikan. Hasil dari tahap ini adalah rencana implementasi yang sangat mendalam, lengkap dengan diagram arsitektur, keputusan kunci, dan langkah-langkah kerja. Terdapat juga skill 'engineering review' yang bisa mengubah AI menjadi manajer teknik untuk mendefinisikan kasus tepi dan tumpukan teknologi secara spesifik.

Implementasi, Peninjauan, dan Pengiriman Kode

Setelah rencana disetujui, AI beralih ke tahap implementasi kode secara langsung dan otomatis. Pengguna dapat menjalankan perintah khusus seperti slash review untuk mendeteksi bug atau kasus tepi yang terlewat sebelum kode masuk ke tahap produksi. Fitur 'slash ship' kemudian digunakan untuk mensinkronisasi kode dengan cabang utama dan secara otomatis membuat pull request tanpa instruksi manual tambahan. GStack juga menyertakan perintah 'slash QA' yang menjalankan server lokal dan melakukan pengujian fungsionalitas menggunakan tangkapan layar untuk memverifikasi perbaikan. Proses ini diakhiri dengan laporan final yang merinci masalah yang ditemukan dan bagaimana masalah tersebut diselesaikan secara otomatis oleh AI.

Demo Fitur dan Integrasi Greptile

Bagian ini menunjukkan demo langsung dari fitur pengunduh tweet yang berhasil dibangun menggunakan bantuan GStack. Fitur tersebut terbukti sangat lengkap, mencakup mode terang/gelap, kustomisasi latar belakang, hingga pengaturan rasio aspek gambar untuk berbagai platform media sosial. Selain fungsionalitas visual, video menyoroti bagaimana integrasi Greptile menemukan masalah teknis yang mendalam seperti kebocoran sumber daya server dan ketiadaan masa berlaku cache. Pengguna hanya perlu menjalankan perintah review kembali agar Claude secara otomatis memperbaiki komentar-komentar teknis dari Greptile tersebut. Hal ini menunjukkan kekuatan GStack dalam menangani detail teknis yang sering kali terlewatkan oleh pengembang manusia.

Filosofi 'Markdown sebagai Kode' dan Struktur Teknis

Narator membahas pernyataan Gary Tan bahwa 'Markdown adalah kode baru' dan memberikan konteks bahwa ini berkaitan dengan kemampuan model AI modern dalam mematuhi instruksi terstruktur. Dengan file Markdown yang detail di dalam Claude MD, model seperti Claude Opus dapat mengikuti instruksi dengan tingkat akurasi mencapai 90 hingga 95 persen. Secara teknis, GStack terdiri dari berbagai file TypeScript dan template Markdown yang dikelola secara sistematis di dalam direktori skrip. Toolkit ini juga mendukung fitur-fitur canggih seperti observabilitas end-to-end dan penyimpanan evaluasi inkremental untuk pengembangan aplikasi yang lebih stabil. Struktur ini membuktikan bahwa GStack bukan sekadar kumpulan perintah sederhana, melainkan sistem manajemen browser dan kode yang kompleks.

Kesimpulan dan Komitmen Pengujian 30 Hari

Video diakhiri dengan kesimpulan pribadi dari narator mengenai manfaat nyata GStack meskipun memiliki tingkat kompleksitas yang cukup tinggi. Narator memutuskan untuk mencoba menggunakan GStack sebagai alat pengembangan utama selama 30 hari penuh guna menguji efektivitasnya dalam memperbaiki bug dan membangun fitur baru. Ia bahkan berencana untuk menghapus plugin 'Superpowers' yang biasa digunakannya demi memberikan fokus penuh pada toolkit buatan Gary Tan ini. Komitmen ini bertujuan untuk melihat apakah AI benar-benar bisa menggantikan peran pengembang dalam tugas-tugas rutin di dunia nyata. Penonton diajak untuk menantikan hasil dari eksperimen jangka panjang ini di masa mendatang.

Community Posts

View all posts