Saya Memperbarui /grill-me dan Menyelesaikan Claude Code

CChase AI
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Mode rencana saja tidak cukup. Keterampilan seperti Grill Me dari Matt Pocock atau bahkan lapisan orkestrasi yang lebih besar seperti
00:00:06GSD atau superpowers, semuanya mencoba menyelesaikan masalah yang sama. Ambil ide samar di kepala Anda
00:00:11dan ubahlah menjadi sesuatu yang benar-benar bisa dibangun oleh Claude Code. Namun, terlepas dari jalur apa pun yang Anda pilih
00:00:16atau keterampilan apa pun yang Anda pilih, semuanya menghadapi masalah yang persis sama. Anda mengandalkan satu model
00:00:21untuk tidak hanya merencanakan dan membangun, Anda mengandalkan satu model untuk benar-benar menilai pekerjaannya sendiri.
00:00:26Jadi, ketika Anda bertanya kepada Claude, hei, apakah ini jalur optimal ke depan? Apa yang akan dikatakannya? Yah,
00:00:31itu akan mengatakan semuanya hebat apa pun yang Anda lakukan. Dan ini adalah masalah karena jika Anda tidak
00:00:35berasal dari latar belakang teknis, Anda sebenarnya tidak tahu apakah apa yang ditulis Claude benar-benar masuk akal.
00:00:41Namun dalam video ini, saya akan menunjukkan kepada Anda cara memperbaikinya. Kita akan membangun di atas keterampilan
00:00:45Grill Me milik Matt Pocock dan kita akan menambahkan tinjauan kode adversarial dari Codex. Tapi ini adalah
00:00:51tinjauan kode yang melampaui plugin Codex yang pernah Anda lihat sebelumnya. Tinjauan kode ini
00:00:55bersifat iteratif. Claude Code dan Codex akan saling berbicara melalui beberapa putaran
00:01:00untuk membawa Anda ke tempat di mana kedua alat AI terkemuka tersebut menyetujui rencana Anda. Jadi Anda benar-benar bisa merasa
00:01:07yakin bahwa apa yang dihasilkan Claude Code sebenarnya masuk akal. Dan dengan keterampilan ini, Anda akan dapat
00:01:12memulai setiap proyek dengan dua hal. Satu, rencana yang benar-benar Anda pahami. Dan dua,
00:01:18rencana yang telah disetujui oleh beberapa alat AI. Jadi apa yang akan Anda dapatkan hari ini adalah dua keterampilan dari saya.
00:01:23Dan kedua keterampilan tersebut dibangun berdasarkan apa yang diberikan Matt Pocock kepada kita di sini di repo GitHub-nya.
00:01:28Dia memiliki dua keterampilan, Grill Me dan Grill with Docs. Dua keterampilan yang akan saya berikan adalah Grill Me Codex
00:01:35dan Grill with Docs Codex. Jadi apa yang terjadi? Yah, Grill Me dan Grill with Docs pada dasarnya adalah mode rencana
00:01:41yang disempurnakan. Sama seperti GSD, sama seperti superpowers, itu membawanya selangkah lebih jauh. Pertanyaan yang diajukan
00:01:48lebih dalam. Ini akan memberi Anda wawasan yang lebih baik tentang apa yang sebenarnya Anda coba bangun karena apakah Anda
00:01:53ingin mengakuinya atau tidak, Anda mungkin payah dalam mengartikulasikan apa yang Anda inginkan. Dan jika Anda
00:01:57tidak bisa mengartikulasikan apa yang Anda inginkan kepada Claude Code di awal, Anda akan memiliki banyak
00:02:01asumsi di sisi AI, yang memberikan Anda produk yang biasa-biasa saja di bagian akhir. Jadi Grill Me dan Grill with
00:02:07Docs memberi Anda hasil yang lebih baik dengan masuk lebih dalam ke fase perencanaan untuk memastikan Anda semua sepaham.
00:02:12Apa yang akan diberikan keterampilan saya kepada Anda adalah fase kedua untuk itu, di mana setelah Anda dan Claude
00:02:19Codex memiliki pemahaman yang sama, Codex masuk dan berkata, hei, itu masuk akal. Itu tidak memperbaiki
00:02:24ini, perbaiki itu. Dan kemudian Claude Code dan Codex bolak-balik. Dan saya pikir ini penting karena
00:02:28hal-hal seperti Grill Me, GSD, dan superpowers, mereka mengidentifikasi celah ini di sini, celah antara Anda
00:02:34dan Claude Code, di mana Anda memiliki ide, Anda bisa mengartikulasikannya, kita akan bolak-balik,
00:02:38kita akan mendapatkan pemahaman yang sama, kan? Grill Me, Anda tahu, GM sempurna untuk ini.
00:02:44Masalahnya adalah, bahkan jika Anda dan Claude Codex sepaham, apakah itu berarti kita secara otomatis
00:02:51berada dalam perjalanan menuju tempat kode optimal ini, di mana inilah yang sebenarnya harus dibangun? Mungkin, mungkin
00:02:57tidak, siapa yang bisa mengatakannya? Anda mungkin tidak bisa mengatakannya, apakah Anda seorang insinyur perangkat lunak ahli? Anda mungkin, ya,
00:03:03tapi saya kira sebagian besar audiens yang menonton ini tidak termasuk dalam kelompok itu.
00:03:08Dan hal-hal seperti punya Matt Pocock, sehebat apa pun itu, maksud saya, seperti, itu keterampilan untuk insinyur sungguhan.
00:03:13Apakah Anda insinyur sungguhan? Mungkin tidak. Mungkin Anda iya. Jika tidak, apakah Anda akan mengalami masalah
00:03:19di mana Anda bahkan tidak bisa mengevaluasi apa yang telah ditulis Claude Codex? Bahkan jika Anda sepaham,
00:03:23itu bisa jadi sampah, itu bisa jadi luar biasa, siapa yang tahu? Dan masalah lainnya adalah, Anda tidak bisa menilainya,
00:03:28dan begitu pula Claude Codex karena Claude Codex, dan ini adalah sesuatu yang dikatakan Anthropic sendiri,
00:03:34sangat baik dan berbicara sangat baik tentang kode yang telah ditulisnya, kan? Anda meminta Claude Codex untuk menilai
00:03:40apa yang telah ditulisnya, itu seperti, oh ya, keren, A+. Jadi, apakah mereka narator yang dapat diandalkan dan evaluator yang dapat diandalkan
00:03:46dalam kasus ini? Tidak, mereka tidak. Jadi, jika Anda tidak tahu apa yang terjadi, dan kita tidak bisa
00:03:50selalu mempercayai Claude Codex, di mana itu meninggalkan kita? Yah, kita memiliki celah di sini, kan?
00:03:56Kita memiliki celah antara Claude Code dan apa yang disebut kode optimal. Jadi, solusi yang jelas adalah,
00:04:02yah, mari kita bawa pihak ketiga, pihak ketiga yang netral untuk melihat rencana kita. Masuklah Codex.
00:04:09Dan tinjauan Codex ini adalah apa yang saya tambahkan ke keterampilan Pocock, dan itu adalah apa yang akan saya berikan kepada Anda hari ini.
00:04:16Jadi, bagian pertama persis sama dengan GrillMe. Pertanyaan bolak-balik, kita mendapatkan rencana ini berjalan
00:04:21bersama-sama, semuanya rapi dan teratur di sini. Dan begitu kita memiliki rencana yang sudah ditetapkan, yah,
00:04:27kemudian Codex akan masuk, ia akan melihat apa yang dihasilkan Claude Codex dan berkata,
00:04:32ini terlihat bagus, ini terlihat buruk, apa pendapatmu? Claude Code akan melihatnya dan berkata,
00:04:36oh, itu masuk akal, mari kita perbaiki itu, inilah yang saya lakukan, lihat lagi, Codex. Dan itu akan
00:04:41melalui siklus seperti, yah, maksimal lima putaran, Anda dapat dengan mudah mengedit itu, tapi itu akan
00:04:48melakukan lima kali bolak-balik, yang sedikit berbeda dari tinjauan adversarial standar
00:04:52plugin Codex, karena ini lebih iteratif. Dan idenya adalah, jika mereka bolak-balik cukup
00:04:57banyak kali, kita akhirnya akan sampai ke tempat, mudah-mudahan lebih cepat dari lima putaran, di mana mereka berdua seperti,
00:05:01hei, jempol ke atas, siap untuk pergi, dorong ke depan. Jadi semua yang dikatakan adalah apa yang saya berikan kepada Anda hari ini
00:05:09dimaksudkan untuk memperbaiki celah ini di sini. Celah antara Claude Code dan kode optimal yang Anda
00:05:16dan saya akan kesulitan mengidentifikasinya karena kita bukan insinyur perangkat lunak ahli dan Claude Code tidak bisa
00:05:21dipercaya untuk melakukannya sampai tingkat tertentu. Jadi itulah yang kita bahas. Dan sekarang kita semua sepaham.
00:05:28Tapi sebelum kita masuk ke demo, pesan singkat dari sponsor hari ini, saya. Jadi seperti yang Anda tahu,
00:05:33Chase AI Plus adalah rumah bagi kelas master Claude Code saya. Dan itu adalah cara nomor satu untuk
00:05:37pergi dari nol menjadi pengembang AI, terutama jika Anda tidak berasal dari latar belakang teknis. Kami fokus pada kasus penggunaan nyata.
00:05:42Dan saya baru saja menambahkan kelas master Claude OS di sana juga. Jadi jika Anda seperti, hei, saya juga ingin
00:05:49belajar bagaimana mengintegrasikan hal-hal seperti Obsidian dan membuat pusat komando penuh. Ini adalah tempat untuk
00:05:54Anda. Anda dapat menemukan tautannya di komentar yang disematkan. Jadi untuk demo hari ini, kita akan menambahkan halaman baru
00:05:59ke situs web kita. Jadi ini adalah situs web untuk agensi AI saya. Dan halaman baru akan memberi orang
00:06:05akses ke beberapa keterampilan eksklusif. Dan untuk mendapatkan akses ke halaman ini, ketika mereka mengkliknya, mereka akan
00:06:11harus menambahkan email mereka. Jadi ini agak tertutup, kita mengambil email mereka, kemudian mereka memiliki akses ke
00:06:16hal-hal yang bisa mereka unduh. Sekarang email perlu ditangani dengan basis data kami, yang sudah ada.
00:06:22Jadi kita tidak hanya membuat fitur dari udara tipis, itu perlu melihat basis kode yang
00:06:27sudah ada dan membuatnya koheren. Jadi ini adalah prompt yang saya berikan kepada Claude Code: jalankan Grill Me Codex.
00:06:32Saya ingin menambahkan gerbang penangkapan email ke situs yang membuka keterampilan Claude Code Grill Me Codex.
00:06:38Jika pengunjung mendarat di halaman di mana unduhan keterampilan diburamkan di balik overlay,
00:06:42mereka memasukkan email mereka untuk membukanya dan email mereka disimpan. Dan kemudian saya memberikannya beberapa konteks tambahan.
00:06:49Jadi bagian pertama adalah keterampilan Grill Me. Ini adalah bagian Grill Me yang persis sama dengan
00:06:56punya Matt Pocock, yang kita bangun. Jadi bagian itu sama.
00:07:00Dan setelah kita melalui semua pertanyaan, Codex akan masuk. Jadi setelah saya melihat
00:07:03basis kode, sekarang ia menanyakan pertanyaan pertama dan berkata, seberapa nyata gerbang ini
00:07:07ketika sampai pada keburaman? Apakah itu hal kosmetik atau benar-benar akan ditegakkan?
00:07:11Dan sama seperti Grill Me, setiap kali ia menanyakan pertanyaan dan memberi Anda beberapa jawaban potensial,
00:07:16ia juga memberikan rekomendasinya dan alasannya. Jadi untuk yang satu ini, itu hanya akan bersifat kosmetik.
00:07:21Ini adalah keterampilan gratis. Tujuannya di sini hanya untuk menangkap email. Jadi kita hanya akan mengatakan,
00:07:25kosmetik tidak masalah. Filenya gratis kok. Selanjutnya ia bertanya tentang di mana aset akan berada
00:07:30dan dalam format apa. Dan sekali lagi, demi demo ini, saya hanya akan memilih opsi yang direkomendasikan.
00:07:36Dan saya tidak akan menunjukkan sisa pertanyaan ini karena ini tidak dimaksudkan untuk menjadi
00:07:40video Grill Me. Cukup pahami bahwa jika Anda belum pernah melihatnya sebelumnya, ini adalah irama umumnya.
00:07:44Ini akan menanyakan serangkaian pertanyaan, memberi Anda jawaban potensial dan rekomendasi.
00:07:48Sangat mirip dengan mode rencana, hanya mode rencana yang disempurnakan. Jadi Anda bisa lihat di sini,
00:07:51kita akhirnya melalui 10 pertanyaan di sisi Grill Me, dan kemudian kita beralih ke bagian Codex
00:07:56bagian. Sekarang bagian Codex akan membuat dua file markdown untuk kita. Kita memiliki plan.md
00:08:02dan kemudian log tinjauan rencana. Jadi plan.md adalah sumber kebenaran untuk apa yang akan kita buat.
00:08:10Ini adalah apa yang akan menjadi hasil akhir kita. Log tinjauan rencana.md, ini adalah di mana
00:08:16Claude Code dan Codex akan beraksi. Codex akan melihat plan.md yang asli dan
00:08:21melihat keseluruhan hal yang telah dibuat Claude Code. Dan di log tinjauan rencana itulah Codex
00:08:28akan mengatakan, hei, ini payah. Ini tidak, dll. Ini juga memberi kita log bolak-balik mereka
00:08:33melalui semua siklus. Dan di akhir bolak-balik dengan Codex dan Claude Code,
00:08:38kita akan memiliki plan.md yang diperbarui. Jadi plan.md adalah hasil akhir. Itulah yang akan dibangun dari segalanya.
00:08:46Log tinjauan rencana adalah bolak-balik dan di mana sosis benar-benar dibuat. Catatan lain
00:08:52selama tinjauan adversarial ini adalah bahwa meskipun tanpa kepala, kita masih memberi Codex ID sesi.
00:08:59Jadi bukannya ini benar-benar papan tulis kosong di bagian Codex pada iterasi satu versus iterasi
00:09:05dua versus iterasi tiga. Itu selalu memiliki ingatan tentang seluruh bolak-balik dengan Claude Code. Jadi kita
00:09:12bisa melihat di sini pada putaran satu, bahwa Codex menemukan 11 hal yang dianggapnya sebagai masalah. Dan kita juga
00:09:18bisa melihat bahwa Claude Code melanjutkan dan memperbarui plan.md berdasarkan temuan yang diterimanya dan dirasa
00:09:25valid. Pada putaran dua, ia menemukan empat temuan tambahan. Kita beralih dari 11 menjadi empat. Dan sekali lagi,
00:09:31rencana diperbarui. Dan di sini pada putaran tiga, kita melihat bahwa putusan sekarang disetujui. Pada titik inilah
00:09:35Codex dan Claude Code sekarang sepaham. Codex masih menandai beberapa hal,
00:09:40tapi itu hanya tiga hal kecil tingkat rendah. Jadi itu bukan penghambat. Dan itu ditegaskan kembali di sini di akhir
00:09:45di mana ia mengatakan disetujui putaran tiga dari lima memberi tahu kita seperti apa rencana akhir,
00:09:50apa yang dibeli dua tindakan untuk kita dan secara khusus dalam hal tindakan dua, yang merupakan putaran satu dan putaran
00:09:56dua dari Codex dan Claude Code beraksi. Anda tahu, kami menangkap celah keamanan dan kebenaran yang nyata.
00:10:01Ada unbounded client skill slug, pintasan dedupe peka huruf besar-kecil, tautan email relatif,
00:10:06vektor pengeboman daftar mentah dan batas laju pemindaian tabel. Dan di putaran kedua, ia menangkap perbaikan
00:10:12palsu. Jadi putaran satu Codex berkata, hei, ini masalahnya. Claude Code mencoba memperbaikinya. Dan pada
00:10:18iterasi kedua Codex seperti, itu bukan perbaikan nyata, kan? Jadi ia memperhatikan bahwa opt-in ganda
00:10:24diklaim, tetapi tidak terhubung, indeks dedupe ekspresi yang tidak bisa ditargetkan oleh Supabase JS
00:10:30dan away sebelum respons yang masih memblokir buka kunci dipindahkan ke setelah. Jadi hanya tiga putaran,
00:10:38tapi ini penghemat waktu yang luar biasa dibandingkan mencoba menjalankan rencana pertama. Claude Code datang dengan
00:10:44dan kemudian melalui seluruh proses pemecahan masalah. Pada akhirnya, ia juga mengangkat beberapa
00:10:49item terbuka, terutama seperti migrasi SQL dan semua itu. Tapi itu juga Claude Code yang malas karena ia bisa
00:10:54melakukannya sendiri. Jadi kembali ke situs web di atas, kita memiliki keterampilan gratis. Saya klik di atasnya. Sekarang ia
00:10:58meminta email saya. Dan keren. Sekarang saya memiliki keterampilan di sini yang bisa saya unduh dalam file .zip.
00:11:08Jelas dalam kenyataannya, apa yang sebenarnya ingin saya lakukan? Yah, saya mungkin ingin teks dan
00:11:12semuanya benar-benar cocok dengan sisa situs web, tapi Anda bisa melihat itu menciptakan apa yang kita tuju.
00:11:18Tujuan video ini bukan demo spesifiknya, tapi hanya untuk menunjukkan keterampilan ini beraksi. Adapun
00:11:23cara mendapatkan keterampilan ini sendiri, saya akan meletakkannya di komentar yang disematkan untuk memudahkan Anda.
00:11:27Tapi selain itu, itu cukup banyak yang saya miliki. Jelas hal-hal yang perlu Anda ketahui untuk ini adalah,
00:11:31hei, kita menggunakan Codex. Jadi Anda akan membutuhkan akun OpenAI. Anda akan membutuhkan Codex
00:11:35diunduh, yang relatif mudah dilakukan. Dan tidak ada alasan Anda memerlukan apa pun di luar
00:11:39$20 sebulan paket OpenAI untuk mendapatkan banyak manfaat dari ini. Sistem yang kita buat ini juga sesuatu
00:11:45yang bisa dengan mudah Anda tukar dengan semacam model lokal. Jadi jika Anda seperti, hei, saya tidak ingin
00:11:50membayar OpenAI $20 sebulan. Saya lebih suka menggunakan sesuatu seperti DeepSeq atau apa pun, model lokal atau lebih murah
00:11:55yang Anda miliki, sangat mudah dilakukan. Seperti tulangnya ada di sana. Saya hanya akan mengambil keterampilan yang saya buat,
00:12:00bawa ke dalam Claude Code dan katakan, hei, bisakah kita menukar Codex dengan masukkan model apa pun yang Anda coba
00:12:07gunakan? Itu benar-benar semudah itu. Ini sangat, sangat fleksibel. Jadi ada banyak yang bisa Anda lakukan dengan
00:12:12itu. Dan saya pikir tulangnya masuk akal bagi kita yang tidak menganggap diri kita
00:12:16sebagai pembuat kode ahli yang bisa melihat dengan cepat dan efisien pada apa yang telah dilakukan Claude Code dan berkata,
00:12:22ini masuk akal. Ini tidak. Itu hanya tidak ada dalam banyak keahlian orang,
00:12:26juga tidak perlu. Terus terang, kita memiliki alat yang bisa melakukan ini untuk kita. Jadi seperti biasa,
00:12:32beri tahu saya pendapat Anda. Pastikan untuk memeriksa Chase AI Plus jika Anda ingin mendapatkan tangan Anda
00:12:35di kelas master Claude Code,
00:12:37dan saya akan melihat Anda di sekitar.

Key Takeaway

Integrasi tinjauan kode adversarial melalui Codex ke dalam alur kerja Claude Code memastikan akurasi teknis dan keamanan dengan memverifikasi rencana proyek melalui proses iterasi timbal balik hingga disetujui.

Highlights

  • Claude Code dan alat orkestrasi seperti 'Grill Me' mengandalkan satu model untuk merencanakan, membangun, dan menilai kodenya sendiri, yang menciptakan risiko bias konfirmasi.

  • Tinjauan kode iteratif antara Claude Code dan Codex menambahkan lapisan adversarial yang mengidentifikasi celah keamanan dan logika yang tidak terdeteksi oleh satu model saja.

  • Proses tinjauan Codex melakukan hingga lima putaran bolak-balik untuk memastikan Claude Code memperbaiki temuan secara valid, bukan sekadar memberikan perbaikan palsu.

  • Implementasi gerbang penangkapan email menggunakan Claude Code melibatkan pemeriksaan basis kode yang sudah ada untuk memastikan koherensi fungsional.

  • Sistem ini menangkap masalah spesifik seperti vektor pengeboman daftar mentah, batas laju pemindaian tabel, dan pintasan dedupe yang peka huruf besar-kecil dalam tiga putaran iterasi.

Timeline

Masalah pada Model AI Tunggal

  • Mode rencana standar tidak cukup untuk menjamin kualitas kode optimal karena ketergantungan pada satu model AI.
  • Model AI sering menjadi narator dan evaluator yang tidak dapat diandalkan terhadap hasil kerjanya sendiri.

Pengembang sering kali terjebak karena mengandalkan satu model untuk merencanakan, membangun, dan menilai pekerjaannya. Model AI cenderung memberikan penilaian positif terhadap kode yang ditulisnya sendiri, sehingga pengguna non-teknis sulit memvalidasi kebenaran teknis dari hasil tersebut. Solusinya adalah menambahkan tinjauan kode adversarial yang melibatkan pihak ketiga yang netral untuk memverifikasi rencana kerja.

Implementasi Grill Me Codex

  • Grill Me dan Grill with Docs berfungsi sebagai fase perencanaan mendalam untuk memperbaiki artikulasi kebutuhan pengguna.
  • Proses tinjauan iteratif antara Claude Code dan Codex dilakukan maksimal lima putaran untuk mencapai konsensus rencana.

Keterampilan baru, yaitu Grill Me Codex dan Grill with Docs Codex, dikembangkan untuk memperdalam fase perencanaan. Setelah rencana dibuat, Codex berfungsi sebagai evaluator netral yang memberikan umpan balik pada file plan.md. Claude Code kemudian merevisi rencana berdasarkan temuan Codex, dan proses ini berulang hingga kedua alat AI memberikan persetujuan.

Demo: Pembuatan Fitur Gerbang Email

  • Pengembangan fitur gerbang penangkapan email dilakukan dengan memeriksa basis kode yang sudah ada untuk menjaga koherensi.
  • Hasil tinjauan disimpan dalam log tinjauan rencana.md yang mencatat setiap iterasi perbaikan antara dua model AI.

Demo menunjukkan penambahan fitur gerbang penangkapan email pada situs web agensi AI. Proses dimulai dengan menjalankan Grill Me Codex untuk menyusun rencana, diikuti oleh tinjauan Codex yang mengidentifikasi 11 masalah pada putaran pertama, 4 masalah pada putaran kedua, dan mencapai persetujuan pada putaran ketiga. Log tinjauan mendokumentasikan setiap siklus, termasuk perbaikan celah keamanan kritis.

Fleksibilitas dan Rekomendasi Teknis

  • Sistem ini sangat fleksibel dan memungkinkan penggunaan model lokal seperti DeepSeek sebagai pengganti OpenAI.
  • Proses ini secara signifikan menghemat waktu dibandingkan dengan upaya memvalidasi rencana secara manual oleh pengembang non-ahli.

Metode ini bersifat fleksibel karena Codex dapat diganti dengan model lain, termasuk model lokal yang lebih murah atau gratis. Penggunaan sistem ini memberikan kepastian bagi pengembang non-ahli bahwa hasil akhirnya masuk akal dan aman, tanpa harus memiliki keahlian rekayasa perangkat lunak yang mendalam.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video