Codex Baru Saja Menjadi Harness Agen Jangka Panjang TERBAIK

Bahasa Indonesiaالعربية Deutsch English Español Français हिन्दी 日本語 한국어 Português Русский 中文

컴퓨터/소프트웨어게임/e스포츠AI/미래기술

Transcript

00:00:00Codex mungkin mengalahkan Claude Code di sini dengan perilisan fitur “Goals” eksperimental baru

00:00:05Codex kini menjadi cara termudah untuk menjalankan tugas pengodean otonom yang berjalan lama tanpa

00:00:10perlu menyertakan lapisan orkestrasi tambahan. Goals bertindak seperti loop Ralph

00:00:15terintegrasi yang lebih canggih. Anda memberinya semacam tujuan dan ia akan bekerja

00:00:19selama berjam-jam untuk menyelesaikan masalah itu tanpa Anda perlu campur tangan sama sekali.

00:00:25Dan hari ini saya akan menunjukkan cara kerjanya, cara menyiapkannya, dan kita akan melakukan

00:00:29demo nyata agar Anda bisa melihatnya beraksi. Hari ini kita akan membuat Rift Salvage, video game

00:00:35pertempuran 2D yang menggunakan aset asli sepenuhnya dan kita bangun sepenuhnya melalui fitur Goals.

00:00:42Fitur Goals adalah salah satu pembeda nyata dengan Codex saat ini dan sangat mudah digunakan.

00:00:47kita bicara soal perintah 'slash' tunggal, jadi ada banyak nilai di sini. Jadi, baik

00:00:51Anda menggunakan aplikasi desktop Codex atau Codex CLI, Anda harus mengaktifkan Goals karena ini adalah

00:00:56fitur eksperimental. Sekarang Anda bisa meminta Codex melakukannya atau Anda bisa melakukannya sendiri dengan cepat.

00:01:01Di dalam aplikasi Codex, saya akan pergi ke Settings lalu saya akan pergi ke Configuration.

00:01:07Tepat di sini yang bertuliskan “open config.toml”, saya akan mengkliknya. Saya akan membukanya di VS Code.

00:01:15Dan di bagian bawah sini Anda perlu menambahkan dua baris jika belum ada: features dan goals sama dengan true.

00:01:22Itu saja. Hanya butuh dua detik. Jika itu terlalu rumit, Anda juga bisa memberi tahu Codex,

00:01:27“hei, bisakah aktifkan Goals untukku?” Jadi features goals = true, itu saja. Sekarang untuk menggunakan Goals,

00:01:35di dalam aplikasi desktop dan CLI, Anda cukup mengetikkan /goal. Sekarang karena alasan tertentu,

00:01:40saya rasa karena ini baru dan eksperimental, saat Anda melakukan /goal, Anda tidak akan

00:01:43mendapatkan notifikasi apa pun bahwa ini sedang bekerja, namun Anda akan melihat setelah kita memberi prompt yang tepat

00:01:48bahwa kita akan mendapatkan lencana kecil sehingga kita tahu Goal sedang bekerja. Jadi jika Anda mengaktifkannya,

00:01:53pastikan Anda mereset Claude Code setelah itu untuk memastikan perubahannya diterapkan. Tapi saat Anda mengetik

00:01:58/goal, Anda tidak akan melihat apa pun seperti yang biasanya Anda lihat, misalnya jika Anda melakukan skill atau

00:02:02sesuatu di mana Anda mendapatkan umpan balik yang semestinya bahwa itu bekerja. Tapi ini bagus.

00:02:08Sebelum kita mendemokan Goal di dalam aplikasi, izinkan saya menjelaskan cara kerjanya di balik layar.

00:02:13Tapi pertama-tama, sepatah kata dari sponsor hari ini: saya sendiri. Jadi, seperti yang Anda tahu di Chase AI Plus,

00:02:18saya punya Claude Code Master Class, tapi saya juga baru saja merilis Codex Master Class. Jadi sekarang Anda punya dua alat

00:02:24yang bisa membantu Anda dari nol menjadi pengembang AI. Dan ini adalah tempat terbaik untuk belajar

00:02:29karena saya berasumsi Anda tidak punya pengetahuan teknis dan kita fokus pada kasus penggunaan nyata. Jadi jika Anda ingin mencobanya

00:02:34atau ingin mendengarkan webinar gratis saya dalam beberapa hari ke depan, tautannya akan ada di

00:02:40komentar yang disematkan. Sampai jumpa di sana. Jadi seperti yang saya katakan, Codex Goals pada dasarnya

00:02:46adalah loop Ralph terintegrasi yang lebih canggih. Apa itu loop Ralph? Mari kita

00:02:51tinjau sejenak bagi Anda yang lupa. Pada intinya, loop Ralph jika kita menggunakannya di

00:02:57sesuatu seperti Claude Code hanyalah satu baris kode. Itu hanya loop bash, persis seperti yang Anda lihat

00:03:03tepat di sini. Idenya adalah saya menjalankan baris kode ini dan apa yang akan terjadi adalah ia akan menjalankan

00:03:09Claude Code atau Codex atau sistem AI apa pun, dan ia akan melihat file prompt.md.

00:03:16Prompt ini akan mengatakan, “hei, inilah yang ingin kita lakukan, inilah cara saya ingin melakukannya, ngomong-ngomong

00:03:21inilah kriteria yang akan menganggapnya selesai”. Dalam contoh ini kita ingin meningkatkan cakupan pada

00:03:28file autentikasi, yang berarti kita perlu membuat lebih banyak pengujian dan kita akan berhenti saat cakupan

00:03:33mencapai 75%. Jadi itulah tujuan akhirnya. Cara kerjanya adalah Anda memulai loop ini dan kemudian

00:03:41loop tersebut melihat prompt-nya lalu menyuntikkannya ke sesi AI. Sesi tersebut berjalan satu

00:03:48putaran; ia membaca prompt-nya dan juga membaca file state.md. File state pada dasarnya adalah

00:03:56ia lihat untuk mengatakan, “oke, jika kita punya tugas satu, dua, dan tiga, apa yang sudah kita lakukan sejauh ini dan apakah

00:04:03itu berhasil?” Katakanlah beberapa putaran pertama ia menyelesaikan tugas satu, lalu putaran berikutnya ia akan

00:04:10melihat file state dan berkata, “tugas dua belum selesai, tebak apa yang akan kita lakukan di

00:04:14sesi ini atau kita akan melakukan sesi dua”. Mungkin itu tidak berhasil di putaran pertama, ia berkata

00:04:18“ini yang saya coba selanjutnya”, dan seterusnya, sampai semua tugas selesai. Jadi setelah agen itu

00:04:25menjalankan gilirannya, ia memperbarui file, putaran berakhir, dan loop berlanjut. Jadi Anda mendapatkan semacam

00:04:30loop berkelanjutan di mana ia terus-menerus memeriksa beberapa file berbeda untuk melihat apa yang sudah dilakukan,

00:04:35apa yang perlu dilakukan, apa kondisi akhirnya, dan akhirnya setelah mencapai kriteria penyelesaian,

00:04:41ia berkata, “hei, kita sudah selesai”. Semuanya otonom, itulah ide dari loop Ralph. Sekarang jika Anda ingin loop Ralph

00:04:48melakukan lebih banyak hal, diperlukan scaffolding tambahan, hal-hal seperti penagihan,

00:04:53apa yang Anda lakukan, apakah ada penggunaan token yang cerdas? Tidak tentu. Apa yang terjadi jika sistem mati,

00:04:58agennya macet, atau Anda menekan control C? Bagaimana ia tahu itu benar-benar selesai? Apakah ada

00:05:02pihak ketiga bawaan yang memverifikasi semuanya sudah beres? Tidak juga, karena pada intinya ia hanya

00:05:08satu baris kode. Sekarang bandingkan dengan Goals. Goals secara garis besar bekerja dengan cara yang sama. Kita memintanya

00:05:15melakukan sesuatu, ia punya gambaran tentang cara melakukannya, dan ia terus memperbarui file internal yang mengatakan

00:05:19“inilah yang sudah saya lakukan, inilah yang masih perlu kita lakukan”, dan mencoba mencapai kondisi akhir itu. Jadi secara

00:05:23garis besar hampir sama. Namun ada beberapa perbedaan. Pertama-tama, kita punya dua

00:05:29file markdown yang pada dasarnya tidak terlihat oleh Anda: continuation dan budget limit. Apa

00:05:35fungsi kedua hal ini? Hal-hal ini memungkinkan Codex bertindak dengan cara berbeda jika Anda

00:05:40hampir melampaui batas penggunaan, yang mana ini penting. Jadi sebenarnya ada semacam

00:05:46penghentian yang mulus untuk cara sistem Anda menangani tugas dalam loop Goals dibandingkan loop Ralph. Loop Ralph,

00:05:52begitu anggaran habis, selesai. Codex tidak harus begitu. Ia akan memikirkan cara yang baik untuk

00:05:57membawa Anda ke titik yang bisa Anda kerjakan nanti. Kenyataannya adalah Codex menjalankan

00:06:03gilirannya dalam loop Goals atau loop Ralph, bagaimana pun Anda ingin memikirkannya. Dan saat mencapai akhir

00:06:08putaran, ia memiliki empat jalur yang bisa diambil: satu, jika masih ada pekerjaan dan anggaran masih cukup,

00:06:13kita akan terus lanjut. Dua, jika kita mendekati batas token, apa yang akan dilakukan adalah

00:06:19ia akan memasukkan file budget limit.md dan pada dasarnya mengakhiri putaran dengan mulus

00:06:25dan memberi Anda laporan akhir tentang apa yang sudah dilakukan dan apa yang perlu dilakukan selanjutnya jika Anda

00:06:29memperbarui limit Anda. Jika kita sudah menyelesaikan proyek, ia akan melakukan panggilan alat update goal.

00:06:34Ia akan mengubah statusnya, memastikan semua hasil kerja diaudit, dan jika

00:06:39semuanya oke, maka goal selesai. Terakhir, kita punya cara untuk menjeda goal,

00:06:45mengedit goal, menangani kegagalan. Jadi jika ada yang salah saat kita melakukan loop,

00:06:49ini tidak seperti loop Ralph tradisional di mana kita akan pasrah. Jadi sedikit lebih

00:06:54canggih dari loop Ralph, sangat mirip secara garis besar, dan kita tidak perlu melakukan

00:06:59orkestrasi tambahan. Seluruh hal ini harusnya terdengar familiar bagi Anda jika pernah bekerja dengan

00:07:05sesuatu seperti GSD atau GSD Superpowers. Semua alat ini adalah lapisan orkestrasi yang berada di atas Claude Code untuk

00:07:11melakukan apa yang kita lakukan dengan satu perintah slash di dalam Codex dengan Goals. Dan karena ini

00:07:18benar-benar hanya satu perintah slash, itu membuatnya sangat mudah dijalankan. Anda tidak perlu menonton

00:07:24demo 40 menit tentang semua seluk-beluk GSD, Anda cukup melakukan /goal dan Codex akan

00:07:30mulai bekerja. Dengan pemikiran itu, mari kita uji. Pertama-tama, kita

00:07:35akan menempatkannya dalam mode perencanaan karena kita bisa beralih dari mode perencanaan ke Goals dengan sangat mudah.

00:07:39Dan kita akan memintanya membuat game survival arcade top-down untuk kita, dan kita

00:07:44akan memintanya membuat semua asetnya sendiri. Hal keren tentang Codex dibandingkan sesuatu seperti

00:07:49Claude Code misalnya adalah karena ini produk OpenAI, kita punya akses ke gambar GPT

00:07:56juga. Jadi ia akan membuat semua asetnya sendiri untuk game ini. Saya ingin sprite drone pemain,

00:08:01saya ingin tiga musuh, saya ingin makhluk bos, inti energi, ranjau bahaya, latar belakang, lencana ke UI,

00:08:07aset dekorasi. Jadi saya memintanya membuat cukup banyak. Oke, jadi promptnya relatif canggih

00:08:15karena ini bisa berlangsung lama, saya seharusnya sudah menunjukkan tangkapan layarnya,

00:08:18orang yang bilang, “saya menjalankannya selama 50 jam berturut-turut”. Entah apakah 50 jam

00:08:23berturut-turut benar-benar cara terbaik, tapi idenya adalah kita punya gagasan awal, kita masuk ke mode rencana,

00:08:31kita mendapatkan sesuatu yang sangat ketat. Dan yang sangat penting dengan sesuatu seperti ini adalah Anda

00:08:36perlu sangat spesifik tentang hasil akhirnya. Karena jika kita tidak punya

00:08:43hasil akhir yang sangat spesifik untuk dibidik sebagai serangkaian hal yang dapat diukur yang harus dipenuhi agar

00:08:50ia menyelesaikan loop, Anda akan mendapatkan hasil yang biasa-biasa saja atau mungkin

00:08:55setengah matang. Jadi saya sangat menyarankan Anda melalui mode rencana dan meluangkan waktu untuk benar-benar menyusun

00:09:02rencana tersebut dan jangan cuma bilang “/goal buatkan saya produk SaaS yang menghasilkan satu miliar dolar”. Dan inilah

00:09:07rencana untuk game kita. Dan terkait verifikasi, inilah yang akan ia

00:09:12lihat. Inilah yang sebenarnya akan ia uji sebelum ia mengatakan bahwa semuanya selesai. Jelas ia harus

00:09:17menjalankan npm run build dan memperbaiki semua error, memulai server dev dan memberikan URL lokal, menambahkan dan

00:09:24menjalankan skrip verifikasi Playwright otomatis yang membuka aplikasi, mengonfirmasi semuanya dimuat,

00:09:29memeriksa kanvas tidak kosong, mensimulasikan gerakan keyboard, mensimulasikan kejadian koleksi, memaksa kerusakan,

00:09:34mengonfirmasi perubahan kesehatan, kondisi menang bos, UI, dan seterusnya. Jadi inilah yang benar-benar Anda ingin

00:09:39perhatikan. Jika Anda melihat verifikasinya dan berkata, “hei, jika semua itu

00:09:44selesai saya akan senang”, maka Anda siap untuk melangkah maju. Sekarang saat ia mengatakan implementasikan rencana,

00:09:49Anda akan ingin pergi ke - tidak, saya akan memberitahu Anda apa yang harus dilakukan. Anda bisa lakukan /goal, gunakan goal

00:09:54untuk mengimplementasikan rencana ini dan kita akan mengirimkannya. Dan tepat di atas sini apa yang Anda lihat? Anda punya

00:10:02lencana kecil ini yang bertuliskan “goal”. Jadi sekarang saya tahu kita sedang menjalankan goal dan itu tertulis di sini juga.

00:10:09Seperti yang saya katakan sebelumnya, saat Anda melakukan /goal, Anda tidak akan mendapatkan perintah apa pun tetapi ini

00:10:12berfungsi. Saya rasa itu hanya semacam bug UI karena ini adalah fitur eksperimental. Jadi tertulis ini

00:10:17masih dalam mode rencana. Jadi kita akan batalkan goal itu. Gunakan goal untuk mengimplementasikan rencana ini. Sedikit kurang

00:10:28rapi di beberapa bagian tetapi mari kita lihat apa yang sebenarnya ia lakukan untuk kita. Idenya adalah sekarang saya benar-benar lepas tangan,

00:10:34ia akan menjalankan loop Ralph kecilnya, hal goal kecilnya, dan pada akhirnya kita

00:10:39akan mendapatkan produk akhir. Ini sudah berjalan sekitar 12 menit sekarang dan Anda bisa melihat ia

00:10:43sudah dalam proses pembuatan semua aset yang berbeda menggunakan model pembuat gambar gen 2

00:10:49yang mana cukup keren. Dan lagi, hal menyenangkan lainnya adalah saat Anda menggunakan aplikasi desktop dibandingkan

00:10:54sekadar mengetik di terminal mentah, semua ini disajikan kepada Anda secara langsung yang mana sangat bagus.

00:11:00Saya pribadi sangat terkesan dengan aplikasi desktop Codex. Bukan berarti saya tidak

00:11:06lagi menyukai Claude Code. Saya rasa saya menggunakan kedua alat ini secara bergantian. Anda bisa menonton video terakhir saya

00:11:11untuk seluruh pendapat saya tentang itu di mana saya pikir gagasan bahwa kita perlu memilih di antara dua alat ini agak konyol.

00:11:15Kenapa kita tidak menggunakan keduanya dan bahkan keduanya secara bersamaan? Namun dengan Claude Code saya

00:11:20benar-benar murni terminal, tetapi dengan Codex saya sangat menikmati aplikasi desktopnya, dan sebagian dari itu mungkin

00:11:26karena itu perubahan suasana yang menyenangkan terkadang daripada selalu berada di terminal sepanjang

00:11:32waktu. Sejauh ini saya sangat menyukainya. Jadi setelah sekitar 30 menit ia bilang sudah selesai dan sebenarnya ia

00:11:38menyelesaikannya lebih cepat dari yang saya duga. Jadi mari kita lihat bagaimana hasilnya pada percobaan pertama dan karena

00:11:44ia melakukannya begitu cepat saya mungkin akan memintanya melakukan beberapa hal di akhir. Dikatakan ia mengimplementasikan

00:11:49Rift Salvage. Server dev lokal berjalan di sini. Ini game kanvas dengan kontrol keyboard sentuh, memunculkan

00:11:56musuh, ranjau, skor, perisai, bos, menang, kalah, jeda, dan mulai ulang. 11 aset bitmap buatan

00:12:03gambar dengan potongan alfa, verifikasi Playwright otomatis, lalu menunjukkan kepada kita semua hal yang ia bangun

00:12:10yang mana cukup keren. Mari kita lihat apakah ini berfungsi dan apa yang bisa kita tambahkan untuk sedikit mendorongnya

00:12:17lebih jauh lagi. Oh mari kita coba di browser sungguhan. Oke, jadi saya punya layar pemuatan

00:12:27dan kontrasnya agak rendah, agak sulit dilihat, mungkin agak sulit bagi Anda untuk melihatnya tetapi

00:12:32saya punya kapal ruang angkasa kecil saya. Itu ranjau, saya rasa saya seharusnya mengambil hal-hal ini

00:12:39saat ia memunculkan musuh yang mengejar saya. Jadi ini berfungsi, terlihat cukup keren, saya rasa kita

00:12:49mungkin bisa memperbaiki grafisnya sedikit tetapi cukup rapi bahwa semua yang ada di sini dibuat

00:12:56sebagai gambar unik. Saya rasa apa yang bisa kita lakukan adalah kita bisa menambahkan - pertama-tama saya ingin melihat seperti apa

00:13:00pertarungan bosnya jika kita bisa mempercepatnya dan juga menambahkan semacam

00:13:04sistem penembakan baik dengan laser atau sesuatu yang keren seperti itu. Jadi mari kita lakukan

00:13:11itu. Mari kita minta ia melakukannya sebelum kita menunggu lebih lama lagi. Jadi saya akan memasukkannya ke mode bermain

00:13:15dan melihat apakah kita bisa membuatnya bekerja lebih keras lagi. Oke, saya rasa itu tadi percobaan pertama yang cukup bagus,

00:13:19semuanya berfungsi tetapi saya ingin membuatnya sedikit lebih rumit. Bisakah kita tambahkan semacam

00:13:24sistem tempur baik itu seperti laser yang menembak ke musuh yang berbeda dan mereka

00:13:31menembak balik ke kita. Bisakah kita juga membuat fase bos datang sedikit lebih cepat atau menyertakan semacam

00:13:37tombol yang bisa saya tekan untuk memulai fase bos? Bisakah kita juga mengubah kontrasnya sedikit

00:13:42karena saat ini semuanya menyatu dengan latar belakang dan jika Anda punya ide lain

00:13:49untuk sekadar membuat ini sedikit lebih rumit dan mendorong Anda ke batas kemampuan Anda,

00:13:53tunjukkan ide-ide itu kepada saya. Jadi inilah rencana yang ia hasilkan. Sekarang satu hal yang perlu Anda ketahui saat

00:13:58menggunakan sistem Goals, setiap eksekusi goal terikat pada utas atau sesi yang sedang Anda gunakan pada saat

00:14:07itu. Kita sudah berada di chat yang sama yang berarti kita berada di utas goal yang sama. Jika saya ingin melakukannya

00:14:12lagi, saya ingin melakukan eksekusi goal kedua pada proyek yang sama, kita bisa melakukannya tetapi kita harus melakukannya di

00:14:18utas kedua atau chat kedua, seperti membuka terminal lain. Jadi yang akan saya lakukan adalah menyalin

00:14:24rencana ini, saya akan membuka chat lain dan kita akan melakukan /goal dan kita akan

00:14:33menempelkannya di sana. Jadi setelah 15 menit kita menyelesaikan eksekusi goal kedua. Jadi ia mengimplementasikan

00:14:40peningkatan tempur. Mari kita lihat seperti apa game ini sekarang. Jadi inilah layar pemuatannya lagi, sangat mirip

00:14:44dengan apa yang kita lihat pertama kali kecuali ia menambahkan beberapa semacam widget di atas sini. Jadi kita punya target

00:14:50kombo serta sinyal bos sekarang. Jadi jika kita meluncurkannya, saya bisa langsung menembakkan

00:14:56senjata saya, musuh-musuhnya bisa menembak balik dan mereka punya semacam poin nyawa. Saya juga bisa

00:15:01menekan sinyal bos. Jadi itulah bosnya. Terlihat sangat keren sebenarnya. Saya rasa hal paling keren

00:15:09tentang game ini dan apa yang ia lakukan adalah semua aset uniknya. Fakta bahwa semuanya adalah

00:15:13aset asli dan ia melakukan semua ini menggunakan gambar gen 2 yang menurut saya

00:15:19keren sekali. Dan saya tahu jelas ini hanya memakan waktu sekitar 45 menit total di antara dua eksekusi dan kita melihat

00:15:24beberapa orang melakukan eksekusi selama tiga hari dari tangkapan layar mereka, tetapi saya rasa bagian terbaik

00:15:30dari ini adalah betapa sederhananya menjalankan goal tersebut. Anda cukup memberinya sebuah goal

00:15:36dan ia akan bekerja keras asalkan Anda punya kriteria yang pasti. Apakah kita menang? Saya tidak tahu apakah kita

00:15:43mati atau tidak. Tetapi seperti yang saya katakan, hal keren tentang ini dan tentang Goals secara umum adalah

00:15:48ide bahwa jika Anda punya tujuan utama yang jelas dan kriteria yang jelas tentang seperti apa keberhasilan itu,

00:15:54Anda bisa mendapatkan banyak manfaat dari ini dan ini bisa berjalan selamanya. Jadi alih-alih harus mengatur

00:15:59loop Ralph sendiri dan scaffolding sendiri atau menggunakan sesuatu di luar sebagai lapisan

00:16:05orkestrasi seperti GSD atau Superpowers, ini sudah tertanam untuk Anda. Dan seperti yang kita lakukan di sini,

00:16:10Anda bisa menambahkan banyak hal rapi yang lebih sulit diimplementasikan, tetapi Anda bisa di dalam Claude Code seperti

00:16:15jika kita menggunakan Claude Code untuk ini kita pasti bisa melakukannya, kita hanya perlu

00:16:18mengimplementasikan sesuatu seperti Higgsfield CLI atau Higgsfield MCP untuk melakukan semua pembuatan gambar itu

00:16:24untuk kita daripada ini menjadi satu sistem holistik yang terintegrasi. Jadi saya harap Anda bisa

00:16:31mendapatkan sesuatu dari video ini dan saya sangat menyarankan Anda mencoba Codex. Saya sangat menikmati

00:16:35aplikasi desktopnya seperti yang saya bicarakan sebelumnya. Saya rasa fitur Goals ini benar-benar keren dan lagi,

00:16:40kita juga bisa melakukan ini bersamaan dengan Claude Code. Kita bisa membuat rencananya di

00:16:44Claude Code lalu memasukkannya ke Codex untuk Goals, meminta Claude Code melihat pekerjaan apa yang

00:16:49telah dilakukan dan melakukan komunikasi timbal balik, yang menurut saya di situlah Anda mendapatkan nilai maksimal.

00:16:53Ini seperti keseluruhan yang lebih besar daripada jumlah bagian-bagiannya. Jadi seperti biasa, beri tahu saya

00:17:02apa pendapat Anda, pastikan untuk memeriksa Chase AI Plus, ada tautan untuk itu di bawah di

00:17:07komentar yang disematkan. Saya juga mengadakan webinar dalam beberapa hari ke depan, akan ada tautannya juga di sana. Sampai jumpa.

00:17:12Dan selain itu, sampai bertemu lagi.

Key Takeaway

Fitur eksperimental Goals pada Codex mengotomatiskan pengembangan aplikasi dari nol hingga tahap verifikasi melalui loop agen otonom yang terintegrasi, menghilangkan kebutuhan akan alat orkestrasi pihak ketiga seperti GSD.

Highlights

Fitur Goals pada Codex memungkinkan pelaksanaan tugas pemrograman otonom dalam durasi panjang tanpa memerlukan lapisan orkestrasi tambahan.
Aktivasi fitur eksperimental ini dilakukan dengan menambahkan baris 'features goals = true' ke dalam file config.toml.
Codex Goals bertindak sebagai loop Ralph terintegrasi yang lebih canggih dengan manajemen anggaran token dan penghentian sistem yang halus.
Penggunaan perintah tunggal /goal mengotomatiskan seluruh siklus pengembangan, mulai dari perencanaan hingga verifikasi otomatis menggunakan Playwright.
Integrasi model DALL-E gen 2 di dalam Codex memungkinkan pembuatan aset visual asli seperti sprite game 2D secara otomatis selama proses pemrograman.
Proyek demo Rift Salvage menghasilkan game pertempuran 2D fungsional dengan 11 aset bitmap unik dalam total waktu eksekusi sekitar 45 menit.

Timeline

Pengenalan Fitur Goals dan Perbandingannya dengan Claude Code

Goals merupakan fitur eksperimental baru yang memosisikan Codex sebagai cara termudah untuk menjalankan tugas pengodean otonom.
Sistem ini bekerja seperti loop Ralph terintegrasi yang menangani tugas selama berjam-jam tanpa intervensi manusia.
Akses ke fitur ini hanya memerlukan satu perintah slash tunggal setelah konfigurasi awal selesai.

Fitur ini memberikan keunggulan kompetitif dibandingkan Claude Code dengan menyederhanakan proses orkestrasi agen. Pengguna cukup memberikan tujuan akhir, dan sistem akan mengelola siklus kerja secara mandiri. Hal ini mengurangi kompleksitas teknis yang biasanya menyertai penggunaan agen AI jangka panjang.

Prosedur Aktivasi dan Konfigurasi Teknis

Aktivasi Goals dilakukan melalui menu Settings dan Configuration pada aplikasi desktop Codex.
Penambahan baris kode 'features goals = true' ke dalam file config.toml diperlukan untuk mengaktifkan fungsionalitas eksperimental ini.
Indikator visual berupa lencana 'goal' akan muncul saat perintah /goal sedang diproses secara aktif.

Proses pengaturan dirancang sangat singkat, hanya membutuhkan waktu sekitar dua detik di dalam VS Code. Meskipun antarmuka pengguna mungkin tidak segera memberikan notifikasi saat perintah dijalankan, keberadaan lencana khusus memastikan bahwa agen sedang bekerja. Restart aplikasi diperlukan agar perubahan konfigurasi diterapkan secara sempurna.

Mekanisme Internal Loop Ralph dan Keunggulan Goals

Loop Ralph tradisional bekerja dengan memantau file prompt.md dan state.md untuk menentukan status penyelesaian tugas.
Codex Goals menggunakan mekanisme 'continuation' dan 'budget limit' yang tidak terlihat untuk mencegah kegagalan mendadak saat anggaran token habis.
Sistem memiliki empat jalur pengambilan keputusan berdasarkan sisa pekerjaan, batas token, penyelesaian proyek, atau kegagalan teknis.

Berbeda dengan loop bash sederhana yang berhenti total saat mencapai batas, Codex Goals melakukan penghentian yang mulus dan memberikan laporan akhir. Sistem ini melakukan audit pada setiap hasil kerja sebelum mengubah status menjadi selesai. Kemampuan ini menggantikan lapisan orkestrasi eksternal yang kompleks seperti GSD atau Superpowers.

Demo Pengembangan Game Rift Salvage

Penggunaan mode perencanaan (plan mode) sangat penting untuk menetapkan kriteria keberhasilan yang dapat diukur sebelum menjalankan loop otonom.
Codex memanfaatkan model OpenAI gen 2 untuk menghasilkan aset gambar seperti drone pemain, musuh, dan latar belakang secara otomatis.
Siklus pengembangan pertama menghasilkan game fungsional dalam waktu 30 menit, lengkap dengan server pengembangan lokal dan skrip verifikasi Playwright.

Spesifikasi hasil akhir yang ketat mencegah agen menghasilkan produk yang tidak matang atau biasa-biasa saja. Seluruh aset game dibuat sebagai gambar unik dengan potongan alfa, yang merupakan keunggulan integrasi ekosistem OpenAI. Verifikasi otomatis memastikan bahwa kontrol keyboard, deteksi tabrakan, dan UI berfungsi sebelum agen melaporkan tugas selesai.

Iterasi Tempur dan Integrasi Multi-Alat

Setiap eksekusi goal terikat pada satu utas sesi, sehingga iterasi tambahan sebaiknya dilakukan pada chat baru untuk menjaga kebersihan proyek.
Penambahan sistem tempur laser, fase bos yang dipercepat, dan perbaikan kontras UI diselesaikan dalam eksekusi kedua selama 15 menit.
Nilai maksimal pengembangan AI dicapai dengan menggabungkan kekuatan perencanaan Claude Code dan kemampuan eksekusi otonom Codex Goals.

Iterasi kedua menambahkan widget UI baru seperti target kombo dan sinyal bos untuk meningkatkan kompleksitas permainan. Penggunaan kedua alat secara bersamaan memungkinkan komunikasi timbal balik di mana satu AI meninjau pekerjaan AI lainnya. Hasil akhirnya adalah sistem holistik yang mampu membangun produk kompleks dengan input minimal dari pengguna.

Community Posts

Write about this video