Claude Code Baru Saja Mendapat Peningkatan Otak yang Terinspirasi dari Beads

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Tim Claude Code baru saja meningkatkan fitur 'do's' menjadi 'tasks', sebuah kabar besar karena
00:00:05artinya setiap tugas kini punya file JSON sendiri yang bisa diperbarui dan di-commit ke GitHub.
00:00:11Tugas-tugas ini bisa berjalan paralel dengan sub-agen, dan beberapa sesi Claude Code bisa berbagi
00:00:16daftar tugas yang sama.
00:00:17Sangat cocok untuk proyek kompleks yang punya banyak tugas dan butuh banyak sesi.
00:00:22Tapi apa dampaknya bagi loop Ralph Wiggum yang sangat populer itu?
00:00:26Apakah ini membuatnya jadi ketinggalan zaman?
00:00:28Tidak juga.
00:00:29Subscribe dulu, mari kita bahas lebih dalam.
00:00:32Opus 4.5 mengubah segalanya dalam banyak aspek.
00:00:35Satu hal yang bisa dilakukannya dan mungkin belum Anda tahu adalah kemampuannya berjalan mandiri
00:00:39jauh lebih lama, sambil melacak statusnya dengan lebih baik dibanding model lainnya.
00:00:44Artinya, daftar tugas klasik yang biasa Anda lihat di Claude Code sebelumnya sudah hampir
00:00:48tidak diperlukan lagi untuk tugas-tugas kecil.
00:00:50Namun untuk tugas yang lebih panjang, ia masih punya context window 200k, yang berarti ada 'zona pintar' dan
00:00:56'zona bodoh', jadi ia akan memberikan hasil yang kurang akurat setelah melewati batas 80%.
00:01:02Tonton video Ralph Wiggum saya untuk belajar lebih lanjut tentang area pintar dan bodoh pada model
00:01:07berdasarkan konteksnya.
00:01:08Nah, pada tahap ini Anda mungkin akan menggunakan alat seperti Beads yang menyimpan tugas di dalam basis data
00:01:14SQLite dan memasukkannya ke file JSONL untuk dikelola dengan version control.
00:01:19Alat Beads inilah yang sangat menginspirasi tim Claude Code untuk meningkatkan to-do mereka ke
00:01:24sistem manajemen tugas baru ini, yang melakukan banyak hal mulai dari menyimpan tugas di file JSON
00:01:30hingga memungkinkan Anda menjalankannya di beberapa sesi dan banyak lagi.
00:01:34Tapi secanggih apa pun peningkatan ini, cara kerjanya sedikit berbeda dari Beads dan Ralph Wiggum.
00:01:39Biar saya tunjukkan.
00:01:41Jadi ini adalah file rencana yang ditulis oleh Claude Code, berisi tiga perubahan utama yang ingin saya
00:01:46tambahkan ke alat bernama XDL untuk membantu Anda mengunduh video dari X atau Twitter lewat CLI.
00:01:54Dan agar fitur tugas ini berfungsi, Anda harus menggunakan Claude Code versi 2.1.6 atau lebih tinggi yang berisi
00:02:00alat-alat terkait manajemen tugas ini.
00:02:03Jadi, saya akan meminta Claude untuk mengubah file rencana tersebut menjadi serangkaian tugas yang harus diselesaikan.
00:02:08Bisa Anda lihat di sini, ia telah membuat tugas-tugasnya, menambahkan beberapa dependensi untuk tugas yang
00:02:13terhambat oleh tugas lain, dan menampilkannya di sini dengan menyorot warna kuning pada tugas-tugas
00:02:18yang menghambat tugas tertentu tersebut.
00:02:20Jika kita buka direktori .claud di root mesin kita, kita bisa melihat folder 'tasks'
00:02:26dengan folder lain untuk proyek kita.
00:02:29Dan saat dibuka, kita bisa melihat semua tugas yang telah dibuat lengkap dengan ID, subjek, deskripsi,
00:02:36tugas apa yang menghambat tugas ini, serta semua tugas yang terhambat oleh tugas ini.
00:02:41Sekarang kita akan meminta Claude untuk menjalankan setiap tugas dalam sebuah sub-agen, yang sudah mulai
00:02:45ia kerjakan.
00:02:46Jadi tugas 1 sedang dikerjakan, begitu juga tugas 8, 9, dan 10 karena mereka tidak terhambat oleh
00:02:52tugas lainnya.
00:02:53Kita juga bisa melihat di bagian atas, berbagai sub-agen sedang mengerjakan tugas yang berbeda-beda.
00:02:57Dan setelah semua tugas selesai, saya bisa memeriksa berapa banyak konteks yang digunakan, dan kita
00:03:01bisa lihat hanya 18% yang terpakai karena semua tugas diselesaikan di sub-agen.
00:03:06Tapi ada hal lain yang bisa Anda lakukan dengan sistem manajemen tugas baru ini.
00:03:09Jika saya ingin menjalankan beberapa sesi Claude, dalam hal ini di panel layar terpisah, tapi Anda
00:03:14bisa melakukannya di tab atau server yang berbeda, dengan akses ke daftar tugas yang sama,
00:03:19yang perlu saya lakukan adalah menjalankan environment variable ini, Claude code task list ID, dan memasukkan ID
00:03:26yang sesuai dengan direktori daftar tugas yang ingin saya gunakan.
00:03:30Dengan begitu, Claude seharusnya punya akses ke semua tugas di direktori tersebut, dan saya bisa melakukan hal yang
00:03:34sama di sesi ini.
00:03:36Jadi saya bisa meminta satu sesi untuk mengerjakan tugas-tugas tersebut dan sesi lainnya untuk memverifikasi
00:03:41bahwa tugas telah selesai.
00:03:43Jika saya menjalankan sesi di sebelah kiri, sesi di sebelah kanan seharusnya bisa melihat progres
00:03:48dari setiap tugas.
00:03:49Dan setelah selesai di sisi ini, sesi di sebelah sini bisa lanjut memverifikasi bahwa
00:03:53tugas tersebut memang sudah tuntas.
00:03:55Ini sangat keren karena Anda bisa mulai mengerjakan tugas di satu mesin, berhenti,
00:04:00lalu melakukan commit tugas-tugas itu ke GitHub atau sistem version control apa pun yang Anda sukai, lalu di mesin
00:04:06lain tinggal tarik tugas tersebut dan lanjut mengerjakan tepat dari bagian terakhir yang Anda tinggalkan.
00:04:10Bagi yang sudah terbiasa dengan Beads, Anda akan tahu ini mirip dengan cara kerjanya,
00:04:15tapi tidak persis sama karena Beads menyimpan tugas dalam basis data SQLite untuk pengambilan data yang sangat cepat,
00:04:23dan ia juga mensinkronkan tugas basis data ke dalam satu file JSONL saja, bukan banyak file JSON.
00:04:29Jadi Anda bisa menambahkan file tunggal ini ke proyek Anda dan membagikannya ke anggota tim.
00:04:33Ini juga sedikit berbeda dari loop Ralph Wiggum murni karena filosofinya.
00:04:39Dalam loop Ralph, Anda punya satu prompt tunggal dan daftar tugas, dan tugas-tugas ini
00:04:43dimaksudkan untuk membantu Anda mencapai prompt tersebut, yang Anda kirim ke model secara
00:04:48berulang-ulang.
00:04:49Namun dengan sistem manajemen tugas baru ini, Anda punya daftar tugas dan Anda meminta model
00:04:54untuk memilih sendiri tugas mana yang harus dikerjakan selanjutnya.
00:04:57Jadi ia membaca semua tugas untuk mencari tahu mana yang berikutnya.
00:05:02Masalah ini agak teratasi jika Anda punya sub-agen yang mengerjakan satu tugas saja, tapi jika
00:05:07Anda menginginkan loop otonom yang bisa berjalan selama yang Anda mau, di mana model mengikuti
00:05:12sebuah 'North Star' yang ada di file prompt MD Anda untuk terus meningkatkan proyek, bahkan dengan
00:05:17tugas-tugas yang belum Anda tambahkan, maka sistem manajemen tugas baru ini bukan untuk Anda.
00:05:22Ada juga masalah dokumentasi karena saat rekaman ini dibuat, semua informasi
00:05:27mengenai fitur ini hanya tersedia di dalam satu cuitan saja.
00:05:30Dan dibanding Beads, belum ada banyak alat visualisasi atau semacam papan kanban
00:05:34untuk melihat progres setiap tugas, tapi saya yakin komunitas Claude code sedang
00:05:40mengerjakan hal ini sekarang.
00:05:42Dengan semua sistem manajemen alat baru yang menciptakan perangkat lunak baru ini, Anda akan butuh
00:05:47cara untuk memastikan Anda tidak merilis error ke pengguna Anda.
00:05:50Di sinilah Better Stack berperan, yang memberikan cara untuk melacak error di backend
00:05:56dan frontend proyek Anda menggunakan pelacak error berbasis AI, serta halaman status untuk
00:06:02memberi tahu pengguna jika situs Anda down dan sistem manajemen insiden yang hebat.
00:06:08Jadi, segera cek Better Stack hari ini.

Key Takeaway

Pembaruan Claude Code ke sistem manajemen tugas berbasis JSON memungkinkan kolaborasi multi-sesi dan pengerjaan paralel yang lebih terstruktur, meskipun teknik Ralph Wiggum tetap relevan untuk pengembangan proyek yang bersifat otonom sepenuhnya.

Highlights

Claude Code memperkenalkan fitur 'tasks' berbasis file JSON yang menggantikan sistem 'do's' lama.

Fitur baru ini memungkinkan pengerjaan tugas secara paralel menggunakan sub-agen untuk efisiensi konteks.

Daftar tugas kini bersifat portabel dan dapat dibagikan melalui sistem kontrol versi seperti GitHub.

Model Opus 4.5 memiliki kemampuan pelacakan status yang lebih baik namun tetap memiliki batasan akurasi pada 'zona bodoh' jendela konteks.

Perbandingan antara sistem manajemen tugas Claude Code dengan alat eksternal seperti Beads dan teknik Ralph Wiggum.

Kebutuhan akan alat pemantauan error eksternal seperti Better Stack dalam alur kerja pengembangan perangkat lunak berbasis AI.

Timeline

Pengenalan Sistem Manajemen Tugas Baru Claude Code

Tim Claude Code telah meningkatkan fitur 'do's' menjadi sistem 'tasks' yang lebih canggih di mana setiap tugas memiliki file JSON tersendiri. Perubahan besar ini memungkinkan setiap tugas untuk diperbarui secara mandiri dan di-commit langsung ke repositori GitHub. Sistem ini dirancang untuk mendukung pengerjaan tugas secara paralel melalui sub-agen, yang sangat menguntungkan bagi proyek kompleks dengan banyak ketergantungan. Selain itu, beberapa sesi Claude Code kini dapat berbagi daftar tugas yang sama secara sinkron. Hal ini menimbulkan pertanyaan mengenai relevansi teknik Ralph Wiggum yang populer di kalangan pengembang AI.

Peran Opus 4.5 dan Batasan Jendela Konteks

Peluncuran model Opus 4.5 membawa perubahan signifikan karena kemampuannya untuk berjalan mandiri dalam durasi yang lebih lama dibandingkan model sebelumnya. Model ini memiliki pelacakan status internal yang sangat baik, sehingga daftar tugas manual hampir tidak diperlukan lagi untuk proyek-proyek skala kecil. Namun, pengembang harus tetap waspada terhadap jendela konteks sebesar 200k yang memiliki perbedaan tingkat kecerdasan antara 'zona pintar' dan 'zona bodoh'. Penurunan akurasi biasanya terjadi secara drastis setelah penggunaan konteks melewati ambang batas 80%. Pemahaman mengenai manajemen konteks ini sangat krusial agar hasil kode yang dihasilkan tetap akurat dan berkualitas tinggi.

Inspirasi dari Alat Beads dan Implementasi Praktis

Fitur manajemen tugas di Claude Code sangat terinspirasi oleh alat bernama Beads yang menggunakan SQLite dan file JSONL untuk pengelolaan tugas yang cepat. Untuk menggunakan fitur baru ini, pengguna harus memastikan mereka menggunakan Claude Code versi 2.1.6 atau yang lebih tinggi. Dalam demonstrasi praktis, Claude mampu mengubah file rencana mentah menjadi serangkaian tugas terstruktur dengan ID unik dan deskripsi lengkap. Sistem ini secara otomatis mendeteksi dependensi antar tugas dan menandai tugas yang terhambat dengan warna kuning sebagai petunjuk visual. Semua data ini disimpan secara rapi di dalam folder tersembunyi '.claud' pada direktori utama proyek pengguna.

Eksekusi Paralel dan Sinkronisasi Multi-Sesi

Demonstrasi menunjukkan bagaimana Claude menjalankan beberapa sub-agen sekaligus untuk menyelesaikan tugas yang tidak memiliki hambatan dependensi. Penggunaan sub-agen ini terbukti sangat efisien karena hanya mengonsumsi sekitar 18% dari total jendela konteks yang tersedia. Fitur yang paling menonjol adalah kemampuan untuk menghubungkan sesi yang berbeda menggunakan variabel lingkungan 'Claude code task list ID'. Pengguna dapat menjalankan satu sesi untuk melakukan pengkodean sementara sesi lainnya difokuskan pada verifikasi tugas secara real-time. Kemampuan untuk melakukan push dan pull daftar tugas melalui GitHub memungkinkan pengembang berpindah perangkat tanpa kehilangan progres pekerjaan sedikit pun.

Perbedaan Filosofi dengan Teknik Ralph Wiggum

Meskipun memiliki kemiripan dengan alat Beads, sistem manajemen tugas Claude Code memiliki perbedaan fundamental dalam cara penyimpanan data dan visualisasi. Berbeda dengan teknik Ralph Wiggum yang mengandalkan satu prompt utama sebagai 'Bintang Utara' untuk iterasi tanpa batas, sistem baru ini lebih fokus pada daftar tugas yang sudah ditentukan. Dalam loop Ralph Wiggum, model bekerja secara otonom untuk mencapai tujuan besar, sedangkan sistem tugas ini meminta model memilih langkah berikutnya dari daftar yang ada. Saat ini, dokumentasi resmi untuk fitur ini masih sangat terbatas karena hanya tersedia dalam bentuk cuitan di media sosial. Komunitas diharapkan akan segera mengembangkan alat visualisasi seperti papan kanban untuk mempermudah pemantauan progres tugas.

Pentingnya Monitoring dan Layanan Better Stack

Bagian penutup video menekankan bahwa kecanggihan alat pengembangan berbasis AI tetap memerlukan sistem pemantauan error yang handal agar tidak merugikan pengguna akhir. Better Stack diperkenalkan sebagai solusi komprehensif untuk melacak kesalahan baik di sisi backend maupun frontend proyek secara otomatis. Layanan ini menggunakan teknologi pelacak berbasis AI untuk mengidentifikasi masalah dengan cepat sebelum berdampak luas pada sistem. Selain pelacakan error, Better Stack juga menyediakan halaman status publik dan manajemen insiden yang membantu menjaga kepercayaan pengguna. Integrasi alat manajemen tugas dengan sistem monitoring yang kuat menjadi standar baru dalam alur kerja pengembangan perangkat lunak modern.

Community Posts

View all posts