Saya Mencoba Menjalankan Perusahaan yang Seluruhnya Terdiri dari AI Agent

BBetter Stack
Computing/SoftwareSmall Business/StartupsManagementInternet Technology

Transcript

00:00:00Saya memberikan repo yang sama kepada tiga agen AI, dan bersama-sama mereka membentuk sebuah perusahaan. Satu agen mencoba membangun
00:00:06fitur, satu menulis ulang arsitektur, dan satu lagi membuka serta menangani semua tiket. Tanpa
00:00:12struktur, setiap pengaturan multi-agen perlahan-lahan berubah menjadi kekacauan dan membengkakkan biaya.
00:00:17Ini adalah Paperclip, dan ia mencoba memperbaikinya. Satu perintah memberi Anda bidang kontrol lokal untuk
00:00:22agen AI dengan bagan organisasi, tiket, anggaran, log audit, dan bahkan detak jantung (heartbeat).
00:00:27Proyek ini baru saja melampaui 64.000 bintang di GitHub.
00:00:30Mari kita bangun perusahaan kita sendiri dengan beberapa agen AI dalam beberapa menit.
00:00:33Beginilah masalahnya dengan agen. Satu agen terasa menyenangkan. Anda memberinya tugas, ia menulis beberapa
00:00:44kode. Bagus sekali. Kemudian Anda memberikan agen kedua, bahkan mungkin agen ketiga. Dan apa yang terjadi adalah
00:00:51tiba-tiba hal itu berubah menjadi pekerjaan manajemen. Siapa yang memiliki tugas tersebut? Itulah pertanyaannya. Siapa
00:00:57yang mengingat tujuan dari ini, dan siapa yang menghentikan agen tersebut saat ia mulai melakukan hal yang salah?
00:01:03Itulah masalah yang coba diselesaikan oleh Paperclip. Agen mentah yang bekerja sendiri tidaklah hebat. Berguna,
00:01:08tetapi sulit untuk dikoordinasikan. Paperclip mengubah mereka menjadi sebuah tim, atau saya rasa dalam hal ini disebut sebagai
00:01:13perusahaan. Kita menentukan tujuan perusahaan. Kita membuat bagan organisasi. Mungkin ada CEO, CTO,
00:01:20dua insinyur, dan agen riset. Kemudian Paperclip mengoordinasikan pekerjaan melalui tiket, heartbeat,
00:01:27anggaran Anda, persetujuan, dan keterlacakan. Kita dapat melihat tugasnya, siapa yang menugaskannya, berapa banyak biaya yang
00:01:33benar-benar dihabiskan untuk tugas itu, dan apakah itu masih terhubung dengan tujuan akhir. Orkestrasi yang kurang berbasis intuisi?
00:01:39Mari kita lihat ini secara langsung. Jika Anda menyukai alat coding untuk mempercepat alur kerja Anda, pastikan untuk
00:01:43berlangganan. Kami punya video yang rilis setiap saat. Baiklah, sekarang perhatikan ini. Di terminal yang bersih,
00:01:49saya hanya akan menjalankan NPX Paperclip AI onboard. Itu akan memulai penyiapan lokal. Sekarang beberapa saat
00:01:56kemudian, Paperclip sudah berjalan dengan dasbor. Saya memiliki layanan lokal, Postgres sudah termasuk di dalamnya,
00:02:03dan autentikasi. Ini adalah seluruh UI-nya sekarang di mana saya bisa benar-benar membuat perusahaan baru. Saya akan
00:02:09membuat perusahaan baru dan menamainya “dev tools company”, atau apa pun yang ingin Anda bangun. Untuk ini,
00:02:14saya akan menetapkan tujuan ini. Tujuannya sederhana. Saya ingin membangun dan merilis MVP penyingkat URL minggu
00:02:20ini. Sekarang saya bisa menambahkan agen CTO. Kemudian saya bisa menambahkan dua insinyur melalui adaptor. Salah satu agen
00:02:28insinyur ini memegang bagian backend. Yang lainnya memegang frontend dan cakupan pengujian. Sekarang, sebelum saya menekan
00:02:34mulai, saya akan mengatur anggaran. Dan bagian inilah yang sangat penting karena tujuannya adalah agar
00:02:39agen tidak membiarkan API saya bekerja terus sampai tagihannya meledak. Tidak, tujuannya adalah otonomi yang terkendali. Saya juga perlu
00:02:46mengatur jalur ke direktori kerja saya di mana kode akan dihasilkan. Jadi saya akan mengaturnya di sini.
00:02:50Sekarang saya bisa mengaktifkan heartbeat tersebut dan memulainya. Dan mari kita perhatikan papan kerjanya. Agen-agen tersebut bangun
00:02:57saat heartbeat. CTO membagi tujuan menjadi beberapa tiket. Insinyur kita di sini, mereka sekarang mulai mengambil pekerjaan.
00:03:05Jadi Anda bisa melihat pendelegasian, tiket, silsilah, perubahan status, penghitung anggaran, semua ini
00:03:10terikat menjadi satu. Dan sekarang tugas implementasi pertama sudah bergerak menuju komit kode.
00:03:15Ini sebenarnya memakan waktu yang cukup lama untuk berjalan, tapi saya rasa memiliki semua agen ini bersama-sama,
00:03:19itu cukup masuk akal, tapi tetap saja ini bukan yang tercepat, terutama jika Anda mencoba menskalakan ini
00:03:24lebih jauh lagi. Ini bukan lagi satu agen yang duduk di kotak obrolan. Ini sekarang adalah perusahaan kecil yang
00:03:30berjalan dengan kita membuat agen-agen ini, CEO, CTO, dan semua insinyur ini. Sekarang di sinilah orang-orang
00:03:37menjadi bingung. Pada pandangan pertama, Paperclip terdengar seperti kerangka kerja agen lainnya, seperti Crew AI,
00:03:43AutoGen, atau alur kerja gaya LangGraph lainnya. Bukan itu poin sebenarnya. Alat-alat itu hebat ketika
00:03:49Anda menginginkan alur kerja, bukan? Jadi misalnya, saya ingin peneliti, lalu perencana, lalu penulis,
00:03:55lalu peninjau. Ya, tentu saja itu berguna. Itulah alasan kita menggunakannya. Tapi Paperclip menyasar
00:04:01tingkatan yang lebih tinggi. Ini bukan hanya tentang para pekerjanya lagi. Ini adalah perusahaan yang seolah-olah mengelilingi
00:04:07para pekerja ini dalam bagan organisasi untuk benar-benar membantu membangun segala sesuatunya. Pikirkan seperti ini.
00:04:13Agen tunggal hanyalah seorang karyawan. Alur kerja itu seperti daftar periksa Anda. Paperclip adalah manajernya,
00:04:20bagan organisasi, papan tiket, sistem anggaran, log audit. Itulah Paperclip
00:04:25sebagai manajer. Jadi pertanyaan yang sudah Anda tanyakan pada diri sendiri sekarang, bisakah agen menulis kode? Yah,
00:04:30kita sudah tahu ia bisa. Itulah tujuan dari hal ini. Ia sedang menghasilkannya sekarang. Pertanyaan yang lebih sulit adalah,
00:04:36bisakah ia bekerja pada tugas yang tepat? Bisakah ia berhenti pada saat yang seharusnya? Bisakah ia menyerahkan pekerjaan dengan jelas?
00:04:43Bisakah saya memeriksa apa yang sebenarnya terjadi di sini? Dan jawaban singkat untuk semua itu adalah ya, ia bisa.
00:04:49Paperclip memberi Anda status, heartbeat, anggaran, hierarki, log. Ia bahkan memberikan
00:04:55templat portabel dan dasbor yang terasa lebih seperti Jira atau Linear untuk agen daripada sekadar jendela obrolan biasa.
00:05:02Anda berhenti memberi perintah pada satu agen dan mulai mengendalikan organisasi mini ini. Banyak dari kita mungkin masih
00:05:07berpindah-pindah antara terminal dan pengaturan. Satu terminal untuk Claude Code, satu tab untuk Cursor, satu agen untuk
00:05:13riset, satu skrip untuk masalah di GitHub, kan? Semua jendela berbeda yang kita pindah-pindah itu,
00:05:18tapi Paperclip memberikan semua itu model operasi bersama. Sekarang model mental untuk semua ini
00:05:24sebenarnya berubah bagi kita. Jadi alih-alih mengatakan, “Tolong bangun fitur ini,”
00:05:30apa yang sebenarnya kita katakan sekarang adalah sesuatu yang lebih seperti: tujuan perusahaan ini adalah untuk merilis
00:05:35produk ini. Ini aturan-aturannya di dalam perusahaan. Ini bagan organisasinya dan ini anggarannya.
00:05:41Ini hal-hal yang butuh persetujuan. Sekarang jalanlah. Sejujurnya, strukturnya bagus,
00:05:46kan? Tiket, silsilah, pendelegasian, semua itu, kan? Pekerjaan multi-agen lebih mudah dipahami
00:05:52dengan memiliki ini. Alih-alih mengatakan agen melakukan sesuatu, hebat. Anda benar-benar dapat melihat siapa yang menugaskan
00:05:58pekerjaan itu, mengapa tugas itu ada, dan di mana kecocokannya dalam kode kita. Kemampuan untuk mengatur anggaran juga sangat penting.
00:06:05Banyak alat agen memperlakukan biaya seperti sesuatu yang baru Anda periksa setelah kejadian. Paperclip menjadikan biaya
00:06:12bagian dari seluruh putaran kontrol. Kita menetapkan anggaran sebelum kita mengeksekusi. Ini bersifat self-hosted dan open
00:06:17source. Sekali lagi, kemenangan besar di sana. Jadi Anda bisa menjalankannya secara lokal, memeriksanya, memodifikasinya, dan menghubungkannya ke
00:06:22agen yang sudah Anda gunakan. Tetapi pada saat yang sama dengan semua hal baik ini, struktur yang sama
00:06:27yang membuat Paperclip kuat juga bisa sangat menjengkelkan. Jika aturan Anda buruk, agen dapat membuat
00:06:32tiket tentang hal yang tidak masuk akal. Saya ingin penyingkat URL yang sederhana di sini, tetapi sekarang mungkin agen CTO saya telah membuka
00:06:39seluruh rencana lain yang bahkan tidak saya inginkan. Jadi, tidak terima kasih untuk itu. Pemborosan token juga nyata,
00:06:45kan? Inilah mengapa kita punya anggaran untuk mengontrol ini, tapi itu tidak memperbaiki prompt yang ceroboh atau definisi aturan
00:06:52yang tidak jelas. Dan teman-teman, jika file skills MD Anda buruk, perusahaan Anda akan berperilaku seperti startup yang bingung,
00:06:59kan? Jadi skills MD, itulah yang butuh diperkuat di sini, kan? Dan akhirnya, sejujurnya,
00:07:03jika Anda hanya mengerjakan skrip sederhana, ini benar-benar berlebihan. Saya hanya ingin menguji ini. Saya tidak
00:07:08membutuhkan ini untuk proyek ini, tapi jika Anda hanya ingin satu agen untuk meringkas file atau memperbaiki bug,
00:07:13Anda tidak butuh ini, kan? Ini untuk membangun jauh lebih banyak, dengan lebih banyak agen yang bekerja
00:07:18bersama. Ini pasti layak digunakan, tapi tidak untuk segalanya. Jika Anda menikmati alat coding dan
00:07:23tips seperti ini, pastikan untuk berlangganan. Sampai jumpa di video lainnya.

Key Takeaway

Paperclip mengubah agen AI tunggal menjadi organisasi terstruktur melalui manajemen tiket, kontrol anggaran real-time, dan hierarki peran untuk membangun produk kompleks seperti MVP penyingkat URL secara otonom.

Highlights

  • Paperclip mengoordinasikan beberapa agen AI melalui struktur organisasi yang mencakup peran CEO, CTO, dan insinyur untuk mencegah kekacauan operasional.

  • Sistem ini menggunakan mekanisme heartbeat untuk membangunkan agen, membuat tiket tugas secara otomatis, dan mengelola pendelegasian kerja.

  • Anggaran biaya ditetapkan sebelum eksekusi untuk mencegah lonjakan tagihan API melalui putaran kontrol otonomi yang terkendali.

  • Proyek sumber terbuka ini telah melampaui 64.000 bintang di GitHub dan menyediakan dasbor lokal dengan layanan Postgres serta autentikasi bawaan.

  • Perintah NPX Paperclip AI onboard memulai seluruh pengaturan lokal termasuk antarmuka pengguna untuk manajemen organisasi mini AI.

  • Paperclip berfungsi sebagai lapisan manajemen yang mencakup log audit dan keterlacakan tugas, berbeda dari kerangka kerja alur kerja linear seperti Crew AI atau AutoGen.

Timeline

Masalah Koordinasi Multi-Agen

  • Penggunaan banyak agen AI tanpa struktur sering kali menyebabkan tumpang tindih pekerjaan dan pembengkakan biaya.
  • Manajemen tugas manual menjadi hambatan ketika harus menentukan kepemilikan tugas di antara beberapa agen.
  • Agen mentah yang bekerja secara independen sulit dikoordinasikan untuk mencapai tujuan proyek yang besar.

Tanpa pengaturan yang jelas, agen AI cenderung melakukan penulisan ulang arsitektur atau pembuatan fitur secara tidak sinkron. Kekacauan muncul saat tidak ada entitas yang mengingat tujuan akhir atau menghentikan agen saat terjadi kesalahan. Paperclip hadir untuk menyediakan bidang kontrol lokal yang mengatur agen-agen ini menjadi satu tim yang kohesif.

Struktur Organisasi dan Orkestrasi Paperclip

  • Paperclip mendefinisikan peran spesifik seperti CTO dan insinyur untuk membagi tujuan besar menjadi tiket-tiket kerja.
  • Fitur heartbeat memastikan agen aktif secara berkala untuk memproses antrean tugas di papan kerja.
  • Kontrol anggaran berfungsi sebagai pembatas otonomi agar penggunaan API tidak melebihi batas finansial yang ditentukan.

Pengguna dapat membangun perusahaan pengembang alat dalam hitungan menit dengan menetapkan tujuan seperti pembuatan MVP penyingkat URL. Agen CTO secara otomatis memecah tujuan tersebut menjadi tugas-tugas teknis bagi agen insinyur frontend dan backend. Seluruh proses ini dapat dipantau melalui silsilah tugas, perubahan status, dan penghitung anggaran yang terintegrasi dalam satu dasbor.

Perbedaan Paperclip dengan Kerangka Kerja Alur Kerja

  • Paperclip menargetkan level manajemen organisasi, bukan sekadar alur kerja linear seperti peneliti ke penulis.
  • Sistem ini bertindak sebagai manajer yang menyediakan papan tiket, sistem anggaran, dan log audit bagi para pekerja AI.
  • Dasbor bergaya Jira atau Linear menggantikan antarmuka obrolan tradisional untuk memberikan kontrol yang lebih luas.

Meskipun alat seperti Crew AI atau AutoGen efektif untuk alur kerja sekuensial, Paperclip fokus pada penyediaan model operasi bersama bagi berbagai alat agen. Ini menghilangkan kebutuhan untuk berpindah antar terminal atau tab browser yang berbeda untuk tugas riset dan pengkodean. Fokus utamanya adalah pada kemampuan agen untuk menyerahkan pekerjaan dengan jelas dan bekerja pada tugas yang tepat di bawah pengawasan sistem.

Model Mental Baru dan Keterbatasan Sistem

  • Interaksi dengan AI berubah dari sekadar memberi perintah fitur menjadi menetapkan aturan perusahaan dan anggaran.
  • Definisi aturan yang tidak jelas pada file skills MD dapat menyebabkan agen berperilaku tidak teratur atau membuat tiket yang tidak relevan.
  • Penggunaan sistem manajemen lengkap ini dianggap berlebihan untuk tugas-tugas sederhana seperti perbaikan bug tunggal.

Struktur yang ketat memberikan kejelasan mengenai siapa yang menugaskan pekerjaan dan relevansinya terhadap kode, namun juga menyimpan risiko pemborosan token jika instruksi awal ceroboh. Fleksibilitas Paperclip sebagai platform self-hosted dan open source memungkinkan modifikasi mendalam, tetapi efektivitasnya sangat bergantung pada kualitas definisi aturan perusahaan. Alat ini dirancang khusus untuk skalabilitas pembangunan proyek besar dengan banyak agen yang bekerja serentak.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video