Model baru Anthropic terlalu berbahaya?

MMaximilian Schwarzmüller
Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00Sebagai pengembang perangkat lunak dan saya rasa secara umum sebagai manusia, tetapi terutama sebagai pengembang
00:00:06saat ini tidak ada cara untuk menghindari Anthropic. Suka atau tidak. Dan menurut saya Anda tidak seharusnya mencoba
00:00:12mengabaikannya karena ini sangat relevan. Relevan bagi masa depan kita sebagai pengembang perangkat lunak, menurut saya.
00:00:20Dan dalam episode ini saya tidak akan membahas kebocoran kode Claude minggu lalu. Saya tidak akan membahas
00:00:28ketentuan mereka yang diperketat mengenai penggunaan penawaran langganan mereka, Claude Max dan sebagainya
00:00:36serta bagaimana mereka menindak penggunaan langganan yang tidak sah. Mereka melakukannya sekarang
00:00:43karena tentu saja penawaran langganan mereka, sama seperti yang ditawarkan OpenAI, sangat disubsidi
00:00:50dan mereka tidak bisa menghasilkan uang jika semua orang memaksimalkan penggunaan langganan mereka. Jadi ya, mereka benar-benar
00:00:56membatasi atau mencoba membatasi penggunaan langganan mereka hanya untuk manusia di situs web mereka
00:01:04atau di Claude code atau aplikasi desktop Claude. Tapi ya, sekali lagi, ini bukan fokus kita di sini
00:01:11dan saya bahkan tidak akan fokus pada pertumbuhan pendapatan mereka yang mengesankan, meski itu layak dicatat sebentar
00:01:19karena Anthropic telah mencapai pendapatan rutin tahunan sebesar 30 miliar dolar yang sudah sangat
00:01:27mengesankan, tetapi lebih mengesankan lagi jika Anda membandingkannya dengan 9 miliar dolar di akhir tahun 2025. Jadi
00:01:35mereka melipatgandakan lebih dari tiga kali lipat pendapatan rutin tahunan mereka hanya dalam beberapa bulan. Yang mana
00:01:41sangat mengesankan. Dan karena itu tentu saja jika Anda ingin belajar cara menggunakan Claude code secara efisien,
00:01:47bagaimana cara memaksimalkannya, saya punya kursusnya dan itu sangat populer yang tentu saja membuat
00:01:53saya senang dan Anda bisa menemukan tautannya di bawah jika ingin bergabung dan belajar cara bekerja secara efisien dengan
00:01:59Claude code. Tapi seperti yang disebutkan, itu bahkan bukan topik utama di sini. Sebaliknya, saya ingin membahas
00:02:05Project Glasswing dan model baru mereka, Mythos, yang belum mereka rilis ke publik dan
00:02:14mereka juga membagikan alasannya. Dan saya pikir ini penting untuk dipahami dan juga penting untuk mencoba
00:02:20melihat di balik layar, di balik alasan mereka dan apa dampak dari model baru ini dan cara kerjanya
00:02:27serta kemampuannya bagi kita para pengembang. Jadi apa itu Project Glasswing? Apa sebenarnya model baru mereka?
00:02:33Di bawah tentu saja Anda juga bisa menemukan tautan ke artikel ini. Ini adalah artikel di situs resmi
00:02:39Anthropic di mana mereka mengumumkan Project Glasswing dan juga membahas tentang model baru mereka.
00:02:44Dan jika saya gulir ke bawah sedikit, kita sudah bisa melihat beberapa ringkasan statistik benchmark di sini di mana kita bisa melihat
00:02:52bahwa model baru ini, versi pratinjau Mythos dari model tersebut, nama modelnya adalah Mythos, bekerja
00:02:59jauh lebih baik daripada Opus 4.6. Dan tergantung pada benchmark mana yang Anda lihat, ada perbedaan yang cukup besar
00:03:07antara Opus 4.6 dan model baru ini. Sekarang tentu saja ini sebenarnya tidak terlalu
00:03:15mengesankan. Kapan pun model baru diumumkan, tidak peduli dari perusahaan mana pun, kinerjanya akan jauh lebih baik atau
00:03:21setidaknya sedikit lebih baik daripada semua model pesaing, jika tidak maka model tersebut tidak akan dirilis. Dan tentu saja
00:03:26ada cara untuk memanipulasi beberapa benchmark ini jadi saya biasanya tidak terlalu peduli
00:03:31dengan angka-angka benchmark tersebut dan itu tidak akan berbeda untuk model yang ini, tetapi
00:03:39ada hal-hal menarik tentang model Mythos yang baru. Dan faktanya adalah Anthropic memutuskan untuk tidak
00:03:46merilisnya ke publik karena seperti yang mereka katakan, model ini terlalu mahir dalam menemukan dan mengeksploitasi kerentanan
00:03:56di sistem operasi, perangkat lunak lain, browser, pokoknya di perangkat lunak secara umum. Dan dalam artikel ini
00:04:05dan juga dalam artikel terpisah yang juga ditautkan di bawah, mereka membagikan beberapa detail dan terutama artikel terpisah ini
00:04:11sangat panjang dan memberikan contoh konkret untuk kerentanan dan
00:04:19potensi eksploitasi yang ditemukan model baru ini. Misalnya mereka memulai di artikel ini dengan eksploitasi
00:04:28dan kerentanan yang sangat serius yang ditemukan di OpenBSD. OpenBSD tentu saja adalah sistem operasi
00:04:38yang populer pada perangkat lunak jaringan tertentu misalnya dan Mythos, model baru mereka
00:04:45yang dijalankan dalam lingkungan agen seperti Claude code saya rasa, mampu menemukan dan mengeksploitasi, dan itulah
00:04:53bagian yang menarik, sebuah kerentanan yang terkait dengan integer overflow dan akses memori, akses memori
00:05:02tak terduga yang mampu merusak mesin yang menjalankan OpenBSD dengan cara yang dapat direproduksi, yang
00:05:12tentu saja dapat dimanfaatkan untuk menjalankan serangan denial of service yang sangat merusak dengan mengirimkan secara berulang
00:05:20paket dan permintaan khusus ke mesin-mesin semacam itu di sini yang mengeksploitasi kerentanan tersebut untuk melumpuhkan
00:05:27mesin-mesin itu dan berpotensi melumpuhkan seluruh jaringan perusahaan, dan kerentanan ini
00:05:34terdeteksi dalam satu proses yang biayanya di bawah lima puluh dolar meskipun keseluruhan proses biayanya di bawah dua puluh
00:05:43ribu dolar dan karena Anda tentu saja tidak tahu sebelumnya proses mana yang akan menemukan kerentanan,
00:05:48angka itulah yang penting. Tetap saja tentu saja mudah untuk membayangkan bahwa model yang mampu menemukan
00:05:57kerentanan kritis seperti itu dengan biaya yang relatif rendah, tergantung siapa Anda,
00:06:04jika Anda adalah sebuah negara misalnya atau aktor jahat yang serius, itu mungkin bukan uang yang banyak bagi Anda.
00:06:13Itu tentu saja menjadi masalah karena mudah untuk membayangkan jika model seperti itu dikembangkan oleh
00:06:22sebuah perusahaan, organisasi yang kurang peduli dengan keamanan dan atau yang mungkin tidak perlu
00:06:31takut akan konsekuensi apa pun dari penyalahgunaan kerentanan tersebut, ini bisa menjadi masalah dan
00:06:42sepertinya kita sedang memasuki era baru dengan AI dengan model-model AI ini di mana tidak ada yang aman
00:06:56dan lebih mudah dari sebelumnya untuk menyebarkan agen AI secara massal yang menjalankan model seperti ini untuk memindai semua jenis
00:07:05perangkat lunak dan menemukan serta berpotensi mengeksploitasi kerentanan, dan tentu saja sebagai manusia sendirian
00:07:13tidak ada cara untuk mengimbanginya. Maksud saya, bug atau eksploitasi yang ditemukan di sini telah ada
00:07:19selama saya pikir mereka bilang 27 tahun atau semacam itu, ini menunjukkan bahwa tidak ada manusia yang mampu menemukan
00:07:29bug ini dalam jangka waktu yang begitu lama, termasuk aktor jahat yang tentu saja memiliki
00:07:35kepentingan untuk dapat menyerang sistem operasi ini di masa lalu juga. Nah ini hanyalah salah satu
00:07:41mungkin temuan paling menonjol yang dimiliki model baru ini, mereka mendaftarkan lebih banyak lagi bug dan eksploitasi
00:07:49yang ditemukan model tersebut dan terkadang juga dapat disalahgunakan dan mereka juga berbagi cerita lain di X misalnya
00:07:57seperti model yang mampu keluar dari sandbox atau agen AI yang menjalankan model tersebut mampu
00:08:04keluar dari sandbox tempat ia dijalankan dan itu membawa kita kembali ke Project Glasswing yang
00:08:11merupakan inisiatif yang dibuat oleh Anthropic bersama dengan perusahaan besar lainnya seperti AWS, Apple, Microsoft,
00:08:21Linux Foundation, dan lainnya untuk menggunakan model ini guna menambal perangkat lunak mereka sebelum model ini
00:08:30dirilis secara publik dan sebelum publik mendapatkan akses ke model ini. Itulah narasi
00:08:38dari artikel ini, itulah penjelasan dari Anthropic dan saya memiliki pemikiran yang campur aduk di sini. Sekarang di satu sisi,
00:08:48saya tidak punya alasan kuat untuk percaya bahwa ini tidak benar. Jelas Anthropic punya beberapa alasan untuk
00:08:56tidak merilis model ini di luar apa yang mereka sebutkan di sini, misalnya saya membaca bahwa
00:09:04model ini adalah model dengan parameter sekitar 10 triliun yang jauh lebih besar daripada semua model frontier
00:09:11yang kita miliki sejauh ini, yang dapat kita gunakan secara publik sejauh ini dan pelatihannya dikatakan telah memakan biaya
00:09:20sekitar 10 miliar dolar. Biaya token dari model ini saya baca diperkirakan berada di kisaran ini,
00:09:3025 dolar hingga 125 dolar untuk token input dan output, dan tentu saja itu juga akan menjadi alasan untuk tidak
00:09:39merilis model ini karena mereka tidak dapat memasukkannya ke dalam langganan Claude mereka karena itu terlalu
00:09:46mahal, mereka mungkin harus menaikkan harga langganan ke titik harga di mana tidak banyak
00:09:52orang yang mau membayarnya dan oleh karena itu tidak akan ada cara untuk mengeksposnya ke
00:09:59publik setidaknya sebagai bagian dari Claude code. Sekarang tentu saja mereka masih bisa mengeksposnya melalui API mereka dengan dasar
00:10:05biaya bayar per penggunaan dan jika itu mahal siapa yang peduli jika ada perusahaan atau orang yang
00:10:12mau membayarnya mereka bisa melakukannya dan di sanalah bagian kekhawatiran keamanan siber
00:10:18mungkin benar-benar berperan karena jelas semua itu kemungkinan besar tidak mengada-ada, maksud saya itu pasti
00:10:26tidak mengada-ada. Tim FFmpeg misalnya yang juga terdaftar di sini sebagai sebuah kerentanan yang mana mereka
00:10:36mampu menemukan kerentanan di FFmpeg, tim tersebut mengonfirmasi di X bahwa Anthropic mengirimkan
00:10:44mengirimkan patch untuk kerentanan dalam program perangkat lunak FFmpeg. Jadi ya, ini jelas tidak
00:10:55mengada-ada, kekhawatiran ini valid, kekhawatiran keamanan siber valid terutama karena jika uang
00:11:03bukan masalah utama, Anda bisa menyebarkan ribuan agen yang berjalan secara bersamaan menggunakan ini atau model
00:11:11serupa yang mungkin kita miliki di masa depan untuk memindai semua jenis perangkat lunak dan mengeksploitasinya dan tentu saja
00:11:19masalah besarnya adalah menggunakan model ini untuk menemukan kerentanan dan menambalnya itu mungkin saja tetapi
00:11:30itu hanya mungkin jika pemilik atau pengelola perangkat lunak tertentu mampu membeli model tersebut
00:11:37atau mendapatkan akses gratis atau semacamnya dan bahkan jika sebuah kerentanan sudah ditambal, kita semua tahu
00:11:46bahwa tidak semua komputer di luar sana, tidak semua mesin, tidak semua pengguna menjalankan perangkat lunak yang mutakhir di
00:11:55perangkat mereka. Jika Anda melihat semua berbagai server yang berjalan di luar sana di jaringan internet,
00:12:04saya rasa sebagian besar dari mereka menjalankan perangkat lunak yang kedaluwarsa. Maksud saya di ponsel atau
00:12:12laptop kita, kita sering tidak menjalankan perangkat lunak terbaru, versi terbaru dari sistem operasi kita, patch
00:12:20keamanan terbaru mungkin tidak terpasang dan itu berlaku untuk semua lapisan perangkat lunak dan di dunia
00:12:28di mana menemukan kerentanan keamanan lebih mudah dari sebelumnya, itu tentu saja menjadi masalah yang bahkan
00:12:34lebih besar karena tentu saja hal baik tentang model AI ini adalah ia juga bisa digunakan untuk
00:12:43secara proaktif mencari kerentanan keamanan dan menambalnya, jadi ini bukan hanya alat untuk
00:12:48penyerang, ia juga bisa membuat pertahanan lebih mudah karena Anda sekarang memiliki alat yang bisa dijalankan secara simultan
00:12:56secara paralel di ribuan agen untuk mengamankan perangkat lunak Anda, secara teori ini bisa menjadi
00:13:01alat yang sangat berguna untuk pertahanan. Tetapi tentu saja sekali lagi tidak setiap perusahaan atau orang yang mungkin sedang mengembangkan
00:13:09perangkat lunak krusial mampu membelinya, mungkin tertarik menggunakannya dan bahkan jika digunakan
00:13:16untuk menemukan dan menambal kerentanan, tetap saja versi terbaru ini tidak akan terpasang di mana-mana
00:13:23dan itu tentu saja memberi penyerang peluang yang bagus di mana mereka tahu lebih banyak tentang
00:13:31kerentanan daripada sebelumnya pada suatu saat karena jauh lebih banyak kerentanan yang terdeteksi tetapi tidak setiap
00:13:39mesin atau setiap pengguna terlindungi dari kerentanan tersebut dan itu adalah salah satu kekhawatiran nyata
00:13:46yang saya miliki tentang perkembangan ini sekarang. Itulah gambaran yang lebih besar yang memengaruhi semua orang,
00:13:52semua perusahaan, semua manusia pada akhirnya. Pertanyaan lainnya tentu saja adalah apa arti model seperti
00:13:59ini bagi kita para pengembang. Maksud saya jelas ini sepertinya model yang sangat mumpuni yang mampu
00:14:08mencari kerentanan sendiri dan mengeksploitasi kerentanan sendiri. Jadi ya, apa
00:14:16dampaknya bagi pengembang dan menurut saya di sini tidak banyak yang berubah untuk saat ini. Maksud saya
00:14:28kita sudah hidup di dunia di mana agen AI seperti Claude code dan model yang mendasarinya dan tentu saja
00:14:34hal yang sama berlaku untuk Codex dan sebagainya, apa pun agen AI dan model favorit Anda,
00:14:39mampu menghasilkan sebagian besar kode kita. Anda mungkin tidak menggunakannya, Anda mungkin tidak menyukainya, saya membuat
00:14:46video terpisah di mana saya berbagi perasaan saya tentang hal itu dan bahwa ini menghilangkan kegembiraan dari bagian
00:14:52pengembangan perangkat lunak bagi saya, tetapi itulah kenyataannya meskipun suka atau tidak dan
00:14:57percayalah saya belum tentu menyukainya, tetapi ya inilah kenyataannya. Apa yang dibawa oleh manusia
00:15:04atau mengapa manusia masih penting di sini dan mungkin lebih penting dari sebelumnya adalah tentu saja karena Anda
00:15:12pasti tidak ingin agen AI seperti ini menjadi tidak terkendali dan bekerja sepenuhnya sendiri. Mengarahkan
00:15:21model dan agen seperti itu, mengendalikan mereka, memberi mereka tugas yang jelas, membatasi cakupan pekerjaan yang mereka lakukan,
00:15:29semua hal ini lebih penting dari sebelumnya. Model-model ini sepertinya bisa melakukan jauh lebih banyak daripada
00:15:39sebagian besar pengembang, jelas jauh lebih banyak daripada yang bisa saya lakukan,
00:15:43namun dalam hal merilis produk, dalam hal membangun perangkat lunak yang digunakan oleh manusia,
00:15:54pengaruh manusia tentu saja sangat, sangat penting. Apa yang berubah tentu saja
00:16:01adalah peran kita sebagai pengembang perangkat lunak. Kita berubah dari orang yang menulis kode menjadi
00:16:08orang yang mengarahkan model, yang meninjau kode, yang memahami apa yang
00:16:12dilakukannya, yang menetapkan cakupan dan ya sekali lagi saya membahas ini di video lain tentang bagaimana hal itu
00:16:18berubah dan bahwa ini belum tentu apa yang Anda sukai, itu pasti bukan
00:16:26alasan saya terjun ke pengembangan perangkat lunak pada awalnya, tetapi ya inilah dampaknya di sini dan
00:16:31semakin mumpuni model-model ini saya pikir semakin penting untuk memiliki suara manusia di
00:16:39sana juga, pengaruh manusia di sana juga jadi itulah perubahan peran tersebut dan
00:16:48peran kita di masa depan. Tapi ya, maksud saya ini adalah perkembangan yang sangat menarik dan terutama
00:16:58model ini dan implikasinya serta relevansi keamanan siber yang dimilikinya
00:17:04membuat kita bertanya-tanya apa yang akan terjadi atau apa yang akan terjadi jika aktor lain, negara lain, atau
00:17:16organisasi di dunia mendapatkan model ini atau model yang serupa kemampuannya,
00:17:23karena tentu saja hanya masalah waktu sampai model dengan kemampuan serupa dapat diakses
00:17:33oleh publik atau setidaknya oleh negara dan aktor lain. Dan ya saya tidak yakin apakah
00:17:44kita siap untuk perlombaan baru dalam keamanan siber itu dan jeda waktu antara bug yang ditemukan
00:17:52dan ditambal serta orang-orang memasang patch tersebut. Saya pikir kita akan memasuki era baru keamanan
00:18:00siber dan kita akan dapat menyesuaikan diri, saya yakin, tetapi ini benar-benar menandai titik yang
00:18:08menarik dalam sejarah pengembangan model, menurut saya.

Key Takeaway

Anthropic menunda perilisan publik model Mythos berkapasitas 10 triliun parameter karena kemampuannya yang sangat berbahaya dalam mengeksploitasi kerentanan perangkat lunak secara otomatis dengan biaya rendah di bawah 50 dolar per temuan.

Highlights

Anthropic mencapai pendapatan rutin tahunan sebesar 30 miliar dolar pada April 2026, melonjak tiga kali lipat dari 9 miliar dolar di akhir tahun 2025.

Model AI Mythos memiliki sekitar 10 triliun parameter dengan biaya pelatihan mencapai 10 miliar dolar.

Mythos menemukan dan mengeksploitasi kerentanan integer overflow pada OpenBSD yang telah ada selama 27 tahun tanpa terdeteksi manusia.

Biaya untuk mendeteksi satu kerentanan kritis menggunakan model Mythos dalam lingkungan agen berada di bawah 50 dolar.

Estimasi biaya penggunaan model Mythos berkisar antara 25 dolar hingga 125 dolar per satu juta token input dan output.

Project Glasswing melibatkan kolaborasi Anthropic dengan AWS, Apple, Microsoft, dan Linux Foundation untuk menambal celah keamanan sebelum rilis publik model Mythos.

Timeline

Pertumbuhan Finansial dan Pembatasan Langganan Anthropic

  • Pendapatan rutin tahunan Anthropic melonjak dari 9 miliar dolar menjadi 30 miliar dolar dalam hitungan bulan.
  • Layanan langganan seperti Claude Max mendapatkan subsidi besar sehingga penggunaan otomatis oleh non-manusia mulai dibatasi ketat.

Pertumbuhan pendapatan yang masif menunjukkan relevansi tinggi Anthropic bagi pengembang perangkat lunak di masa depan. Perusahaan kini menindak tegas penyalahgunaan akun langganan untuk menjaga profitabilitas karena biaya operasional model yang tinggi. Fokus penggunaan dialihkan kembali ke interaksi manusia melalui situs web, aplikasi desktop, atau Claude Code.

Project Glasswing dan Kemampuan Model Mythos

  • Project Glasswing adalah inisiatif keamanan untuk mengidentifikasi risiko sebelum model AI baru dirilis ke publik.
  • Model Mythos menunjukkan performa benchmark yang jauh melampaui Opus 4.6 dalam pengujian internal.
  • Anthropic memutuskan untuk tidak merilis Mythos karena risiko eksploitasi sistem operasi dan browser yang terlalu tinggi.

Mythos merupakan versi pratinjau yang dirancang untuk lingkungan agen. Keputusan untuk menahan rilis didasarkan pada temuan bahwa model ini terlalu mahir dalam mencari titik lemah pada perangkat lunak secara umum. Statistik benchmark menunjukkan lompatan kemampuan yang signifikan dibandingkan generasi sebelumnya, namun risiko keamanan menjadi prioritas utama di atas peluncuran produk.

Eksploitasi Kerentanan OpenBSD Berusia 27 Tahun

  • Mythos berhasil menemukan bug akses memori pada OpenBSD yang tidak terdeteksi oleh manusia selama hampir tiga dekade.
  • Serangan denial of service yang melumpuhkan jaringan perusahaan dapat direproduksi melalui paket permintaan khusus hasil temuan AI.
  • Proses penemuan bug kritis ini memakan biaya operasional yang sangat rendah bagi aktor jahat tingkat negara.

Eksploitasi yang ditemukan melibatkan integer overflow yang dapat menyebabkan kerusakan mesin secara konsisten. Fakta bahwa bug ini bertahan selama 27 tahun membuktikan keunggulan AI dibandingkan metode audit manual tradisional. Kemudahan penyebaran agen AI secara massal untuk memindai perangkat lunak menciptakan ancaman siber baru di mana pertahanan manusia sulit mengimbangi kecepatan serangan otomatis.

Struktur Biaya dan Kolaborasi Industri

  • Model dengan 10 triliun parameter ini memerlukan biaya token antara 25 dolar hingga 125 dolar.
  • Anthropic bekerja sama dengan AWS, Apple, dan Microsoft untuk memperbaiki kode sumber mereka menggunakan Mythos.

Biaya operasional yang sangat mahal menjadi alasan teknis kedua mengapa Mythos tidak disertakan dalam paket langganan Claude standar. Project Glasswing berfungsi sebagai masa karantina di mana perusahaan teknologi besar dan pengembang open-source seperti tim FFmpeg menerima patch keamanan langsung dari Anthropic. Langkah ini memastikan ekosistem perangkat lunak diperkuat sebelum model serupa jatuh ke tangan pihak yang tidak bertanggung jawab.

Pergeseran Peran Pengembang dalam Era AI Otonom

  • Keamanan siber tetap rentan karena banyak server global masih menjalankan perangkat lunak usang tanpa patch terbaru.
  • Peran pengembang perangkat lunak berubah dari penulis kode menjadi peninjau dan pengarah model AI.
  • Kontrol manusia tetap krusial untuk membatasi ruang lingkup kerja agen AI agar tidak bekerja di luar kendali.

Meskipun AI dapat digunakan untuk pertahanan proaktif, kesenjangan antara penemuan bug dan penerapan patch oleh pengguna akhir tetap menjadi risiko utama. Pengembang manusia kini lebih berfungsi sebagai arsitek yang menetapkan tugas dan memvalidasi output dari model yang memiliki kemampuan teknis melampaui rata-rata manusia. Era baru ini menuntut adaptasi terhadap perlombaan senjata keamanan siber yang digerakkan oleh kecerdasan buatan.

Community Posts

View all posts