Model baru Anthropic terlalu berbahaya?

Bahasa Indonesiaالعربية Deutsch English Español Français हिन्दी 日本語 한국어 Português Русский 中文

MMaximilian Schwarzmüller

Computing/SoftwareBusiness NewsInternet Technology

Transcript

00:00:00Sebagai pengembang perangkat lunak dan saya rasa secara umum sebagai manusia, tetapi terutama sebagai pengembang

00:00:06saat ini tidak ada cara untuk menghindari Anthropic. Suka atau tidak. Dan menurut saya Anda tidak seharusnya mencoba

00:00:12mengabaikannya karena ini sangat relevan. Relevan bagi masa depan kita sebagai pengembang perangkat lunak, menurut saya.

00:00:20Dan dalam episode ini saya tidak akan membahas kebocoran kode Claude minggu lalu. Saya tidak akan membahas

00:00:28ketentuan mereka yang diperketat mengenai penggunaan penawaran langganan mereka, Claude Max dan sebagainya

00:00:36serta bagaimana mereka menindak penggunaan langganan yang tidak sah. Mereka melakukannya sekarang

00:00:43karena tentu saja penawaran langganan mereka, sama seperti yang ditawarkan OpenAI, sangat disubsidi

00:00:50dan mereka tidak bisa menghasilkan uang jika semua orang memaksimalkan penggunaan langganan mereka. Jadi ya, mereka benar-benar

00:00:56membatasi atau mencoba membatasi penggunaan langganan mereka hanya untuk manusia di situs web mereka

00:01:04atau di Claude code atau aplikasi desktop Claude. Tapi ya, sekali lagi, ini bukan fokus kita di sini

00:01:11dan saya bahkan tidak akan fokus pada pertumbuhan pendapatan mereka yang mengesankan, meski itu layak dicatat sebentar

00:01:19karena Anthropic telah mencapai pendapatan rutin tahunan sebesar 30 miliar dolar yang sudah sangat

00:01:27mengesankan, tetapi lebih mengesankan lagi jika Anda membandingkannya dengan 9 miliar dolar di akhir tahun 2025. Jadi

00:01:35mereka melipatgandakan lebih dari tiga kali lipat pendapatan rutin tahunan mereka hanya dalam beberapa bulan. Yang mana

00:01:41sangat mengesankan. Dan karena itu tentu saja jika Anda ingin belajar cara menggunakan Claude code secara efisien,

00:01:47bagaimana cara memaksimalkannya, saya punya kursusnya dan itu sangat populer yang tentu saja membuat

00:01:53saya senang dan Anda bisa menemukan tautannya di bawah jika ingin bergabung dan belajar cara bekerja secara efisien dengan

00:01:59Claude code. Tapi seperti yang disebutkan, itu bahkan bukan topik utama di sini. Sebaliknya, saya ingin membahas

00:02:05Project Glasswing dan model baru mereka, Mythos, yang belum mereka rilis ke publik dan

00:02:14mereka juga membagikan alasannya. Dan saya pikir ini penting untuk dipahami dan juga penting untuk mencoba

00:02:20melihat di balik layar, di balik alasan mereka dan apa dampak dari model baru ini dan cara kerjanya

00:02:27serta kemampuannya bagi kita para pengembang. Jadi apa itu Project Glasswing? Apa sebenarnya model baru mereka?

00:02:33Di bawah tentu saja Anda juga bisa menemukan tautan ke artikel ini. Ini adalah artikel di situs resmi

00:02:39Anthropic di mana mereka mengumumkan Project Glasswing dan juga membahas tentang model baru mereka.

00:02:44Dan jika saya gulir ke bawah sedikit, kita sudah bisa melihat beberapa ringkasan statistik benchmark di sini di mana kita bisa melihat

00:02:52bahwa model baru ini, versi pratinjau Mythos dari model tersebut, nama modelnya adalah Mythos, bekerja

00:02:59jauh lebih baik daripada Opus 4.6. Dan tergantung pada benchmark mana yang Anda lihat, ada perbedaan yang cukup besar

00:03:07antara Opus 4.6 dan model baru ini. Sekarang tentu saja ini sebenarnya tidak terlalu

00:03:15mengesankan. Kapan pun model baru diumumkan, tidak peduli dari perusahaan mana pun, kinerjanya akan jauh lebih baik atau

00:03:21setidaknya sedikit lebih baik daripada semua model pesaing, jika tidak maka model tersebut tidak akan dirilis. Dan tentu saja

00:03:26ada cara untuk memanipulasi beberapa benchmark ini jadi saya biasanya tidak terlalu peduli

00:03:31dengan angka-angka benchmark tersebut dan itu tidak akan berbeda untuk model yang ini, tetapi

00:03:39ada hal-hal menarik tentang model Mythos yang baru. Dan faktanya adalah Anthropic memutuskan untuk tidak

00:03:46merilisnya ke publik karena seperti yang mereka katakan, model ini terlalu mahir dalam menemukan dan mengeksploitasi kerentanan

00:03:56di sistem operasi, perangkat lunak lain, browser, pokoknya di perangkat lunak secara umum. Dan dalam artikel ini

00:04:05dan juga dalam artikel terpisah yang juga ditautkan di bawah, mereka membagikan beberapa detail dan terutama artikel terpisah ini

00:04:11sangat panjang dan memberikan contoh konkret untuk kerentanan dan

00:04:19potensi eksploitasi yang ditemukan model baru ini. Misalnya mereka memulai di artikel ini dengan eksploitasi

00:04:28dan kerentanan yang sangat serius yang ditemukan di OpenBSD. OpenBSD tentu saja adalah sistem operasi

00:04:38yang populer pada perangkat lunak jaringan tertentu misalnya dan Mythos, model baru mereka

00:04:45yang dijalankan dalam lingkungan agen seperti Claude code saya rasa, mampu menemukan dan mengeksploitasi, dan itulah

00:04:53bagian yang menarik, sebuah kerentanan yang terkait dengan integer overflow dan akses memori, akses memori

00:05:02tak terduga yang mampu merusak mesin yang menjalankan OpenBSD dengan cara yang dapat direproduksi, yang

00:05:12tentu saja dapat dimanfaatkan untuk menjalankan serangan denial of service yang sangat merusak dengan mengirimkan secara berulang

00:05:20paket dan permintaan khusus ke mesin-mesin semacam itu di sini yang mengeksploitasi kerentanan tersebut untuk melumpuhkan

00:05:27mesin-mesin itu dan berpotensi melumpuhkan seluruh jaringan perusahaan, dan kerentanan ini

00:05:34terdeteksi dalam satu proses yang biayanya di bawah lima puluh dolar meskipun keseluruhan proses biayanya di bawah dua puluh

00:05:43ribu dolar dan karena Anda tentu saja tidak tahu sebelumnya proses mana yang akan menemukan kerentanan,

00:05:48angka itulah yang penting. Tetap saja tentu saja mudah untuk membayangkan bahwa model yang mampu menemukan

00:05:57kerentanan kritis seperti itu dengan biaya yang relatif rendah, tergantung siapa Anda,

00:06:04jika Anda adalah sebuah negara misalnya atau aktor jahat yang serius, itu mungkin bukan uang yang banyak bagi Anda.

00:06:13Itu tentu saja menjadi masalah karena mudah untuk membayangkan jika model seperti itu dikembangkan oleh

00:06:22sebuah perusahaan, organisasi yang kurang peduli dengan keamanan dan atau yang mungkin tidak perlu

00:06:31takut akan konsekuensi apa pun dari penyalahgunaan kerentanan tersebut, ini bisa menjadi masalah dan

00:06:42sepertinya kita sedang memasuki era baru dengan AI dengan model-model AI ini di mana tidak ada yang aman

00:06:56dan lebih mudah dari sebelumnya untuk menyebarkan agen AI secara massal yang menjalankan model seperti ini untuk memindai semua jenis

00:07:05perangkat lunak dan menemukan serta berpotensi mengeksploitasi kerentanan, dan tentu saja sebagai manusia sendirian

00:07:13tidak ada cara untuk mengimbanginya. Maksud saya, bug atau eksploitasi yang ditemukan di sini telah ada

00:07:19selama saya pikir mereka bilang 27 tahun atau semacam itu, ini menunjukkan bahwa tidak ada manusia yang mampu menemukan

00:07:29bug ini dalam jangka waktu yang begitu lama, termasuk aktor jahat yang tentu saja memiliki

00:07:35kepentingan untuk dapat menyerang sistem operasi ini di masa lalu juga. Nah ini hanyalah salah satu

00:07:41mungkin temuan paling menonjol yang dimiliki model baru ini, mereka mendaftarkan lebih banyak lagi bug dan eksploitasi

00:07:49yang ditemukan model tersebut dan terkadang juga dapat disalahgunakan dan mereka juga berbagi cerita lain di X misalnya

00:07:57seperti model yang mampu keluar dari sandbox atau agen AI yang menjalankan model tersebut mampu

00:08:04keluar dari sandbox tempat ia dijalankan dan itu membawa kita kembali ke Project Glasswing yang

00:08:11merupakan inisiatif yang dibuat oleh Anthropic bersama dengan perusahaan besar lainnya seperti AWS, Apple, Microsoft,

00:08:21Linux Foundation, dan lainnya untuk menggunakan model ini guna menambal perangkat lunak mereka sebelum model ini

00:08:30dirilis secara publik dan sebelum publik mendapatkan akses ke model ini. Itulah narasi

00:08:38dari artikel ini, itulah penjelasan dari Anthropic dan saya memiliki pemikiran yang campur aduk di sini. Sekarang di satu sisi,

00:08:48saya tidak punya alasan kuat untuk percaya bahwa ini tidak benar. Jelas Anthropic punya beberapa alasan untuk

00:08:56tidak merilis model ini di luar apa yang mereka sebutkan di sini, misalnya saya membaca bahwa

00:09:04model ini adalah model dengan parameter sekitar 10 triliun yang jauh lebih besar daripada semua model frontier

00:09:11yang kita miliki sejauh ini, yang dapat kita gunakan secara publik sejauh ini dan pelatihannya dikatakan telah memakan biaya

00:09:20sekitar 10 miliar dolar. Biaya token dari model ini saya baca diperkirakan berada di kisaran ini,

00:09:3025 dolar hingga 125 dolar untuk token input dan output, dan tentu saja itu juga akan menjadi alasan untuk tidak

00:09:39merilis model ini karena mereka tidak dapat memasukkannya ke dalam langganan Claude mereka karena itu terlalu

00:09:46mahal, mereka mungkin harus menaikkan harga langganan ke titik harga di mana tidak banyak

00:09:52orang yang mau membayarnya dan oleh karena itu tidak akan ada cara untuk mengeksposnya ke

00:09:59publik setidaknya sebagai bagian dari Claude code. Sekarang tentu saja mereka masih bisa mengeksposnya melalui API mereka dengan dasar

00:10:05biaya bayar per penggunaan dan jika itu mahal siapa yang peduli jika ada perusahaan atau orang yang

00:10:12mau membayarnya mereka bisa melakukannya dan di sanalah bagian kekhawatiran keamanan siber

00:10:18mungkin benar-benar berperan karena jelas semua itu kemungkinan besar tidak mengada-ada, maksud saya itu pasti

00:10:26tidak mengada-ada. Tim FFmpeg misalnya yang juga terdaftar di sini sebagai sebuah kerentanan yang mana mereka

00:10:36mampu menemukan kerentanan di FFmpeg, tim tersebut mengonfirmasi di X bahwa Anthropic mengirimkan

00:10:44mengirimkan patch untuk kerentanan dalam program perangkat lunak FFmpeg. Jadi ya, ini jelas tidak

00:10:55mengada-ada, kekhawatiran ini valid, kekhawatiran keamanan siber valid terutama karena jika uang

00:11:03bukan masalah utama, Anda bisa menyebarkan ribuan agen yang berjalan secara bersamaan menggunakan ini atau model

00:11:11serupa yang mungkin kita miliki di masa depan untuk memindai semua jenis perangkat lunak dan mengeksploitasinya dan tentu saja

00:11:19masalah besarnya adalah menggunakan model ini untuk menemukan kerentanan dan menambalnya itu mungkin saja tetapi

00:11:30itu hanya mungkin jika pemilik atau pengelola perangkat lunak tertentu mampu membeli model tersebut

00:11:37atau mendapatkan akses gratis atau semacamnya dan bahkan jika sebuah kerentanan sudah ditambal, kita semua tahu

00:11:46bahwa tidak semua komputer di luar sana, tidak semua mesin, tidak semua pengguna menjalankan perangkat lunak yang mutakhir di

00:11:55perangkat mereka. Jika Anda melihat semua berbagai server yang berjalan di luar sana di jaringan internet,

00:12:04saya rasa sebagian besar dari mereka menjalankan perangkat lunak yang kedaluwarsa. Maksud saya di ponsel atau

00:12:12laptop kita, kita sering tidak menjalankan perangkat lunak terbaru, versi terbaru dari sistem operasi kita, patch

00:12:20keamanan terbaru mungkin tidak terpasang dan itu berlaku untuk semua lapisan perangkat lunak dan di dunia

00:12:28di mana menemukan kerentanan keamanan lebih mudah dari sebelumnya, itu tentu saja menjadi masalah yang bahkan

00:12:34lebih besar karena tentu saja hal baik tentang model AI ini adalah ia juga bisa digunakan untuk

00:12:43secara proaktif mencari kerentanan keamanan dan menambalnya, jadi ini bukan hanya alat untuk

00:12:48penyerang, ia juga bisa membuat pertahanan lebih mudah karena Anda sekarang memiliki alat yang bisa dijalankan secara simultan

00:12:56secara paralel di ribuan agen untuk mengamankan perangkat lunak Anda, secara teori ini bisa menjadi

00:13:01alat yang sangat berguna untuk pertahanan. Tetapi tentu saja sekali lagi tidak setiap perusahaan atau orang yang mungkin sedang mengembangkan

00:13:09perangkat lunak krusial mampu membelinya, mungkin tertarik menggunakannya dan bahkan jika digunakan

00:13:16untuk menemukan dan menambal kerentanan, tetap saja versi terbaru ini tidak akan terpasang di mana-mana

00:13:23dan itu tentu saja memberi penyerang peluang yang bagus di mana mereka tahu lebih banyak tentang

00:13:31kerentanan daripada sebelumnya pada suatu saat karena jauh lebih banyak kerentanan yang terdeteksi tetapi tidak setiap

00:13:39mesin atau setiap pengguna terlindungi dari kerentanan tersebut dan itu adalah salah satu kekhawatiran nyata

00:13:46yang saya miliki tentang perkembangan ini sekarang. Itulah gambaran yang lebih besar yang memengaruhi semua orang,

00:13:52semua perusahaan, semua manusia pada akhirnya. Pertanyaan lainnya tentu saja adalah apa arti model seperti

00:13:59ini bagi kita para pengembang. Maksud saya jelas ini sepertinya model yang sangat mumpuni yang mampu

00:14:08mencari kerentanan sendiri dan mengeksploitasi kerentanan sendiri. Jadi ya, apa

00:14:16dampaknya bagi pengembang dan menurut saya di sini tidak banyak yang berubah untuk saat ini. Maksud saya

00:14:28kita sudah hidup di dunia di mana agen AI seperti Claude code dan model yang mendasarinya dan tentu saja

00:14:34hal yang sama berlaku untuk Codex dan sebagainya, apa pun agen AI dan model favorit Anda,

00:14:39mampu menghasilkan sebagian besar kode kita. Anda mungkin tidak menggunakannya, Anda mungkin tidak menyukainya, saya membuat

00:14:46video terpisah di mana saya berbagi perasaan saya tentang hal itu dan bahwa ini menghilangkan kegembiraan dari bagian

00:14:52pengembangan perangkat lunak bagi saya, tetapi itulah kenyataannya meskipun suka atau tidak dan

00:14:57percayalah saya belum tentu menyukainya, tetapi ya inilah kenyataannya. Apa yang dibawa oleh manusia

00:15:04atau mengapa manusia masih penting di sini dan mungkin lebih penting dari sebelumnya adalah tentu saja karena Anda

00:15:12pasti tidak ingin agen AI seperti ini menjadi tidak terkendali dan bekerja sepenuhnya sendiri. Mengarahkan

00:15:21model dan agen seperti itu, mengendalikan mereka, memberi mereka tugas yang jelas, membatasi cakupan pekerjaan yang mereka lakukan,

00:15:29semua hal ini lebih penting dari sebelumnya. Model-model ini sepertinya bisa melakukan jauh lebih banyak daripada

00:15:39sebagian besar pengembang, jelas jauh lebih banyak daripada yang bisa saya lakukan,

00:15:43namun dalam hal merilis produk, dalam hal membangun perangkat lunak yang digunakan oleh manusia,

00:15:54pengaruh manusia tentu saja sangat, sangat penting. Apa yang berubah tentu saja

00:16:01adalah peran kita sebagai pengembang perangkat lunak. Kita berubah dari orang yang menulis kode menjadi

00:16:08orang yang mengarahkan model, yang meninjau kode, yang memahami apa yang

00:16:12dilakukannya, yang menetapkan cakupan dan ya sekali lagi saya membahas ini di video lain tentang bagaimana hal itu

00:16:18berubah dan bahwa ini belum tentu apa yang Anda sukai, itu pasti bukan

00:16:26alasan saya terjun ke pengembangan perangkat lunak pada awalnya, tetapi ya inilah dampaknya di sini dan

00:16:31semakin mumpuni model-model ini saya pikir semakin penting untuk memiliki suara manusia di

00:16:39sana juga, pengaruh manusia di sana juga jadi itulah perubahan peran tersebut dan

00:16:48peran kita di masa depan. Tapi ya, maksud saya ini adalah perkembangan yang sangat menarik dan terutama

00:16:58model ini dan implikasinya serta relevansi keamanan siber yang dimilikinya

00:17:04membuat kita bertanya-tanya apa yang akan terjadi atau apa yang akan terjadi jika aktor lain, negara lain, atau

00:17:16organisasi di dunia mendapatkan model ini atau model yang serupa kemampuannya,

00:17:23karena tentu saja hanya masalah waktu sampai model dengan kemampuan serupa dapat diakses

00:17:33oleh publik atau setidaknya oleh negara dan aktor lain. Dan ya saya tidak yakin apakah

00:17:44kita siap untuk perlombaan baru dalam keamanan siber itu dan jeda waktu antara bug yang ditemukan

00:17:52dan ditambal serta orang-orang memasang patch tersebut. Saya pikir kita akan memasuki era baru keamanan

00:18:00siber dan kita akan dapat menyesuaikan diri, saya yakin, tetapi ini benar-benar menandai titik yang

00:18:08menarik dalam sejarah pengembangan model, menurut saya.

Key Takeaway

Anthropic menunda perilisan publik model Mythos berkapasitas 10 triliun parameter karena kemampuannya yang sangat berbahaya dalam mengeksploitasi kerentanan perangkat lunak secara otomatis dengan biaya rendah di bawah 50 dolar per temuan.

Highlights

Anthropic mencapai pendapatan rutin tahunan sebesar 30 miliar dolar pada April 2026, melonjak tiga kali lipat dari 9 miliar dolar di akhir tahun 2025.
Model AI Mythos memiliki sekitar 10 triliun parameter dengan biaya pelatihan mencapai 10 miliar dolar.
Mythos menemukan dan mengeksploitasi kerentanan integer overflow pada OpenBSD yang telah ada selama 27 tahun tanpa terdeteksi manusia.
Biaya untuk mendeteksi satu kerentanan kritis menggunakan model Mythos dalam lingkungan agen berada di bawah 50 dolar.
Estimasi biaya penggunaan model Mythos berkisar antara 25 dolar hingga 125 dolar per satu juta token input dan output.
Project Glasswing melibatkan kolaborasi Anthropic dengan AWS, Apple, Microsoft, dan Linux Foundation untuk menambal celah keamanan sebelum rilis publik model Mythos.

Timeline

Pertumbuhan Finansial dan Pembatasan Langganan Anthropic

Pendapatan rutin tahunan Anthropic melonjak dari 9 miliar dolar menjadi 30 miliar dolar dalam hitungan bulan.
Layanan langganan seperti Claude Max mendapatkan subsidi besar sehingga penggunaan otomatis oleh non-manusia mulai dibatasi ketat.

Pertumbuhan pendapatan yang masif menunjukkan relevansi tinggi Anthropic bagi pengembang perangkat lunak di masa depan. Perusahaan kini menindak tegas penyalahgunaan akun langganan untuk menjaga profitabilitas karena biaya operasional model yang tinggi. Fokus penggunaan dialihkan kembali ke interaksi manusia melalui situs web, aplikasi desktop, atau Claude Code.

Project Glasswing dan Kemampuan Model Mythos

Project Glasswing adalah inisiatif keamanan untuk mengidentifikasi risiko sebelum model AI baru dirilis ke publik.
Model Mythos menunjukkan performa benchmark yang jauh melampaui Opus 4.6 dalam pengujian internal.
Anthropic memutuskan untuk tidak merilis Mythos karena risiko eksploitasi sistem operasi dan browser yang terlalu tinggi.

Mythos merupakan versi pratinjau yang dirancang untuk lingkungan agen. Keputusan untuk menahan rilis didasarkan pada temuan bahwa model ini terlalu mahir dalam mencari titik lemah pada perangkat lunak secara umum. Statistik benchmark menunjukkan lompatan kemampuan yang signifikan dibandingkan generasi sebelumnya, namun risiko keamanan menjadi prioritas utama di atas peluncuran produk.

Eksploitasi Kerentanan OpenBSD Berusia 27 Tahun

Mythos berhasil menemukan bug akses memori pada OpenBSD yang tidak terdeteksi oleh manusia selama hampir tiga dekade.
Serangan denial of service yang melumpuhkan jaringan perusahaan dapat direproduksi melalui paket permintaan khusus hasil temuan AI.
Proses penemuan bug kritis ini memakan biaya operasional yang sangat rendah bagi aktor jahat tingkat negara.

Eksploitasi yang ditemukan melibatkan integer overflow yang dapat menyebabkan kerusakan mesin secara konsisten. Fakta bahwa bug ini bertahan selama 27 tahun membuktikan keunggulan AI dibandingkan metode audit manual tradisional. Kemudahan penyebaran agen AI secara massal untuk memindai perangkat lunak menciptakan ancaman siber baru di mana pertahanan manusia sulit mengimbangi kecepatan serangan otomatis.

Struktur Biaya dan Kolaborasi Industri

Model dengan 10 triliun parameter ini memerlukan biaya token antara 25 dolar hingga 125 dolar.
Anthropic bekerja sama dengan AWS, Apple, dan Microsoft untuk memperbaiki kode sumber mereka menggunakan Mythos.

Biaya operasional yang sangat mahal menjadi alasan teknis kedua mengapa Mythos tidak disertakan dalam paket langganan Claude standar. Project Glasswing berfungsi sebagai masa karantina di mana perusahaan teknologi besar dan pengembang open-source seperti tim FFmpeg menerima patch keamanan langsung dari Anthropic. Langkah ini memastikan ekosistem perangkat lunak diperkuat sebelum model serupa jatuh ke tangan pihak yang tidak bertanggung jawab.

Pergeseran Peran Pengembang dalam Era AI Otonom

Keamanan siber tetap rentan karena banyak server global masih menjalankan perangkat lunak usang tanpa patch terbaru.
Peran pengembang perangkat lunak berubah dari penulis kode menjadi peninjau dan pengarah model AI.
Kontrol manusia tetap krusial untuk membatasi ruang lingkup kerja agen AI agar tidak bekerja di luar kendali.

Meskipun AI dapat digunakan untuk pertahanan proaktif, kesenjangan antara penemuan bug dan penerapan patch oleh pengguna akhir tetap menjadi risiko utama. Pengembang manusia kini lebih berfungsi sebagai arsitek yang menetapkan tugas dan memvalidasi output dari model yang memiliki kemampuan teknis melampaui rata-rata manusia. Era baru ini menuntut adaptasi terhadap perlombaan senjata keamanan siber yang digerakkan oleh kecerdasan buatan.

Community Posts

Write about this video