Perangkat Baru Nvidia Baru Saja Memperbaiki Keterampilan Agen

Bahasa Indonesiaالعربية Deutsch English Español Français हिन्दी 日本語 한국어 Русский 中文

Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Saat ini, keterampilan agen AI ada di mana-mana. Setiap agen menjalankannya dan Anda memercayainya tanpa

00:00:05pemeriksaan apa pun. Tapi inilah bagian yang menakutkan. Para peneliti mempelajari lebih dari 30.000 keterampilan ini dan lebih dari

00:00:10seperempatnya memiliki kerentanan keamanan. Jadi NVIDIA membuat alat bernama Skill Spectre yang

00:00:15memindai keterampilan apa pun sebelum Anda menginstalnya dan memberi tahu Anda seberapa bahayanya itu. Tapi di sinilah

00:00:20hal itu menjadi menarik. Satu jenis serangan bisa lolos begitu saja dan pengaturan yang sebenarnya

00:00:24menangkapnya dinonaktifkan secara default, jadi kebanyakan orang bahkan tidak tahu itu ada. Mengaktifkannya biasanya

00:00:29membutuhkan biaya, tetapi kami menemukan cara untuk mengakalinya. Dan pada akhirnya, kami tidak hanya memindai keterampilan. Kami membangun

00:00:34seluruh alur kerja yang mengubah cara Anda menemukan dan menginstalnya selamanya. Sekarang sebelum kita masuk ke

00:00:39alur kerja lengkapnya, mari kita berikan tur singkat alat ini dan apa yang Anda perlukan untuk menggunakannya. Jadi ini adalah perintah

00:00:44instal di repo GitHub. Anda bisa langsung menyalinnya dan memberikannya kepada Claude Code dan pada dasarnya ia akan

00:00:49menginstal dan menyiapkan semuanya untuk Anda. Claude Code akan menginstal semua dependensi yang dapat

00:00:54Anda lihat di sini. Dan setelah semua itu selesai, Anda bisa mulai menggunakan Skill Spectre. Di dalam repo GitHub,

00:00:59ada folder pengujian ini dan di dalamnya mereka punya beberapa keterampilan berbahaya yang bisa Anda jalankan untuk

00:01:04mengonfirmasi bahwa alat tersebut berfungsi. Jadi kami menjalankannya pada keterampilan-keterampilan ini dan pada setiap keterampilannya, alat ini memberi tahu Anda untuk tidak

00:01:09menginstal. Semakin tinggi skornya, semakin berbahaya keterampilannya. Dan dengan setiap pengujian, alat ini tidak hanya memberi

00:01:14Anda angka. Alat ini menunjukkan nomor baris yang tepat, lokasi yang tepat, dan nama file di mana konflik

00:01:19terjadi, yang pada dasarnya mendorong skornya naik. Sekarang ini bukan satu-satunya cara untuk menggunakan alat ini, ada

00:01:24mode lain. Tapi sebelum Anda mengerti mengapa kita membutuhkan mode kedua itu, Anda perlu tahu dua hal: bagaimana sebuah keterampilan

00:01:30bahkan menyerang Anda dan bagaimana alat ini benar-benar menangkap serangan itu. Sekarang ada 14 kategori,

00:01:34tapi untuk mempermudah, kami mengelompokkannya menjadi enam kategori yang serupa. Jadi cara pertama sebuah keterampilan dapat menyerang

00:01:39Anda adalah dengan instruksi tersembunyi. Lihat, sebuah keterampilan hanyalah file teks yang penuh dengan instruksi dan agen Anda membaca

00:01:45semuanya dan memperlakukannya sebagai perintah. Masalahnya, keterampilan yang buruk bisa menyembunyikan instruksi tambahan di sana yang

00:01:50tidak akan pernah Anda lihat, tetapi agen Anda melihatnya. Mereka menyelipkannya di dalam komentar, atau mereka menggunakan karakter tak terlihat,

00:01:55atau mereka mengacak teks menjadi kode yang terlihat seperti omong kosong bagi Anda, tetapi AI membacanya dengan baik.

00:02:01Jadi pemindai dibangun khusus untuk memburu instruksi tersembunyi ini dan menemukannya. Cara kedua

00:02:06adalah peniruan identitas. Jadi agen Anda memiliki alat yang dipercayainya dan digunakan berdasarkan nama. Katakanlah ada satu alat bernama

00:02:12“read” yang membaca file untuknya. Jadi sebuah keterampilan jahat memberikan alatnya sendiri nama yang persis sama,

00:02:17dan agen Anda mengambil yang buruk karena mengira itu adalah yang aman yang sudah dikenalnya. Dan cara mereka melakukannya

00:02:22Cara mereka melakukannya sungguh licik. Mereka menukar satu huruf dengan huruf yang mirip dari alfabet lain.

00:02:27tetapi “A” di sana sebenarnya adalah huruf Rusia yang terlihat identik dengan milik kita. Bagi Anda dan agen Anda secara

00:02:33sepintas, itu kata yang sama, tetapi di bawahnya itu adalah alat yang benar-benar berbeda. Dan pemindai menangkap

00:02:38ini dengan memeriksa identitas asli dari setiap karakter, jadi ia melihat satu huruf palsu itu dan

00:02:43menandainya. Cara ketiga adalah ketika keterampilan tersebut hanya berbohong tentang apa yang dilakukannya. Deskripsinya mengatakan satu hal,

00:02:48kodenya melakukan hal lain. Jadi ia menyebut dirinya sebagai pemformat sederhana dan kemudian diam-diam menghubungi

00:02:53internet di latar belakang. Atau ia mengatakan hanya membutuhkan izin untuk membaca file Anda, tetapi kodenya

00:02:58sebenarnya sedang menulis file dan menjalankan perintah juga. Dan ini jauh lebih sulit untuk ditangkap. Di sinilah mode

00:03:03kedua masuk, tetapi kita akan membahasnya nanti. Cara keempat adalah keterampilan tersebut mencuri kredensial Anda.

00:03:08Ini bisa berupa kunci API Anda, kata sandi Anda. Jadi sebuah keterampilan menelusuri semua kunci yang disimpan di mesin

00:03:13Anda, mengambilnya, dan mengirimkannya ke suatu server. Cara kelima adalah keterampilan tersebut hanya menjalankan

00:03:18malware secara langsung. Ini termasuk hal-hal seperti reverse shell, yang pada dasarnya memberikan orang asing

00:03:23kendali jarak jauh atas seluruh komputer Anda. Dan karena jenis malware ini memiliki sidik jari yang diketahui,

00:03:28pemindai hanya mencocokkan kode dengan pustaka besar sidik jari tersebut. Dan cara keenam adalah

00:03:32dependensi beracun. Jadi sebuah keterampilan sering menggunakan alat CLI, pada dasarnya program luar kecil yang ia jalankan di

00:03:39terminal untuk menangani bagian dari pekerjaannya. Dan keterampilan buruk mengambil bagian yang sebenarnya berbahaya.

00:03:44Mungkin itu adalah paket palsu dengan nama yang hanya berbeda satu huruf dari nama populer. Jadi Anda menarik yang salah

00:03:49dan itu menjalankan malware seperti jenis terakhir. Jadi pemindai memeriksa setiap paket yang ditarik oleh keterampilan

00:03:54terhadap basis data langsung dari paket-paket yang diketahui buruk. Dan ia menandai nama-nama palsu serta perintah unduh dan jalankan

00:03:59itu untuk menjaga sistem Anda tetap aman. Jadi dalam mode pertama itu, ia hanya mencocokkan pola tanpa konteks apa pun,

00:04:05yang berarti ia akhirnya menandai hal-hal yang sebenarnya baik-baik saja. Dan itulah yang kami sebut sebagai positif

00:04:09palsu. Jadi di situlah mode kedua masuk, yaitu pemindaian AI dan mengaktifkannya sederhana. Anda cukup

00:04:14menjatuhkan flag no LLM ini dan ia melakukan pemindaian kedua di sini. Tapi jika Anda melihat ke dalam kode, Anda akan menemukan

00:04:20bahwa untuk menjalankan pemeriksaan AI pada suatu keterampilan, Anda perlu memasukkan kunci open AI. Jadi untuk mengakali biaya itu,

00:04:26kami hanya menggunakan Claude Code itu sendiri untuk menjalankan pemeriksaan AI tersebut. Sekarang agen utama dalam Claude Code sebenarnya tidak

00:04:32melakukannya sendiri. Kami menggunakan mode headless Claude, yang pada dasarnya adalah Claude Code yang berjalan di latar belakang

00:04:38tanpa jendela obrolan, hanya menjalankan perintah sendiri. Dan kami yakin sebagian besar dari Anda tahu itu tidak gratis,

00:04:43tetapi Anda mendapatkan kredit bulanan untuk itu dengan paket Anthropic Anda. Dan Anda bisa langsung meminta Claude Code untuk

00:04:48membuat perubahan yang baru saja kita bicarakan dan itu akan melakukannya untuk Anda. Tentu saja Anda mungkin mengalami satu atau dua bug,

00:04:52tetapi itu hanya satu baris perintah yang bisa Claude siapkan untuk Anda. Dan jika Anda menikmati videonya sejauh ini,

00:04:57berlangganan saluran ini dan tekan tombol hype. Gerakan dukungan kecil ini sangat berarti bagi kami.

00:05:03Jadi mereka juga memiliki keterampilan berbahaya di folder pengujian mereka yang benar-benar memerlukan pemeriksaan AI. Saat Anda

00:05:07menjalankan pemeriksaan no LLM pada salah satunya, skornya keluar sebagai nol, yang berarti itu sangat aman.

00:05:12Tapi begitu Anda menjalankannya dengan pemeriksaan AI, skornya melonjak ke 100, ia memberi tahu Anda untuk tidak menginstal,

00:05:17dan ia menjelaskan dengan tepat mengapa. Tapi bagaimana jika alih-alih hanya mendeteksi masalah dalam suatu keterampilan,

00:05:22pemindai juga membantu Anda memperbaikinya. Jadi itulah mengapa kami mengubah pemindai menjadi sebuah keterampilan. Dan

00:05:27Anda mungkin bertanya-tanya mengapa namanya Discover Skills? Yah, karena kami tidak hanya membuat satu

00:05:31keterampilan terpisah. Kami membuat seluruh proses yang membantu kami menemukan lebih banyak keterampilan dan memastikan semuanya aman

00:05:36sebelum kami menginstalnya. Jadi kami telah menggunakan skills.sh untuk menemukan keterampilan baru untuk sementara waktu sekarang. Ini pada dasarnya adalah

00:05:42repo git yang dibuat khusus untuk keterampilan. Jadi satu pustaka bersama yang besar yang bisa Anda tarik. Dan kami pikir mereka

00:05:47baru saja merilis pembaruan CLI. Jadi sekarang Claude bisa langsung menjalankan kueri pencarian melalui baris perintah

00:05:53dan menarik keterampilan terbaik yang dibutuhkannya sebelum menginstal apa pun. Dan kami ingin pemindai kami

00:05:57berjalan di atas itu. Jadi di sini, kami memiliki scan.sh, yang merupakan skrip yang sebenarnya menjalankan

00:06:02skill specter. Karena skill specter adalah alat CLI, itu harus dijalankan sebagai perintah. Jadi kami membuat seluruh

00:06:08skrip dan kami memanggang perbaikan mode headless Claude ke dalamnya. Jadi secara default, itu menjalankan

00:06:13pemeriksaan normal, tetapi jika Anda mau, itu akan menjalankan pemeriksaan AI juga. Dan jika Anda membuka skill.md, Anda bisa melihat langkah-langkah dasar

00:06:19yang dijelaskan. Itu mengidentifikasi target, kemudian memindainya, kemudian menunjukkan temuannya. Dan setelah tahu

00:06:24apa masalahnya, itu akan memperbaikinya, kemudian menjalankan seluruh siklus lagi setelahnya untuk memastikan

00:06:28semuanya bersih. Jadi sebagai contoh, folder yang kami tunjukkan kepada Anda saat ini adalah folder desain lab AI kami.

00:06:34Itu pada dasarnya seluruh proses desain kami yang dikompres ke dalam satu folder dengan sekumpulan keterampilan

00:06:39di dalamnya. Kami punya seluruh video tentang ini. Dan di atas itu, seluruh sistem tersedia di AI labs

00:06:44pro, yang merupakan komunitas kami. Jadi jika Anda ingin mendukung saluran ini dan mengambil seluruh sistem desain ini,

00:06:49periksa itu. Dan keterampilan penemuan ini akan diunggah di sana juga. Tautan akan ada di

00:06:54deskripsi, tetapi kami membangun di atas ini di sini. Jadi kami menambahkan keterampilan make design.md baru,

00:06:59yang menjelaskan cara tercepat untuk menarik token desain dari aplikasi yang sudah Anda bangun, pada dasarnya

00:07:04warna, font, dan aturan spasi, dan menggabungkannya ke dalam file design.md. Jadi di sini kami ingin membuat

00:07:10file design.md. Jadi kami memberitahunya bahwa kami ingin meningkatkannya dan bahwa ia harus pergi mencari

00:07:15alat lain di luar sana. Jadi ia menggunakan skills.sh, kemudian kami memuat keterampilan penemuan dan itu menarik kembali segelintir

00:07:21keterampilan. Ini adalah keterampilan yang dibawanya kembali dan dua yang pertama terlihat menarik. Jadi kami ingin

00:07:26menggalinya. Kami memintanya untuk menginstal dan menguji keduanya. Dan seperti kata alur kerja penemuan keterampilan,

00:07:31ia tidak akan menginstal keterampilan apa pun tanpa memindainya terlebih dahulu. Jadi ia menginstalnya dan membacanya

00:07:36dan memberi tahu kami secara langsung bahwa tidak satu pun dari keduanya akan membantu dengan keterampilan make design.md. Tapi dari

00:07:41sudut pandang keamanan, yang pertama mendapat skor 10, yang berarti itu aman, dan yang kedua mendapat

00:07:46100, yang berarti jangan menginstalnya. Jadi kami menyuruhnya untuk menjalankan pemeriksaan AI pada keterampilan kedua itu. Ia menjalankannya lagi

00:07:52melalui mode headless Claude dan kali ini skornya kembali menjadi nol. Ini berarti keterampilan

00:07:56itu aman untuk digunakan. Dan itulah tujuan dari sistem ini. Anda tidak hanya mengambil keterampilan secara membabi buta dari

00:08:01internet. Anda memiliki seluruh proses yang bisa Anda mulai hanya dengan menggunakan sebuah keterampilan. Sekarang mari kita dengarkan

00:08:06kata dari sponsor kami. Nimblist. Jika Anda menggunakan Claude code atau codex, Anda tahu masalahnya. Anda memiliki banyak

00:08:12sesi berjalan, file berubah di mana-mana, dan Anda terus-menerus berpindah antara terminal, browser,

00:08:17dan editor hanya untuk melacak apa yang dilakukan agen Anda. Nimblist adalah ruang kerja visual sumber terbuka

00:08:23yang menempatkan semuanya di satu tempat. Saya memiliki tiga agen yang mengerjakan bagian proyek yang berbeda di

00:08:28saat yang sama dan alih-alih melompat antar jendela, saya bisa melihat semuanya di papan Kanban, melompat ke

00:08:33sesi apa pun, meninjau perubahan kode sebagai perbedaan merah dan hijau, dan menyetujui atau menolaknya secara individual. Saya sedang

00:08:38mengedit dokumen markdown, mockup UI, dan diagram arsitektur secara visual tepat di samping agen saya. Saat saya

00:08:45selesai, saya tidak harus membersihkan commit secara manual karena itu menghasilkan pesan commit git secara otomatis

00:08:50berdasarkan apa yang berubah. Tugas tetap terhubung ke sesi sebenarnya dan bahkan ada aplikasi seluler untuk

00:08:56melanjutkan sesi saat Anda jauh dari meja. Nimblist sepenuhnya gratis dan sumber terbuka

00:09:00dan Anda bisa memeriksanya dengan menggunakan tautan di komentar yang disematkan. Itu membawa kita ke akhir

00:09:05video ini. Jika Anda ingin mendukung saluran ini dan membantu kami terus membuat video seperti ini, Anda bisa melakukannya dengan

00:09:10menggunakan tombol super thanks di bawah. Seperti biasa, terima kasih telah menonton dan sampai jumpa di video berikutnya.

Key Takeaway

Sistem otomatisasi keamanan menggunakan alat CLI Skill Spectre dan mode headless Claude memungkinkan deteksi serta pemindaian proaktif terhadap kerentanan tersembunyi pada keterampilan agen AI sebelum diinstal.

Highlights

Penelitian menunjukkan lebih dari seperempat dari 30.000 keterampilan agen AI memiliki kerentanan keamanan.
Alat Skill Spectre memindai keterampilan AI untuk mendeteksi instruksi tersembunyi, peniruan identitas, dan aktivitas berbahaya sebelum instalasi.
Agen AI sering diserang melalui teknik seperti penggunaan karakter alfabet asing yang serupa untuk meniru alat yang sah.
Mode pemindaian AI memungkinkan analisis mendalam dengan mendeteksi perilaku mencurigakan seperti akses internet tidak sah yang tidak terlihat pada pemindaian pola biasa.
Integrasi Skill Spectre ke dalam alur kerja otomatis memungkinkan pemindaian, verifikasi, dan perbaikan keterampilan AI tanpa intervensi manual secara langsung.
Penggunaan mode headless Claude memungkinkan operasional pemindaian AI tanpa biaya tambahan yang besar dengan memanfaatkan kredit bulanan paket Anthropic.

Timeline

Risiko Keamanan Keterampilan Agen AI

Lebih dari 25% dari 30.000 keterampilan agen AI yang diteliti memiliki celah keamanan.
Skill Spectre berfungsi memindai dan menilai tingkat bahaya keterampilan sebelum instalasi.
Skor bahaya yang lebih tinggi menunjukkan risiko yang lebih besar dan detail lokasi konflik kode.
Pengguna dapat mengonfirmasi fungsi alat dengan menjalankan keterampilan berbahaya sampel dari repositori GitHub.

Banyak pengguna menginstal keterampilan AI tanpa pemeriksaan keamanan. Alat Skill Spectre diciptakan untuk memindai keterampilan dan memberikan peringatan berdasarkan skor bahaya. Alat ini memberikan detail spesifik seperti nomor baris dan nama file tempat konflik keamanan terjadi.

Metode Serangan dan Deteksi

Keterampilan berbahaya menggunakan instruksi tersembunyi dalam komentar atau kode yang tidak terlihat oleh pengguna.
Peniruan identitas dilakukan dengan menukar karakter alfabet lokal dengan karakter alfabet asing yang terlihat identik.
Keterampilan berbahaya sering kali berbohong tentang fungsi aslinya untuk mencuri kredensial atau menjalankan malware.
Pemindai memeriksa dependensi terhadap basis data paket berbahaya yang diketahui untuk mencegah eksekusi malware.

Terdapat enam kategori utama serangan termasuk instruksi tersembunyi, peniruan alat, ketidaksesuaian deskripsi dan fungsi, pencurian kredensial, eksekusi malware langsung, dan dependensi beracun. Pemindai menangkap serangan ini dengan memeriksa identitas karakter, membandingkan pola kode dengan sidik jari malware, dan memverifikasi paket dependensi.

Optimasi Keamanan dengan Pemindaian AI

Mode pemindaian AI mengatasi positif palsu yang dihasilkan oleh pemindaian pola biasa.
Mode headless Claude digunakan untuk menjalankan pemeriksaan AI tanpa biaya tambahan dengan memanfaatkan kredit bulanan Anthropic.
Alur kerja otomatis menggabungkan penemuan keterampilan melalui skills.sh dan verifikasi keamanan melalui Skill Spectre.
Sistem secara otomatis mengidentifikasi, memindai, memperbaiki, dan menguji ulang keterampilan untuk memastikan keamanan.

Pemindaian berbasis pola sederhana sering kali menghasilkan positif palsu. Pemindaian AI memberikan analisis mendalam yang lebih akurat dengan menjalankan pemeriksaan melalui Claude headless. Alur kerja yang dibangun menggabungkan penemuan keterampilan dan pemindaian otomatis, memastikan tidak ada keterampilan yang diinstal tanpa verifikasi keamanan terlebih dahulu.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video