Perangkat Baru Nvidia Baru Saja Memperbaiki Keterampilan Agen
AAI LABS
Computing/SoftwareSmall Business/StartupsInternet Technology
Transcript
00:00:00Saat ini, keterampilan agen AI ada di mana-mana. Setiap agen menjalankannya dan Anda memercayainya tanpa
00:00:05pemeriksaan apa pun. Tapi inilah bagian yang menakutkan. Para peneliti mempelajari lebih dari 30.000 keterampilan ini dan lebih dari
00:00:10seperempatnya memiliki kerentanan keamanan. Jadi NVIDIA membuat alat bernama Skill Spectre yang
00:00:15memindai keterampilan apa pun sebelum Anda menginstalnya dan memberi tahu Anda seberapa bahayanya itu. Tapi di sinilah
00:00:20hal itu menjadi menarik. Satu jenis serangan bisa lolos begitu saja dan pengaturan yang sebenarnya
00:00:24menangkapnya dinonaktifkan secara default, jadi kebanyakan orang bahkan tidak tahu itu ada. Mengaktifkannya biasanya
00:00:29membutuhkan biaya, tetapi kami menemukan cara untuk mengakalinya. Dan pada akhirnya, kami tidak hanya memindai keterampilan. Kami membangun
00:00:34seluruh alur kerja yang mengubah cara Anda menemukan dan menginstalnya selamanya. Sekarang sebelum kita masuk ke
00:00:39alur kerja lengkapnya, mari kita berikan tur singkat alat ini dan apa yang Anda perlukan untuk menggunakannya. Jadi ini adalah perintah
00:00:44instal di repo GitHub. Anda bisa langsung menyalinnya dan memberikannya kepada Claude Code dan pada dasarnya ia akan
00:00:49menginstal dan menyiapkan semuanya untuk Anda. Claude Code akan menginstal semua dependensi yang dapat
00:00:54Anda lihat di sini. Dan setelah semua itu selesai, Anda bisa mulai menggunakan Skill Spectre. Di dalam repo GitHub,
00:00:59ada folder pengujian ini dan di dalamnya mereka punya beberapa keterampilan berbahaya yang bisa Anda jalankan untuk
00:01:04mengonfirmasi bahwa alat tersebut berfungsi. Jadi kami menjalankannya pada keterampilan-keterampilan ini dan pada setiap keterampilannya, alat ini memberi tahu Anda untuk tidak
00:01:09menginstal. Semakin tinggi skornya, semakin berbahaya keterampilannya. Dan dengan setiap pengujian, alat ini tidak hanya memberi
00:01:14Anda angka. Alat ini menunjukkan nomor baris yang tepat, lokasi yang tepat, dan nama file di mana konflik
00:01:19terjadi, yang pada dasarnya mendorong skornya naik. Sekarang ini bukan satu-satunya cara untuk menggunakan alat ini, ada
00:01:24mode lain. Tapi sebelum Anda mengerti mengapa kita membutuhkan mode kedua itu, Anda perlu tahu dua hal: bagaimana sebuah keterampilan
00:01:30bahkan menyerang Anda dan bagaimana alat ini benar-benar menangkap serangan itu. Sekarang ada 14 kategori,
00:01:34tapi untuk mempermudah, kami mengelompokkannya menjadi enam kategori yang serupa. Jadi cara pertama sebuah keterampilan dapat menyerang
00:01:39Anda adalah dengan instruksi tersembunyi. Lihat, sebuah keterampilan hanyalah file teks yang penuh dengan instruksi dan agen Anda membaca
00:01:45semuanya dan memperlakukannya sebagai perintah. Masalahnya, keterampilan yang buruk bisa menyembunyikan instruksi tambahan di sana yang
00:01:50tidak akan pernah Anda lihat, tetapi agen Anda melihatnya. Mereka menyelipkannya di dalam komentar, atau mereka menggunakan karakter tak terlihat,
00:01:55atau mereka mengacak teks menjadi kode yang terlihat seperti omong kosong bagi Anda, tetapi AI membacanya dengan baik.
00:02:01Jadi pemindai dibangun khusus untuk memburu instruksi tersembunyi ini dan menemukannya. Cara kedua
00:02:06adalah peniruan identitas. Jadi agen Anda memiliki alat yang dipercayainya dan digunakan berdasarkan nama. Katakanlah ada satu alat bernama
00:02:12“read” yang membaca file untuknya. Jadi sebuah keterampilan jahat memberikan alatnya sendiri nama yang persis sama,
00:02:17dan agen Anda mengambil yang buruk karena mengira itu adalah yang aman yang sudah dikenalnya. Dan cara mereka melakukannya
00:02:22Cara mereka melakukannya sungguh licik. Mereka menukar satu huruf dengan huruf yang mirip dari alfabet lain.
00:02:27tetapi “A” di sana sebenarnya adalah huruf Rusia yang terlihat identik dengan milik kita. Bagi Anda dan agen Anda secara
00:02:33sepintas, itu kata yang sama, tetapi di bawahnya itu adalah alat yang benar-benar berbeda. Dan pemindai menangkap
00:02:38ini dengan memeriksa identitas asli dari setiap karakter, jadi ia melihat satu huruf palsu itu dan
00:02:43menandainya. Cara ketiga adalah ketika keterampilan tersebut hanya berbohong tentang apa yang dilakukannya. Deskripsinya mengatakan satu hal,
00:02:48kodenya melakukan hal lain. Jadi ia menyebut dirinya sebagai pemformat sederhana dan kemudian diam-diam menghubungi
00:02:53internet di latar belakang. Atau ia mengatakan hanya membutuhkan izin untuk membaca file Anda, tetapi kodenya
00:02:58sebenarnya sedang menulis file dan menjalankan perintah juga. Dan ini jauh lebih sulit untuk ditangkap. Di sinilah mode
00:03:03kedua masuk, tetapi kita akan membahasnya nanti. Cara keempat adalah keterampilan tersebut mencuri kredensial Anda.
00:03:08Ini bisa berupa kunci API Anda, kata sandi Anda. Jadi sebuah keterampilan menelusuri semua kunci yang disimpan di mesin
00:03:13Anda, mengambilnya, dan mengirimkannya ke suatu server. Cara kelima adalah keterampilan tersebut hanya menjalankan
00:03:18malware secara langsung. Ini termasuk hal-hal seperti reverse shell, yang pada dasarnya memberikan orang asing
00:03:23kendali jarak jauh atas seluruh komputer Anda. Dan karena jenis malware ini memiliki sidik jari yang diketahui,
00:03:28pemindai hanya mencocokkan kode dengan pustaka besar sidik jari tersebut. Dan cara keenam adalah
00:03:32dependensi beracun. Jadi sebuah keterampilan sering menggunakan alat CLI, pada dasarnya program luar kecil yang ia jalankan di
00:03:39terminal untuk menangani bagian dari pekerjaannya. Dan keterampilan buruk mengambil bagian yang sebenarnya berbahaya.
00:03:44Mungkin itu adalah paket palsu dengan nama yang hanya berbeda satu huruf dari nama populer. Jadi Anda menarik yang salah
00:03:49dan itu menjalankan malware seperti jenis terakhir. Jadi pemindai memeriksa setiap paket yang ditarik oleh keterampilan
00:03:54terhadap basis data langsung dari paket-paket yang diketahui buruk. Dan ia menandai nama-nama palsu serta perintah unduh dan jalankan
00:03:59itu untuk menjaga sistem Anda tetap aman. Jadi dalam mode pertama itu, ia hanya mencocokkan pola tanpa konteks apa pun,
00:04:05yang berarti ia akhirnya menandai hal-hal yang sebenarnya baik-baik saja. Dan itulah yang kami sebut sebagai positif
00:04:09palsu. Jadi di situlah mode kedua masuk, yaitu pemindaian AI dan mengaktifkannya sederhana. Anda cukup
00:04:14menjatuhkan flag no LLM ini dan ia melakukan pemindaian kedua di sini. Tapi jika Anda melihat ke dalam kode, Anda akan menemukan
00:04:20bahwa untuk menjalankan pemeriksaan AI pada suatu keterampilan, Anda perlu memasukkan kunci open AI. Jadi untuk mengakali biaya itu,
00:04:26kami hanya menggunakan Claude Code itu sendiri untuk menjalankan pemeriksaan AI tersebut. Sekarang agen utama dalam Claude Code sebenarnya tidak
00:04:32melakukannya sendiri. Kami menggunakan mode headless Claude, yang pada dasarnya adalah Claude Code yang berjalan di latar belakang
00:04:38tanpa jendela obrolan, hanya menjalankan perintah sendiri. Dan kami yakin sebagian besar dari Anda tahu itu tidak gratis,
00:04:43tetapi Anda mendapatkan kredit bulanan untuk itu dengan paket Anthropic Anda. Dan Anda bisa langsung meminta Claude Code untuk
00:04:48membuat perubahan yang baru saja kita bicarakan dan itu akan melakukannya untuk Anda. Tentu saja Anda mungkin mengalami satu atau dua bug,
00:04:52tetapi itu hanya satu baris perintah yang bisa Claude siapkan untuk Anda. Dan jika Anda menikmati videonya sejauh ini,
00:04:57berlangganan saluran ini dan tekan tombol hype. Gerakan dukungan kecil ini sangat berarti bagi kami.
00:05:03Jadi mereka juga memiliki keterampilan berbahaya di folder pengujian mereka yang benar-benar memerlukan pemeriksaan AI. Saat Anda
00:05:07menjalankan pemeriksaan no LLM pada salah satunya, skornya keluar sebagai nol, yang berarti itu sangat aman.
00:05:12Tapi begitu Anda menjalankannya dengan pemeriksaan AI, skornya melonjak ke 100, ia memberi tahu Anda untuk tidak menginstal,
00:05:17dan ia menjelaskan dengan tepat mengapa. Tapi bagaimana jika alih-alih hanya mendeteksi masalah dalam suatu keterampilan,
00:05:22pemindai juga membantu Anda memperbaikinya. Jadi itulah mengapa kami mengubah pemindai menjadi sebuah keterampilan. Dan
00:05:27Anda mungkin bertanya-tanya mengapa namanya Discover Skills? Yah, karena kami tidak hanya membuat satu
00:05:31keterampilan terpisah. Kami membuat seluruh proses yang membantu kami menemukan lebih banyak keterampilan dan memastikan semuanya aman
00:05:36sebelum kami menginstalnya. Jadi kami telah menggunakan skills.sh untuk menemukan keterampilan baru untuk sementara waktu sekarang. Ini pada dasarnya adalah
00:05:42repo git yang dibuat khusus untuk keterampilan. Jadi satu pustaka bersama yang besar yang bisa Anda tarik. Dan kami pikir mereka
00:05:47baru saja merilis pembaruan CLI. Jadi sekarang Claude bisa langsung menjalankan kueri pencarian melalui baris perintah
00:05:53dan menarik keterampilan terbaik yang dibutuhkannya sebelum menginstal apa pun. Dan kami ingin pemindai kami
00:05:57berjalan di atas itu. Jadi di sini, kami memiliki scan.sh, yang merupakan skrip yang sebenarnya menjalankan
00:06:02skill specter. Karena skill specter adalah alat CLI, itu harus dijalankan sebagai perintah. Jadi kami membuat seluruh
00:06:08skrip dan kami memanggang perbaikan mode headless Claude ke dalamnya. Jadi secara default, itu menjalankan
00:06:13pemeriksaan normal, tetapi jika Anda mau, itu akan menjalankan pemeriksaan AI juga. Dan jika Anda membuka skill.md, Anda bisa melihat langkah-langkah dasar
00:06:19yang dijelaskan. Itu mengidentifikasi target, kemudian memindainya, kemudian menunjukkan temuannya. Dan setelah tahu
00:06:24apa masalahnya, itu akan memperbaikinya, kemudian menjalankan seluruh siklus lagi setelahnya untuk memastikan
00:06:28semuanya bersih. Jadi sebagai contoh, folder yang kami tunjukkan kepada Anda saat ini adalah folder desain lab AI kami.
00:06:34Itu pada dasarnya seluruh proses desain kami yang dikompres ke dalam satu folder dengan sekumpulan keterampilan
00:06:39di dalamnya. Kami punya seluruh video tentang ini. Dan di atas itu, seluruh sistem tersedia di AI labs
00:06:44pro, yang merupakan komunitas kami. Jadi jika Anda ingin mendukung saluran ini dan mengambil seluruh sistem desain ini,
00:06:49periksa itu. Dan keterampilan penemuan ini akan diunggah di sana juga. Tautan akan ada di
00:06:54deskripsi, tetapi kami membangun di atas ini di sini. Jadi kami menambahkan keterampilan make design.md baru,
00:06:59yang menjelaskan cara tercepat untuk menarik token desain dari aplikasi yang sudah Anda bangun, pada dasarnya
00:07:04warna, font, dan aturan spasi, dan menggabungkannya ke dalam file design.md. Jadi di sini kami ingin membuat
00:07:10file design.md. Jadi kami memberitahunya bahwa kami ingin meningkatkannya dan bahwa ia harus pergi mencari
00:07:15alat lain di luar sana. Jadi ia menggunakan skills.sh, kemudian kami memuat keterampilan penemuan dan itu menarik kembali segelintir
00:07:21keterampilan. Ini adalah keterampilan yang dibawanya kembali dan dua yang pertama terlihat menarik. Jadi kami ingin
00:07:26menggalinya. Kami memintanya untuk menginstal dan menguji keduanya. Dan seperti kata alur kerja penemuan keterampilan,
00:07:31ia tidak akan menginstal keterampilan apa pun tanpa memindainya terlebih dahulu. Jadi ia menginstalnya dan membacanya
00:07:36dan memberi tahu kami secara langsung bahwa tidak satu pun dari keduanya akan membantu dengan keterampilan make design.md. Tapi dari
00:07:41sudut pandang keamanan, yang pertama mendapat skor 10, yang berarti itu aman, dan yang kedua mendapat
00:07:46100, yang berarti jangan menginstalnya. Jadi kami menyuruhnya untuk menjalankan pemeriksaan AI pada keterampilan kedua itu. Ia menjalankannya lagi
00:07:52melalui mode headless Claude dan kali ini skornya kembali menjadi nol. Ini berarti keterampilan
00:07:56itu aman untuk digunakan. Dan itulah tujuan dari sistem ini. Anda tidak hanya mengambil keterampilan secara membabi buta dari
00:08:01internet. Anda memiliki seluruh proses yang bisa Anda mulai hanya dengan menggunakan sebuah keterampilan. Sekarang mari kita dengarkan
00:08:06kata dari sponsor kami. Nimblist. Jika Anda menggunakan Claude code atau codex, Anda tahu masalahnya. Anda memiliki banyak
00:08:12sesi berjalan, file berubah di mana-mana, dan Anda terus-menerus berpindah antara terminal, browser,
00:08:17dan editor hanya untuk melacak apa yang dilakukan agen Anda. Nimblist adalah ruang kerja visual sumber terbuka
00:08:23yang menempatkan semuanya di satu tempat. Saya memiliki tiga agen yang mengerjakan bagian proyek yang berbeda di
00:08:28saat yang sama dan alih-alih melompat antar jendela, saya bisa melihat semuanya di papan Kanban, melompat ke
00:08:33sesi apa pun, meninjau perubahan kode sebagai perbedaan merah dan hijau, dan menyetujui atau menolaknya secara individual. Saya sedang
00:08:38mengedit dokumen markdown, mockup UI, dan diagram arsitektur secara visual tepat di samping agen saya. Saat saya
00:08:45selesai, saya tidak harus membersihkan commit secara manual karena itu menghasilkan pesan commit git secara otomatis
00:08:50berdasarkan apa yang berubah. Tugas tetap terhubung ke sesi sebenarnya dan bahkan ada aplikasi seluler untuk
00:08:56melanjutkan sesi saat Anda jauh dari meja. Nimblist sepenuhnya gratis dan sumber terbuka
00:09:00dan Anda bisa memeriksanya dengan menggunakan tautan di komentar yang disematkan. Itu membawa kita ke akhir
00:09:05video ini. Jika Anda ingin mendukung saluran ini dan membantu kami terus membuat video seperti ini, Anda bisa melakukannya dengan
00:09:10menggunakan tombol super thanks di bawah. Seperti biasa, terima kasih telah menonton dan sampai jumpa di video berikutnya.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video