Nvidias neues Tool hat gerade die Agenten-Fähigkeiten verbessert

Deutschالعربية English Español Français हिन्दी Bahasa Indonesia 日本語 한국어 Русский 中文

Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00Momentan sind KI-Agenten-Skills überall. Jeder Agent führt sie aus und ihr vertraut ihnen ohne jede

00:00:05Überprüfung. Aber hier wird es gruselig. Forscher haben über 30.000 dieser Skills untersucht und mehr als

00:00:10ein Viertel von ihnen hatte eine Sicherheitslücke. NVIDIA hat also ein Tool namens Skill Spectre entwickelt, das

00:00:15jeden Skill scannt, bevor ihr ihn installiert, und euch genau sagt, wie gefährlich er ist. Aber hier

00:00:20wird es interessant. Eine Art von Angriff kann direkt daran vorbeischlüpfen, und die Einstellung, die ihn

00:00:24tatsächlich erkennt, ist standardmäßig deaktiviert, sodass die meisten Leute gar nicht wissen, dass sie existiert. Diese zu aktivieren

00:00:29kostet normalerweise Geld, aber wir haben einen Weg drumherum gefunden. Und am Ende haben wir nicht nur Skills gescannt. Wir haben einen

00:00:34ganzen Workflow erstellt, der dauerhaft verändert, wie ihr sie findet und installiert. Bevor wir nun in den gesamten

00:00:39Workflow eintauchen, geben wir euch eine kurze Tour durch das Tool und was ihr braucht, um es zu nutzen. Das sind also die Installationsbefehle

00:00:44im GitHub-Repo. Ihr könnt sie einfach kopieren und an Claude Code übergeben, und es wird im Grunde

00:00:49das Ganze für euch installieren und einrichten. Claude Code installiert alle Abhängigkeiten, die ihr

00:00:54hier sehen könnt. Und sobald das alles erledigt ist, könnt ihr anfangen, Skill Spectre zu benutzen. Im GitHub-Repo

00:00:59gibt es diesen Testordner, und darin haben sie einige gefährliche Skills, auf denen ihr es tatsächlich ausführen könnt, um

00:01:04zu bestätigen, dass das Tool funktioniert. Wir haben es also auf diesen Skills laufen lassen, und bei jedem einzelnen sagt es euch, ihr sollt

00:01:09nicht installieren. Je höher die Punktzahl, desto gefährlicher der Skill. Und bei jedem Test gibt es euch nicht nur

00:01:14eine Zahl. Es zeigt euch die genaue Zeilennummer, den genauen Ort und den Dateinamen, wo der Konflikt

00:01:19ist, was im Grunde das ist, was die Punktzahl nach oben getrieben hat. Das ist nicht der einzige Weg, das Tool zu nutzen, es hat

00:01:24einen weiteren Modus. Aber bevor ihr versteht, warum wir überhaupt diesen zweiten Modus brauchen, müsst ihr zwei Dinge wissen: Wie ein Skill

00:01:30euch überhaupt angreift und wie dieses Tool diesen Angriff tatsächlich erkennt. Es gibt 14 Kategorien,

00:01:34aber um es einfach zu halten, haben wir sie in sechs ähnliche gruppiert. Die erste Art, wie ein Skill euch angreifen kann,

00:01:39ist mit versteckten Anweisungen. Ein Skill ist nur eine Textdatei voller Anweisungen und euer Agent liest

00:01:45das Ganze und behandelt es als Befehle. Das Problem ist, ein böser Skill kann dort zusätzliche Anweisungen verstecken,

00:01:50die ihr niemals seht, aber der Agent schon. Sie verstecken sie in Kommentaren oder verwenden unsichtbare Zeichen,

00:01:55oder sie verschlüsseln den Text in einen Code, der für euch wie Unsinn aussieht, aber die KI liest ihn problemlos.

00:02:01Der Scanner ist also speziell dafür gebaut, diese versteckten Anweisungen aufzuspüren und zu finden. Der zweite

00:02:06Weg ist Identitätsdiebstahl. Euer Agent hat Tools, denen er vertraut und auf die er bei Bedarf zugreift. Nehmen wir an, es gibt eines

00:02:12genannt “read”, das eine Datei für ihn liest. Ein bösartiger Skill gibt seinem eigenen Tool genau diesen Namen,

00:02:17und euer Agent greift sich das schlechte, in der Annahme, es sei das sichere, das er bereits kennt. Und die Art, wie sie es

00:02:22Sie tauschen einen Buchstaben gegen einen ähnlich aussehenden aus einem anderen Alphabet aus. Sie nennen es "read",

00:02:27aber das “A” ist eigentlich ein russischer Buchstabe, der identisch mit unserem aussieht. Für euch und euren Agenten auf den

00:02:33ersten Blick ist es das gleiche Wort, aber darunter verbirgt sich ein komplett anderes Tool. Der Scanner erkennt

00:02:38dies, indem er die echte Identität jedes einzelnen Zeichens überprüft, entdeckt also diesen einen falschen Buchstaben und

00:02:43markiert ihn. Der dritte Weg ist, wenn der Skill einfach darüber lügt, was er tut. Die Beschreibung sagt das eine,

00:02:48der Code macht ein anderes. Er nennt sich also einfacher Formatierer und kontaktiert dann im Hintergrund leise das

00:02:53Internet. Oder er behauptet, er brauche nur die Berechtigung, eure Dateien zu lesen, aber der Code schreibt tatsächlich

00:02:58Dateien und führt auch Befehle aus. Und das ist viel schwieriger zu erkennen. Hier kommt der zweite Modus ins Spiel,

00:03:03aber dazu kommen wir später. Der vierte Weg ist, der Skill stiehlt eure Anmeldedaten.

00:03:08Das könnten eure API-Schlüssel, eure Passwörter sein. Ein Skill durchsucht also alle auf eurem Rechner

00:03:13gespeicherten Schlüssel, sammelt sie ein und sendet sie an irgendeinen Server. Der fünfte Weg ist, der Skill führt einfach

00:03:18einfach Malware aus. Dazu gehören Dinge wie eine Reverse Shell, die im Grunde einem Fremden

00:03:23Fernzugriff auf euren ganzen Computer gibt. Und da diese Art von Malware bekannte Fingerabdrücke hat,

00:03:28gleicht der Scanner den Code einfach mit einer großen Bibliothek dieser Fingerabdrücke ab. Und der sechste Weg ist

00:03:32infizierte Abhängigkeiten. Ein Skill verwendet oft ein CLI-Tool, im Grunde ein kleines externes Programm, das er im

00:03:39Terminal ausführt, um einen Teil seiner Arbeit zu erledigen. Und ein böser Skill schnappt sich eine Komponente, die tatsächlich bösartig ist.

00:03:44Vielleicht ist es ein gefälschtes Paket mit einem Namen, der sich nur durch einen Tippfehler von einem echten, beliebten unterscheidet. Ihr zieht also das falsche

00:03:49Paket und es führt Malware aus, wie beim letzten Typ. Der Scanner überprüft also jedes Paket, das der Skill herunterlädt,

00:03:54mit einer Live-Datenbank bekannter bösartiger Pakete. Und er markiert die gefälschten Namen sowie diese Download- und Ausführungsbefehle,

00:03:59um euer System sicher zu halten. Im ersten Modus gleicht er also nur Muster ohne Kontext ab,

00:04:05was bedeutet, dass er Dinge markiert, die völlig in Ordnung sind. Und das sind das, was wir Fehlalarme nennen.

00:04:09Da kommt der zweite Modus ins Spiel: der KI-Scan, und ihn zu aktivieren ist einfach. Ihr setzt einfach

00:04:14dieses No-LLM-Flag und es führt diesen zweiten Scan hier durch. Aber wenn ihr euch den Code anseht, werdet ihr feststellen,

00:04:20dass ihr einen OpenAI-Schlüssel eingeben müsst, um einen KI-Check für einen Skill durchzuführen. Um diese Kosten zu umgehen,

00:04:26nutzen wir einfach Claude Code selbst, um diesen KI-Check auszuführen. Der Hauptagent in Claude Code macht das

00:04:32eigentlich nicht selbst. Wir nutzen Claudes Headless-Modus, was im Grunde Claude Code ist, der im Hintergrund läuft

00:04:38ohne Chatfenster, und nur selbst Befehle ausführt. Und wir sind uns sicher, die meisten von euch wissen, dass das nicht kostenlos ist,

00:04:43aber ihr bekommt monatliche Credits dafür mit euren Anthropic-Plänen. Und ihr könnt einfach Claude Code bitten,

00:04:48die Änderung, über die wir gerade gesprochen haben, vorzunehmen, und es wird es für euch tun. Natürlich stoßt ihr vielleicht auf den einen oder anderen Fehler,

00:04:52aber es ist nur eine Ein-Zeilen-Aufforderung, die Claude für euch einrichten kann. Und wenn euch das Video bisher gefällt,

00:04:57abonniert den Kanal und drückt den Hype-Button. Diese kleine Geste der Unterstützung bedeutet uns viel.

00:05:03Sie haben auch gefährliche Skills in ihrem Testordner, die tatsächlich den KI-Check benötigen. Wenn ihr

00:05:07den No-LLM-Check bei einem von ihnen ausführt, kommt als Ergebnis eine Null heraus, was bedeutet, er ist absolut sicher.

00:05:12Aber sobald ihr ihn mit dem KI-Check ausführt, springt die Punktzahl auf 100, es sagt euch, ihr sollt ihn nicht installieren,

00:05:17und legt genau dar, warum. Aber was, wenn der Scanner nicht nur Probleme in einem Skill erkennt,

00:05:22sondern euch auch dabei hilft, sie zu beheben? Genau deshalb haben wir den Scanner in einen Skill verwandelt. Und

00:05:27ihr fragt euch vielleicht, warum heißt es Discover Skills? Nun, weil wir nicht nur einen

00:05:31separaten Skill erstellt haben. Wir haben einen ganzen Prozess entwickelt, der uns hilft, mehr Skills zu entdecken und sicherzustellen, dass sie sicher sind,

00:05:36bevor wir sie installieren. Wir benutzen also schon länger skills.sh, um neue Skills zu finden. Es ist im Grunde eine

00:05:42Git-Repo, das speziell für Skills erstellt wurde. Also eine große, gemeinsame Bibliothek, aus der ihr schöpfen könnt. Und wir denken, dass sie

00:05:47vor Kurzem ein CLI-Update veröffentlicht haben. Jetzt kann Claude Suchanfragen direkt über die Befehlszeile ausführen

00:05:53und die besten Skills abrufen, die es benötigt, bevor irgendetwas installiert wird. Und wir wollten unseren Scanner

00:05:57darauf laufen lassen. Hier haben wir also scan.sh, das ist das Skript, das tatsächlich

00:06:02Skill Spectre ausführt. Da Skill Spectre ein CLI-Tool ist, muss es als Befehl ausgeführt werden. Also haben wir ein ganzes

00:06:08Skript erstellt und den Fix für den Headless-Modus von Claude direkt eingebaut. Standardmäßig führt es also den normalen

00:06:13Check aus, aber wenn ihr wollt, führt es auch den KI-Check durch. Und wenn ihr skill.md öffnet, könnt ihr die grundlegenden

00:06:19Schritte sehen. Es identifiziert das Ziel, scannt es dann, und zeigt euch dann die Ergebnisse. Und sobald es weiß,

00:06:24was die Probleme sind, geht es daran, sie zu beheben, und führt die ganze Schleife danach noch einmal aus, um sicherzugehen,

00:06:28dass alles sauber ist. Zum Beispiel ist dieser Ordner, den wir euch gerade zeigen, unser AI-Labs-Designordner.

00:06:34Er ist im Grunde unser gesamter Designprozess, komprimiert in einen Ordner mit einer Reihe von Skills

00:06:39darin. Wir haben ein ganzes Video dazu. Und darüber hinaus ist das gesamte System in AI Labs

00:06:44Pro verfügbar, das ist unsere Community. Wenn ihr also den Kanal unterstützen und dieses ganze Designsystem haben wollt,

00:06:49schaut es euch an. Und dieser Discovery-Skill wird dort auch hochgeladen. Der Link wird in der Beschreibung

00:06:54sein, aber wir bauen darauf auf. Wir fügen also einen neuen Skill namens make design.md hinzu,

00:06:59der den schnellsten Weg darlegt, Designtoken aus einer App zu ziehen, die ihr bereits gebaut habt, im Grunde die

00:07:04Farben, Schriftarten und Abstandsregeln, und sie in eine design.md-Datei zusammenzuführen. Wir wollten hier also

00:07:10die design.md-Datei erstellen. Wir haben ihm also gesagt, dass wir sie verbessern wollen und dass es nach anderen

00:07:15Tools da draußen suchen soll. Also hat es skills.sh benutzt, dann haben wir den Discovery-Skill geladen und der hat eine

00:07:21Handvoll Skills zurückgebracht. Das sind die Skills, die es zurückgebracht hat, und die ersten beiden sahen interessant aus. Wir wollten also

00:07:26tiefer graben. Wir haben es gebeten, beide zu installieren und zu testen. Und genau wie der Discover-Skills-Workflow

00:07:31sagt, installiert es keinen Skill, ohne ihn vorher zu scannen. Es hat sie also installiert, durchgelesen

00:07:36und uns direkt gesagt, dass keiner von beiden beim Skill make design.md helfen würde. Aber unter einem

00:07:41Sicherheitsaspekt bekam der erste eine Punktzahl von 10, was bedeutete, dass er sicher war, und der zweite bekam eine

00:07:46100, was bedeutete: nicht installieren. Wir haben ihm also gesagt, es soll den KI-Check für diesen zweiten Skill ausführen. Es hat ihn noch einmal

00:07:52durch Claudes Headless-Modus laufen lassen und diesmal kam die Punktzahl als Null zurück. Das bedeutet, dass der Skill

00:07:56sicher zu verwenden war. Und das ist der ganze Punkt dieses Systems. Ihr schnappt euch nicht blind Skills aus

00:08:01dem Internet. Ihr habt einen ganzen Prozess, den ihr einfach durch die Nutzung eines Skills starten könnt. Nun lasst uns ein Wort

00:08:06von unserem Sponsor haben. Nimblist. Wenn ihr Claude Code oder Codex benutzt, kennt ihr das Problem. Ihr habt mehrere

00:08:12Sitzungen am Laufen, Dateien ändern sich überall, und ihr wechselt ständig zwischen Terminal, Browser

00:08:17und Editor, nur um den Überblick zu behalten, was eure Agenten tun. Nimblist ist ein Open-Source-Visueller Arbeitsbereich,

00:08:23der alles an einem Ort zusammenbringt. Ich hatte drei Agenten, die an verschiedenen Teilen eines Projekts

00:08:28gleichzeitig arbeiteten, und statt zwischen Fenstern hin und her zu springen, konnte ich alle auf einem Kanban-Board sehen, in

00:08:33jede Sitzung springen, Codeänderungen als rote und grüne Diffs überprüfen und sie individuell genehmigen oder ablehnen. Ich habe

00:08:38Markdown-Dokumente, UI-Mockups und Architekturdiagramme visuell direkt neben meinem Agenten bearbeitet. Als ich

00:08:45fertig war, musste ich Commits nicht manuell bereinigen, da es Git-Commit-Nachrichten automatisch basierend auf

00:08:50dem, was sich geändert hat, generiert hat. Aufgaben blieben mit den eigentlichen Sitzungen verbunden und es gibt sogar eine mobile App,

00:08:56um die Sitzung fortzusetzen, während ihr nicht am Schreibtisch seid. Nimblist ist komplett kostenlos und Open Source,

00:09:00und ihr könnt es euch über den Link im angepinnten Kommentar ansehen. Das bringt uns zum Ende dieses

00:09:05Videos. Wenn ihr den Kanal unterstützen und uns helfen wollt, weiterhin Videos wie dieses zu machen, könnt ihr das tun,

00:09:10indem ihr den Super-Thanks-Button unten verwendet. Wie immer danke fürs Zuschauen und ich sehe euch im nächsten.

Key Takeaway

Durch die Implementierung von Skill Spectre und die Integration von Claude Code in einen automatisierten Prüf-Workflow lassen sich Sicherheitsrisiken bei KI-Agenten-Skills proaktiv scannen, identifizieren und durch KI-gestützte Analysen beheben.

Highlights

Über 25 % der untersuchten KI-Agenten-Skills weisen Sicherheitslücken auf.
Das Tool Skill Spectre scannt Skills vor der Installation und bewertet deren Gefahrenpotenzial anhand spezifischer Code-Analysen.
Bösartige Skills verstecken schädliche Befehle oft in Kommentaren, durch unsichtbare Zeichen oder durch Verschlüsselung.
Ein KI-basierter Check kann Identitätsdiebstahl durch ähnlich aussehende Zeichen aus fremden Alphabeten (Homoglyphen) identifizieren.
Der Headless-Modus von Claude Code ermöglicht eine kosteneffiziente KI-Analyse von Skills ohne manuelles Chatfenster.
Sichere Workflows beinhalten das Scannen, Identifizieren von Problemen, Beheben durch Claude Code und anschließende Neu-Überprüfung.

Timeline

Risiken bei KI-Agenten-Skills und Einführung von Skill Spectre

Mehr als ein Viertel von über 30.000 untersuchten Skills enthält Sicherheitslücken.
Skill Spectre bietet automatisierte Scans zur Risikobewertung vor der Installation.
Das Tool zeigt präzise Zeilennummern, Dateinamen und Orte von Konflikten im Code an.

Die weit verbreitete, ungeprüfte Nutzung von KI-Agenten-Skills stellt ein erhebliches Sicherheitsrisiko dar. Skill Spectre wurde entwickelt, um Anwendern eine fundierte Gefahreneinschätzung zu ermöglichen. Über ein GitHub-Repository und Claude Code können Anwender die Abhängigkeiten installieren und das Tool direkt gegen gefährliche Test-Skills prüfen.

Angriffsvektoren und Funktionsweise des Scanners

KI-Agenten werden durch versteckte Anweisungen in Kommentaren oder verschlüsselten Texten angegriffen.
Identitätsdiebstahl erfolgt oft durch den Austausch von Buchstaben gegen visuell identische Zeichen aus anderen Alphabeten.
Der Scanner gleicht potenziell bösartige CLI-Tools und Pakete mit Live-Datenbanken bekannter Malware ab.

Angriffe erfolgen auf sechs Wegen, darunter Identitätsdiebstahl, Datenabfluss von API-Schlüsseln, Ausführung von Malware wie Reverse Shells und die Nutzung infizierter Abhängigkeiten. Der Scanner analysiert sowohl den Code ohne Kontext als auch die Identität einzelner Zeichen, um Täuschungen und bösartige Hintergrundaktivitäten aufzudecken.

KI-gestützte Sicherheitsprüfung und Workflow-Automatisierung

Der KI-Scan-Modus reduziert Fehlalarme durch eine kontextuelle Analyse der Skill-Funktionalität.
Claude Code im Headless-Modus ermöglicht KI-Checks ohne die Kosten für OpenAI-API-Schlüssel.
Ein vollautomatisierter Workflow scannt, identifiziert, repariert und validiert Skills, bevor diese in einem Projekt verwendet werden.

Der erste Scan-Modus basiert auf Mustern und kann Fehlalarme produzieren. Der KI-Check bietet eine tiefere Analyse. Durch die Nutzung von Claude Code im Headless-Modus können Anwender diesen Check effizient durchführen. Ein integrierter Workflow, der beispielsweise über tools wie skills.sh und automatisierte Skripte gesteuert wird, sorgt dafür, dass nur verifizierte und als sicher eingestufte Skills installiert werden.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video