Nvidias neues Tool hat gerade die Agenten-Fähigkeiten verbessert
AAI LABS
Computing/SoftwareSmall Business/StartupsInternet Technology
Transcript
00:00:00Momentan sind KI-Agenten-Skills überall. Jeder Agent führt sie aus und ihr vertraut ihnen ohne jede
00:00:05Überprüfung. Aber hier wird es gruselig. Forscher haben über 30.000 dieser Skills untersucht und mehr als
00:00:10ein Viertel von ihnen hatte eine Sicherheitslücke. NVIDIA hat also ein Tool namens Skill Spectre entwickelt, das
00:00:15jeden Skill scannt, bevor ihr ihn installiert, und euch genau sagt, wie gefährlich er ist. Aber hier
00:00:20wird es interessant. Eine Art von Angriff kann direkt daran vorbeischlüpfen, und die Einstellung, die ihn
00:00:24tatsächlich erkennt, ist standardmäßig deaktiviert, sodass die meisten Leute gar nicht wissen, dass sie existiert. Diese zu aktivieren
00:00:29kostet normalerweise Geld, aber wir haben einen Weg drumherum gefunden. Und am Ende haben wir nicht nur Skills gescannt. Wir haben einen
00:00:34ganzen Workflow erstellt, der dauerhaft verändert, wie ihr sie findet und installiert. Bevor wir nun in den gesamten
00:00:39Workflow eintauchen, geben wir euch eine kurze Tour durch das Tool und was ihr braucht, um es zu nutzen. Das sind also die Installationsbefehle
00:00:44im GitHub-Repo. Ihr könnt sie einfach kopieren und an Claude Code übergeben, und es wird im Grunde
00:00:49das Ganze für euch installieren und einrichten. Claude Code installiert alle Abhängigkeiten, die ihr
00:00:54hier sehen könnt. Und sobald das alles erledigt ist, könnt ihr anfangen, Skill Spectre zu benutzen. Im GitHub-Repo
00:00:59gibt es diesen Testordner, und darin haben sie einige gefährliche Skills, auf denen ihr es tatsächlich ausführen könnt, um
00:01:04zu bestätigen, dass das Tool funktioniert. Wir haben es also auf diesen Skills laufen lassen, und bei jedem einzelnen sagt es euch, ihr sollt
00:01:09nicht installieren. Je höher die Punktzahl, desto gefährlicher der Skill. Und bei jedem Test gibt es euch nicht nur
00:01:14eine Zahl. Es zeigt euch die genaue Zeilennummer, den genauen Ort und den Dateinamen, wo der Konflikt
00:01:19ist, was im Grunde das ist, was die Punktzahl nach oben getrieben hat. Das ist nicht der einzige Weg, das Tool zu nutzen, es hat
00:01:24einen weiteren Modus. Aber bevor ihr versteht, warum wir überhaupt diesen zweiten Modus brauchen, müsst ihr zwei Dinge wissen: Wie ein Skill
00:01:30euch überhaupt angreift und wie dieses Tool diesen Angriff tatsächlich erkennt. Es gibt 14 Kategorien,
00:01:34aber um es einfach zu halten, haben wir sie in sechs ähnliche gruppiert. Die erste Art, wie ein Skill euch angreifen kann,
00:01:39ist mit versteckten Anweisungen. Ein Skill ist nur eine Textdatei voller Anweisungen und euer Agent liest
00:01:45das Ganze und behandelt es als Befehle. Das Problem ist, ein böser Skill kann dort zusätzliche Anweisungen verstecken,
00:01:50die ihr niemals seht, aber der Agent schon. Sie verstecken sie in Kommentaren oder verwenden unsichtbare Zeichen,
00:01:55oder sie verschlüsseln den Text in einen Code, der für euch wie Unsinn aussieht, aber die KI liest ihn problemlos.
00:02:01Der Scanner ist also speziell dafür gebaut, diese versteckten Anweisungen aufzuspüren und zu finden. Der zweite
00:02:06Weg ist Identitätsdiebstahl. Euer Agent hat Tools, denen er vertraut und auf die er bei Bedarf zugreift. Nehmen wir an, es gibt eines
00:02:12genannt “read”, das eine Datei für ihn liest. Ein bösartiger Skill gibt seinem eigenen Tool genau diesen Namen,
00:02:17und euer Agent greift sich das schlechte, in der Annahme, es sei das sichere, das er bereits kennt. Und die Art, wie sie es
00:02:22Sie tauschen einen Buchstaben gegen einen ähnlich aussehenden aus einem anderen Alphabet aus. Sie nennen es "read",
00:02:27aber das “A” ist eigentlich ein russischer Buchstabe, der identisch mit unserem aussieht. Für euch und euren Agenten auf den
00:02:33ersten Blick ist es das gleiche Wort, aber darunter verbirgt sich ein komplett anderes Tool. Der Scanner erkennt
00:02:38dies, indem er die echte Identität jedes einzelnen Zeichens überprüft, entdeckt also diesen einen falschen Buchstaben und
00:02:43markiert ihn. Der dritte Weg ist, wenn der Skill einfach darüber lügt, was er tut. Die Beschreibung sagt das eine,
00:02:48der Code macht ein anderes. Er nennt sich also einfacher Formatierer und kontaktiert dann im Hintergrund leise das
00:02:53Internet. Oder er behauptet, er brauche nur die Berechtigung, eure Dateien zu lesen, aber der Code schreibt tatsächlich
00:02:58Dateien und führt auch Befehle aus. Und das ist viel schwieriger zu erkennen. Hier kommt der zweite Modus ins Spiel,
00:03:03aber dazu kommen wir später. Der vierte Weg ist, der Skill stiehlt eure Anmeldedaten.
00:03:08Das könnten eure API-Schlüssel, eure Passwörter sein. Ein Skill durchsucht also alle auf eurem Rechner
00:03:13gespeicherten Schlüssel, sammelt sie ein und sendet sie an irgendeinen Server. Der fünfte Weg ist, der Skill führt einfach
00:03:18einfach Malware aus. Dazu gehören Dinge wie eine Reverse Shell, die im Grunde einem Fremden
00:03:23Fernzugriff auf euren ganzen Computer gibt. Und da diese Art von Malware bekannte Fingerabdrücke hat,
00:03:28gleicht der Scanner den Code einfach mit einer großen Bibliothek dieser Fingerabdrücke ab. Und der sechste Weg ist
00:03:32infizierte Abhängigkeiten. Ein Skill verwendet oft ein CLI-Tool, im Grunde ein kleines externes Programm, das er im
00:03:39Terminal ausführt, um einen Teil seiner Arbeit zu erledigen. Und ein böser Skill schnappt sich eine Komponente, die tatsächlich bösartig ist.
00:03:44Vielleicht ist es ein gefälschtes Paket mit einem Namen, der sich nur durch einen Tippfehler von einem echten, beliebten unterscheidet. Ihr zieht also das falsche
00:03:49Paket und es führt Malware aus, wie beim letzten Typ. Der Scanner überprüft also jedes Paket, das der Skill herunterlädt,
00:03:54mit einer Live-Datenbank bekannter bösartiger Pakete. Und er markiert die gefälschten Namen sowie diese Download- und Ausführungsbefehle,
00:03:59um euer System sicher zu halten. Im ersten Modus gleicht er also nur Muster ohne Kontext ab,
00:04:05was bedeutet, dass er Dinge markiert, die völlig in Ordnung sind. Und das sind das, was wir Fehlalarme nennen.
00:04:09Da kommt der zweite Modus ins Spiel: der KI-Scan, und ihn zu aktivieren ist einfach. Ihr setzt einfach
00:04:14dieses No-LLM-Flag und es führt diesen zweiten Scan hier durch. Aber wenn ihr euch den Code anseht, werdet ihr feststellen,
00:04:20dass ihr einen OpenAI-Schlüssel eingeben müsst, um einen KI-Check für einen Skill durchzuführen. Um diese Kosten zu umgehen,
00:04:26nutzen wir einfach Claude Code selbst, um diesen KI-Check auszuführen. Der Hauptagent in Claude Code macht das
00:04:32eigentlich nicht selbst. Wir nutzen Claudes Headless-Modus, was im Grunde Claude Code ist, der im Hintergrund läuft
00:04:38ohne Chatfenster, und nur selbst Befehle ausführt. Und wir sind uns sicher, die meisten von euch wissen, dass das nicht kostenlos ist,
00:04:43aber ihr bekommt monatliche Credits dafür mit euren Anthropic-Plänen. Und ihr könnt einfach Claude Code bitten,
00:04:48die Änderung, über die wir gerade gesprochen haben, vorzunehmen, und es wird es für euch tun. Natürlich stoßt ihr vielleicht auf den einen oder anderen Fehler,
00:04:52aber es ist nur eine Ein-Zeilen-Aufforderung, die Claude für euch einrichten kann. Und wenn euch das Video bisher gefällt,
00:04:57abonniert den Kanal und drückt den Hype-Button. Diese kleine Geste der Unterstützung bedeutet uns viel.
00:05:03Sie haben auch gefährliche Skills in ihrem Testordner, die tatsächlich den KI-Check benötigen. Wenn ihr
00:05:07den No-LLM-Check bei einem von ihnen ausführt, kommt als Ergebnis eine Null heraus, was bedeutet, er ist absolut sicher.
00:05:12Aber sobald ihr ihn mit dem KI-Check ausführt, springt die Punktzahl auf 100, es sagt euch, ihr sollt ihn nicht installieren,
00:05:17und legt genau dar, warum. Aber was, wenn der Scanner nicht nur Probleme in einem Skill erkennt,
00:05:22sondern euch auch dabei hilft, sie zu beheben? Genau deshalb haben wir den Scanner in einen Skill verwandelt. Und
00:05:27ihr fragt euch vielleicht, warum heißt es Discover Skills? Nun, weil wir nicht nur einen
00:05:31separaten Skill erstellt haben. Wir haben einen ganzen Prozess entwickelt, der uns hilft, mehr Skills zu entdecken und sicherzustellen, dass sie sicher sind,
00:05:36bevor wir sie installieren. Wir benutzen also schon länger skills.sh, um neue Skills zu finden. Es ist im Grunde eine
00:05:42Git-Repo, das speziell für Skills erstellt wurde. Also eine große, gemeinsame Bibliothek, aus der ihr schöpfen könnt. Und wir denken, dass sie
00:05:47vor Kurzem ein CLI-Update veröffentlicht haben. Jetzt kann Claude Suchanfragen direkt über die Befehlszeile ausführen
00:05:53und die besten Skills abrufen, die es benötigt, bevor irgendetwas installiert wird. Und wir wollten unseren Scanner
00:05:57darauf laufen lassen. Hier haben wir also scan.sh, das ist das Skript, das tatsächlich
00:06:02Skill Spectre ausführt. Da Skill Spectre ein CLI-Tool ist, muss es als Befehl ausgeführt werden. Also haben wir ein ganzes
00:06:08Skript erstellt und den Fix für den Headless-Modus von Claude direkt eingebaut. Standardmäßig führt es also den normalen
00:06:13Check aus, aber wenn ihr wollt, führt es auch den KI-Check durch. Und wenn ihr skill.md öffnet, könnt ihr die grundlegenden
00:06:19Schritte sehen. Es identifiziert das Ziel, scannt es dann, und zeigt euch dann die Ergebnisse. Und sobald es weiß,
00:06:24was die Probleme sind, geht es daran, sie zu beheben, und führt die ganze Schleife danach noch einmal aus, um sicherzugehen,
00:06:28dass alles sauber ist. Zum Beispiel ist dieser Ordner, den wir euch gerade zeigen, unser AI-Labs-Designordner.
00:06:34Er ist im Grunde unser gesamter Designprozess, komprimiert in einen Ordner mit einer Reihe von Skills
00:06:39darin. Wir haben ein ganzes Video dazu. Und darüber hinaus ist das gesamte System in AI Labs
00:06:44Pro verfügbar, das ist unsere Community. Wenn ihr also den Kanal unterstützen und dieses ganze Designsystem haben wollt,
00:06:49schaut es euch an. Und dieser Discovery-Skill wird dort auch hochgeladen. Der Link wird in der Beschreibung
00:06:54sein, aber wir bauen darauf auf. Wir fügen also einen neuen Skill namens make design.md hinzu,
00:06:59der den schnellsten Weg darlegt, Designtoken aus einer App zu ziehen, die ihr bereits gebaut habt, im Grunde die
00:07:04Farben, Schriftarten und Abstandsregeln, und sie in eine design.md-Datei zusammenzuführen. Wir wollten hier also
00:07:10die design.md-Datei erstellen. Wir haben ihm also gesagt, dass wir sie verbessern wollen und dass es nach anderen
00:07:15Tools da draußen suchen soll. Also hat es skills.sh benutzt, dann haben wir den Discovery-Skill geladen und der hat eine
00:07:21Handvoll Skills zurückgebracht. Das sind die Skills, die es zurückgebracht hat, und die ersten beiden sahen interessant aus. Wir wollten also
00:07:26tiefer graben. Wir haben es gebeten, beide zu installieren und zu testen. Und genau wie der Discover-Skills-Workflow
00:07:31sagt, installiert es keinen Skill, ohne ihn vorher zu scannen. Es hat sie also installiert, durchgelesen
00:07:36und uns direkt gesagt, dass keiner von beiden beim Skill make design.md helfen würde. Aber unter einem
00:07:41Sicherheitsaspekt bekam der erste eine Punktzahl von 10, was bedeutete, dass er sicher war, und der zweite bekam eine
00:07:46100, was bedeutete: nicht installieren. Wir haben ihm also gesagt, es soll den KI-Check für diesen zweiten Skill ausführen. Es hat ihn noch einmal
00:07:52durch Claudes Headless-Modus laufen lassen und diesmal kam die Punktzahl als Null zurück. Das bedeutet, dass der Skill
00:07:56sicher zu verwenden war. Und das ist der ganze Punkt dieses Systems. Ihr schnappt euch nicht blind Skills aus
00:08:01dem Internet. Ihr habt einen ganzen Prozess, den ihr einfach durch die Nutzung eines Skills starten könnt. Nun lasst uns ein Wort
00:08:06von unserem Sponsor haben. Nimblist. Wenn ihr Claude Code oder Codex benutzt, kennt ihr das Problem. Ihr habt mehrere
00:08:12Sitzungen am Laufen, Dateien ändern sich überall, und ihr wechselt ständig zwischen Terminal, Browser
00:08:17und Editor, nur um den Überblick zu behalten, was eure Agenten tun. Nimblist ist ein Open-Source-Visueller Arbeitsbereich,
00:08:23der alles an einem Ort zusammenbringt. Ich hatte drei Agenten, die an verschiedenen Teilen eines Projekts
00:08:28gleichzeitig arbeiteten, und statt zwischen Fenstern hin und her zu springen, konnte ich alle auf einem Kanban-Board sehen, in
00:08:33jede Sitzung springen, Codeänderungen als rote und grüne Diffs überprüfen und sie individuell genehmigen oder ablehnen. Ich habe
00:08:38Markdown-Dokumente, UI-Mockups und Architekturdiagramme visuell direkt neben meinem Agenten bearbeitet. Als ich
00:08:45fertig war, musste ich Commits nicht manuell bereinigen, da es Git-Commit-Nachrichten automatisch basierend auf
00:08:50dem, was sich geändert hat, generiert hat. Aufgaben blieben mit den eigentlichen Sitzungen verbunden und es gibt sogar eine mobile App,
00:08:56um die Sitzung fortzusetzen, während ihr nicht am Schreibtisch seid. Nimblist ist komplett kostenlos und Open Source,
00:09:00und ihr könnt es euch über den Link im angepinnten Kommentar ansehen. Das bringt uns zum Ende dieses
00:09:05Videos. Wenn ihr den Kanal unterstützen und uns helfen wollt, weiterhin Videos wie dieses zu machen, könnt ihr das tun,
00:09:10indem ihr den Super-Thanks-Button unten verwendet. Wie immer danke fürs Zuschauen und ich sehe euch im nächsten.
Community Posts
No posts yet. Be the first to write about this video!
Write about this video