Dieser 5-Dollar-Chip betreibt einen vollständigen OpenClaw-KI-Agenten (zclaw)

BBetter Stack
컴퓨터/소프트웨어가전제품/카메라AI/미래기술

Transcript

00:00:00Kannst du mir sagen, was der Sinn des Lebens ist und es auf dem Bildschirm anzeigen? Los geht's.
00:00:0342. Oh mein Gott. ZClaw sagt, der Sinn des Lebens ist 42. Ich wusste es. Ich wusste es, Leute.
00:00:15Seit der Explosion von OpenClaw wurde das Internet mit allen möglichen
00:00:21KI-Agenten im Hummer-Design überflutet. PicoClaw, NanoClaw, IronClaw, ZeroClaw, TrustClaw und sogar Nanobot.
00:00:29Okay, der letzte ist nicht wirklich ein Hummer, aber ihr wisst, was ich meine. Und unter all diesen Claws
00:00:34bin ich wohl auf den kleinsten von allen gestoßen. Er heißt ZClaw. Es ist ein OpenClaw-Äquivalent,
00:00:39das speziell für Mikrocontroller wie den ESP32 entwickelt wurde. Und es ist unglaublich winzig. Das
00:00:46gesamte Firmware-Budget beträgt nur 888 Kilobyte. Aber trotzdessen bietet es die gleichen agentischen
00:00:53KI-Funktionen wie seine größeren Brüder, läuft aber auf einem 5-Dollar-Chip statt auf einem 800-Dollar-Mac-Mini. In diesem Video
00:01:01schauen wir uns an, was ZClaw kann, wie man es auf der eigenen Hardware installiert,
00:01:06und dann testen wir es mit einer lustigen kleinen Demo. Das wird ein Riesenspaß, also legen wir los.
00:01:11ZClaw bewirbt sich selbst als der kleinstmögliche KI-Assistent für ESP32-Mikrocontroller mit einem
00:01:23Gesamt-Firmware-Budget von nur 888 Kilobyte. Es basiert auf dem ESP-IDF-Entwicklungs-Framework
00:01:31und wird mit einem einsatzbereiten Netzwerk-Stack geliefert, der Wi-Fi zusammen mit dem TLS-
00:01:36und Krypto-Stack sowie einem Zertifikats-Bundle mit App-Metadaten unterstützt. So kann der winzige ESP32
00:01:43direkt und sicher mit HTTPS-Endpunkten kommunizieren, etwa um mit Ihrem KI-Modell über einen Telegram-Chat
00:01:49zu schreiben, ohne Ihre Schlüssel einem unverschlüsselten Vermittler auszusetzen. Und da es auf dem ESP-IDF-Framework
00:01:55basiert, können Sie zusätzliche Treiber für Ihre IoT-Sensoren oder benutzerdefinierte Firmware-Plugins hinzufügen,
00:02:02um die Fähigkeiten Ihres Assistenten zu erweitern. Ich habe es sogar geschafft, es mit meinem runden TFT-Display
00:02:08für die Demo zu koppeln, die ihr später in diesem Video sehen werdet. Aber was ist der eigentliche Anwendungsfall für dieses Tool?
00:02:13Nun, erstens hat ZClaw vollen Zugriff auf Ihren Mikrocontroller, sodass Sie es zum Lesen von GPIO-
00:02:19und Sensor-Pins sowie zur Überwachung von Gesundheitsprüfungen nutzen können. Sie können es auch mit geplanten Aufgaben beauftragen,
00:02:25wie dem Einstellen einer blinkenden LED-Statuserinnerung, wenn es Zeit ist, die Pflanzen zu gießen, oder der Planung
00:02:32einer wiederkehrenden Geräteprüfung für Ihr System. All dies geschieht durch Chatten mit Ihren KI-Agenten über
00:02:37eine Messaging-App wie Telegram, wobei der ESP32 als Client fungiert, das LLM Ihre Prompts
00:02:43in der Cloud über den von Ihnen gewählten KI-Anbieter verarbeitet und die Logikausführung lokal auf dem Chip erfolgt.
00:02:50Da der ESP32 über einen begrenzten NVS oder nichtflüchtigen Speicher verfügt, können Sie etwas tippen wie:
00:02:56"Merke dir, dass GPIO4 mein Türsensor ist", und von diesem Zeitpunkt an wird ZClaw diese Zuweisungen
00:03:02im lokalen Speicher sichern und wissen, dass es den spezifischen GPIO-Pin auslösen muss, wenn von Türsensoren
00:03:09die Rede ist. Das klingt theoretisch alles cool, aber jetzt möchte ich es selbst auf meinem eigenen kleinen
00:03:14ESP32-C3 Mikrocontroller ausprobieren und sehen, wie er abschneidet. Zuerst flashen wir ZClaw auf den Controller
00:03:22selbst. Verbinden wir also den Controller per USB-C mit unserem Laptop und klonen dann das ZClaw-Repo.
00:03:28Von hier aus müssen wir nur noch das Installationsskript ausführen, und die Einrichtung ist ziemlich unkompliziert.
00:03:34Zuerst werden Sie aufgefordert, die Firmware zu erstellen. Wenn Sie den Build zum ersten Mal ausführen,
00:03:39kann es ein oder zwei Minuten dauern. Als Nächstes müssen wir sie auf unseren ESP32 flashen,
00:03:44indem wir das Flash-Skript ausführen. Und schließlich müssen wir sie provisionieren, indem wir das Provision-Skript starten.
00:03:50In diesem Schritt werden Sie nach Ihrer Wi-Fi-SSID gefragt, mit der Sie sich verbinden möchten,
00:03:55dann müssen Sie einen KI-Anbieter auswählen. Das kann entweder OpenAI, Anthropic, OpenRouter
00:04:01oder Ollama sein. In meinem Fall wähle ich OpenRouter. Als Nächstes müssen Sie Ihren API-Schlüssel sowie
00:04:07Ihr Wi-Fi-Passwort eingeben. An dieser Stelle könnte die Meldung erscheinen, dass es Probleme beim Verbinden
00:04:12mit dem Netzwerk gibt, aber machen Sie sich keine Sorgen. Es könnte trotzdem funktionieren, wenn wir es ausführen, also tippen Sie einfach Y,
00:04:18um fortzufahren. Jetzt werden Sie nach Ihrem Telegram-Zugriffstoken gefragt. Um dieses zu erhalten,
00:04:24müssen Sie dem BotFather auf Telegram eine Nachricht senden, damit er einen neuen Bot für Sie erstellt. Sobald Sie diesen Prozess
00:04:30durchlaufen haben, liefert Ihnen BotFather ein Zugriffstoken für Ihren speziellen Bot. Und genau das müssen Sie
00:04:35hier einfügen. Danach werden Sie nach den Benutzer-IDs gefragt, die mit diesem Bot chatten dürfen.
00:04:41Hier müssen Sie Ihre eigene ID angeben. Um diese zu erhalten, müssen Sie eine Nachricht an
00:04:47UserInfoBot senden, der Ihnen die Benutzer-ID der Telegram-App zurückgibt. Sobald Sie das alles eingegeben haben,
00:04:53sollte Ihr ZClaw installiert und betriebsbereit sein. Wir können dann das Monitor-Skript ausführen,
00:04:59um es zu aktivieren und die Logs von ZClaw in Echtzeit zu sehen. Jetzt kommt der spaßige Teil.
00:05:05Lassen Sie uns die eigentliche Hardware testen. Ich hatte geplant, diese Demo auf einem normalen Breadboard-Setup zu machen.
00:05:11Ich habe sogar die Header-Pins für diesen Zweck auf meinen Chip gelötet. Aber dann bemerkte ich,
00:05:17dass der Chip auf dem Board keine stabile Wi-Fi-Verbindung halten konnte. Möglicherweise,
00:05:23weil die Metallschienen auf dem Breadboard das Wi-Fi-Signal stören. Ihr habt keine Ahnung, wie lange ich
00:05:28gebraucht habe, um dieses Problem zu erkennen. Aber wie auch immer, stattdessen musste ich meinen Chip an diese speziellen
00:05:34Stiftklemmen anschließen, mit denen ich sie extern mit dem Breadboard verkabeln konnte. Und aus irgendeinem seltsamen Grund
00:05:40funktionierte dieses Setup perfekt. Es gab keine Verbindungsprobleme und der Chip konnte eine zuverlässige
00:05:45Wi-Fi-Verbindung aufrechterhalten. Als Nächstes baute ich eine einfache Schaltung auf. Ich habe die 3,3-Volt-Schiene
00:05:51unter Strom gesetzt und eine einzelne LED fungiert als Statusanzeige. Die Anode ist mit GPIO3 verbunden, den der ZClaw-Agent
00:05:58als digitalen Ausgang schaltet. Und auf der anderen Seite habe ich einen einfachen 220-Ohm-Widerstand
00:06:05an die Masseschiene angeschlossen, um den Strom zu begrenzen, damit wir unsere Diode nicht durchbrennen. Das ist ein typisches
00:06:11"Hello World"-Setup für eingebettete Hardware-Tests. Und jetzt kommt der spannende Teil: Ich kann ZClaw nun
00:06:18bitten, diese Diode zu aktivieren, indem ich über Telegram mit ihm chatte. Mit diesem Setup kann ich ZClaw nun sagen,
00:06:24dass diese Diode am GPIO2-Pin ein Licht ist. Ich kann also sagen: "Behandle GPIO2 als das Hauptlicht".
00:06:34Und wie man sieht, ist GPIO2 nun als Hauptlicht gespeichert. Das Programm wird sich das für künftige
00:06:42Befehle merken. Jetzt kann ich es bitten: "Schalte das Hauptlicht ein". Und wenn ich das jetzt tue,
00:06:51ist das Hauptlicht eingeschaltet und blinkt. Nach ein paar Minuten Chatten mit ZClaw merkt man jedoch schnell,
00:06:58dass seine Fähigkeiten recht begrenzt sind. Wenn wir uns den Code ansehen, liegt das daran, dass es nur eine begrenzte
00:07:03Anzahl an Tools zur Verfügung hat. Es kann Lese- und Schreibvorgänge auf GPIOs ausführen, grundlegende Speicheroperationen
00:07:11behandeln und einen mit einer bestimmten Persona ansprechen. Das war's im Grunde. Aber das heißt nicht, dass wir
00:07:17nicht unsere eigenen Tools hinzufügen können, oder? Für die nächste Demo habe ich mir etwas Interessanteres überlegt.
00:07:23Ich habe hier ein GC9A01 240x240 TFT-Display. Und ich möchte es an ZClaw anschließen, damit es
00:07:32jeden Text anzeigen kann, den ich per Prompt eingebe. Zu diesem Zweck habe ich den Code ein wenig modifiziert.
00:07:38Ich habe einen neuen Tool-Aufruf in der Tool-C-Datei hinzugefügt, mit dem ich einen Text zur Anzeige eingeben kann.
00:07:44Außerdem kann ich die gewünschte Textfarbe festlegen. Als Nächstes habe ich Claude Code gebeten, die Display-Funktion
00:07:50für mich in einer separaten C-Datei zu schreiben. Schließlich habe ich sie in die Header-Datei der Tool-Handler eingefügt.
00:07:56Zudem musste ich den spezifischen Treiber für mein GC9A01-Display als Abhängigkeit für das ESP-IDF-Projekt hinzufügen.
00:08:05Mit diesen Änderungen habe ich das Projekt neu kompiliert, geflasht und erneut provisioniert. Jetzt habe ich
00:08:12das ursprüngliche ZClaw-Projekt um mein eigenes benutzerdefiniertes Tool erweitert. Mal sehen, ob wir es dazu bringen können,
00:08:18etwas Text auf meinem Display zu zeichnen. Für die zweite Demo ist die Verkabelung etwas komplizierter. Aber im Grunde
00:08:24ist dies nur die Standardmethode, um ein externes Gerät an einen Mikrocontroller anzuschließen. Ich werde nicht
00:08:29auf das gesamte Verkabelungssetup im Detail eingehen. Falls es euch interessiert, könnt ihr das Video hier anhalten und euch
00:08:34den Schaltplan ansehen, wenn ihr es selbst nachbauen wollt. Hier habe ich meinen ESP32.
00:08:41Er ist hier an mein Display angeschlossen. Und jetzt habe ich den Telegram-Chat mit dem ZClaw-Bot
00:08:48geöffnet. Nun kann ich zum Beispiel den Bot bitten, den Text "Hello World" anzuzeigen. Mal sehen,
00:08:58was das bewirkt. Oh, seht euch das an. Es zeigt sofort "Hello World" auf unserem Display an.
00:09:09Kannst du auf dem Bildschirm anzeigen, wie du dich heute fühlst? Ich bin nicht zu Gefühlen fähig wie Menschen,
00:09:17aber ich bin hier und bereit, bei allem zu helfen, was du brauchst. Seht, der Bot sagt "Abonnieren".
00:09:24Ich denke, auf diesen Rat von ZClaw solltet ihr wirklich hören. Versuchen wir jetzt mal was Schwereres.
00:09:29Kannst du mir sagen, was der Sinn des Lebens ist und es auf dem Bildschirm anzeigen? Los geht's. 42. Oh mein Gott.
00:09:42ZClaw sagt, der Sinn des Lebens ist 42. Ich wusste es. Ich wusste es, Leute. Das ist also ZClaw in aller Kürze.
00:09:47Ich finde, es ist ein sehr spaßiges kleines KI-Projekt zum Herumspielen. Aber für echte Produktions-Builds
00:09:53sehe ich nicht wirklich den Sinn darin, diese Agenten-Kommunikation über eine Messaging-App zu führen, wenn man
00:09:59das alles wahrscheinlich effizienter über eine eigens dafür gebaute Web-API-Schnittstelle erledigen könnte. Aber es ist
00:10:04dennoch ein cooles, neuartiges Konzept. Beeindruckend wäre es allerdings, wenn ich ZClaw dazu bringen könnte,
00:10:11benutzerdefinierten Code über die Messaging-App zu schreiben, der dann sofort kompiliert und auf dem Controller
00:10:17direkt ausgeführt wird. Das wäre wirklich etwas Besonderes. Wenn ihr herausfindet, wie man das macht,
00:10:22lasst es mich unten in den Kommentaren wissen. Und Leute, wir machen auf diesem Kanal nicht oft
00:10:27Hardware-Tutorials. Aber wenn euch dieses gefallen hat und ihr in Zukunft mehr Hardware-Themen sehen wollt,
00:10:33dann lasst es mich wissen, indem ihr auf den Like-Button unter dem Video klickt. Das war
00:10:38Andris von Betterstack, und wir sehen uns in den nächsten Videos.

Key Takeaway

ZClaw transformiert einen günstigen 5-Dollar-Mikrocontroller in einen funktionsfähigen KI-Agenten, der Hardware-Interaktionen über Telegram ermöglicht und durch eigene C-Tools erweitert werden kann.

Highlights

ZClaw ist ein extrem kompakter KI-Agent für ESP32-Mikrocontroller mit einem Firmware-Budget von nur 888 Kilobyte.

Der Chip ermöglicht eine sichere HTTPS-Kommunikation mit KI-Modellen über Messaging-Apps wie Telegram ohne teure Hardware.

ZClaw kann Hardware-Pins (GPIO) steuern, Sensoren auslesen und Zuweisungen im nichtflüchtigen Speicher (NVS) dauerhaft sichern.

Die Installation erfolgt über das ESP-IDF-Framework und unterstützt Anbieter wie OpenAI, Anthropic und OpenRouter.

Durch Modifikationen im C-Code lassen sich eigene Tools hinzufügen, wie etwa die Ansteuerung eines TFT-Displays.

Trotz begrenzter lokaler Ressourcen führt der Chip komplexe Logik aus, während das Sprachmodell in der Cloud verarbeitet wird.

Timeline

Einführung in ZClaw und technische Grundlagen

Der Sprecher demonstriert zu Beginn, wie ein winziger Chip die philosophische Frage nach dem Sinn des Lebens mit der Zahl 42 beantwortet. Er stellt ZClaw als das kleinste Äquivalent zu OpenClaw vor, das speziell für den ESP32-Mikrocontroller optimiert wurde. Mit einem minimalen Firmware-Budget von nur 888 Kilobyte ersetzt dieser 5-Dollar-Chip deutlich teurere Hardware wie einen Mac Mini für agentische Aufgaben. Es wird betont, dass trotz der geringen Größe die vollen KI-Funktionen der größeren Modelle erhalten bleiben. Dieses Segment legt den Grundstein für das Verständnis, wie effiziente KI auf extrem begrenzter Hardware operieren kann.

Architektur, Sicherheit und Anwendungsfälle

In diesem Abschnitt werden die technischen Spezifikationen des ESP-IDF-Frameworks und der integrierte Netzwerk-Stack erläutert. Dank TLS-Unterstützung und Krypto-Stacks kann der ESP32 sicher per HTTPS mit Endpunkten kommunizieren, was den Schutz von API-Schlüsseln gewährleistet. Praktische Anwendungsfälle umfassen das Überwachen von IoT-Sensoren, das Steuern von LEDs oder das Planen von Systemprüfungen direkt über Telegram. Ein besonderes Feature ist die Nutzung des NVS-Speichers, wodurch sich der Agent dauerhafte Pin-Zuweisungen wie “GPIO4 ist mein Türsensor” merken kann. Dies macht den Mikrocontroller zu einem intelligenten, kontextbewussten Werkzeug im Smart Home.

Installation, Flashen und Provisionierung

Der Prozess beginnt mit dem Klonen des ZClaw-Repositorys und dem physischen Anschluss des ESP32-C3 via USB-C. Der Sprecher führt den Zuschauer durch die Schritte des Kompilierens (Build), Flashens und der anschließenden Provisionierung der Firmware. Während der Einrichtung müssen Wi-Fi-Daten, der gewählte KI-Anbieter wie OpenRouter und der Telegram-Bot-Token eingegeben werden. Zur Identifikation des Nutzers wird der UserInfoBot verwendet, um sicherzustellen, dass nur autorisierte IDs mit dem Bot chatten dürfen. Nach erfolgreicher Konfiguration zeigt ein Monitor-Skript die System-Logs in Echtzeit an, was die Betriebsbereitschaft signalisiert.

Hardware-Test: Das Hello-World der eingebetteten KI

Der Sprecher beschreibt Herausforderungen beim Aufbau auf einem Breadboard, da Metallschienen das Wi-Fi-Signal störten, was durch Stiftklemmen gelöst wurde. Es wird ein klassisches Test-Setup mit einer LED an GPIO3 und einem 220-Ohm-Widerstand zur Strombegrenzung konstruiert. Über Telegram weist der Nutzer den Agenten an, den Pin als “Hauptlicht” zu definieren, woraufhin die KI den Befehl speichert. Die Demonstration zeigt erfolgreich, wie der Bot das Licht auf Kommando einschaltet und blinken lässt. Dieses Experiment beweist die nahtlose Verbindung zwischen natürlicher Sprache im Chat und physischer Hardware-Reaktion.

Erweiterung durch benutzerdefinierte Tools und Fazit

Da die Standardfunktionen von ZClaw begrenzt sind, zeigt der Sprecher, wie man den C-Code für ein GC9A01-TFT-Display modifiziert. Unter Zuhilfenahme von Claude Code wurde eine neue Display-Funktion geschrieben und als Tool-Aufruf in das Projekt integriert. Nach der Neukompilierung kann der Agent nun Texte und Farben direkt auf dem runden Display anzeigen, was in der finalen Demo mit dem Text “Hello World” und der Antwort “42” gipfelt. Der Sprecher resümiert, dass ZClaw ein faszinierendes Konzept für Bastler ist, auch wenn Web-APIs für die Produktion effizienter sein könnten. Er schließt mit einem Ausblick auf zukünftige Möglichkeiten wie das Schreiben und Kompilieren von Code direkt über die Messaging-App.

Community Posts

View all posts