Este chip de $5 puede ejecutar un agente de IA OpenClaw completo (zclaw)

BBetter Stack
컴퓨터/소프트웨어가전제품/카메라AI/미래기술

Transcript

00:00:00¿Puedes decirme cuál es el sentido de la vida y mostrarlo en pantalla? Vamos allá.
00:00:0342. Oh, Dios mío. Zclaw dice que el sentido de la vida es 42. Lo sabía. Lo sabía, chicos.
00:00:15Desde la explosión de OpenClaw, internet se ha inundado de todo tipo de
00:00:21agentes de IA con temática de langostas. PicoClaw, NanoClaw, IronClaw, ZeroClaw, TrustClaw e incluso Nanobot.
00:00:29Vale, ese último no es realmente una langosta, pero ya me entienden. Y entre todos estos "claws",
00:00:34creo que me he topado con el más pequeño de todos. Se llama ZClaw. Es un equivalente
00:00:39de OpenClaw hecho específicamente para microcontroladores como el ESP32. Y es increíblemente diminuto. El
00:00:46presupuesto total del firmware es de solo 888 kilobytes. Pero a pesar de eso, ofrece las mismas funciones
00:00:53de IA agéntica que sus hermanos mayores, pero se ejecuta en un chip de 5 dólares en lugar de un Mac Mini de 800. En este vídeo,
00:01:01veremos de qué es capaz ZClaw, cómo instalarlo en tu propio hardware,
00:01:06y luego lo probaremos con una pequeña y divertida demo. Va a ser muy entretenido, así que vamos a ello.
00:01:11ZClaw se promociona como el asistente de IA más pequeño posible para microcontroladores ESP32 con un
00:01:23presupuesto de firmware de tan solo 888 kilobytes. Está construido sobre el entorno de desarrollo ESP-IDF
00:01:31e incluye una pila de red lista para usar que admite Wi-Fi junto con la pila de TLS
00:01:36y criptografía, y un paquete de certificados con metadatos de la aplicación. Esto permite que el pequeño ESP32 hable
00:01:43directa y segurament con endpoints HTTPS, como chatear con tu modelo de IA a través de Telegram
00:01:49sin exponer tus claves a un intermediario no cifrado. Y como está basado en el framework
00:01:55ESP-IDF, puedes añadir controladores adicionales para tus sensores IoT o complementos de firmware personalizados para aumentar
00:02:02las capacidades de tu asistente. Incluso logré emparejarlo con mi pantalla TFT circular
00:02:08para la demo que veréis más adelante en este vídeo. Pero, ¿cuál es el caso de uso real de esta herramienta? Bueno,
00:02:13en primer lugar, ZClaw tiene acceso total a tu microcontrolador, por lo que puedes usarlo para leer pines
00:02:19GPIO y de sensores, monitorizar estados de salud, y también puedes pedirle que realice tareas programadas como configurar
00:02:25un recordatorio de estado con un LED parpadeante cuando sea el momento de regar las plantas, o programar una revisión
00:02:32periódica de tu sistema. Y todo esto se hace chateando con tus agentes de IA a través de
00:02:37una aplicación de mensajería como Telegram, donde el ESP32 actúa como cliente, el LLM procesa tus peticiones
00:02:43en la nube usando el proveedor de IA que elijas, y la ejecución de la lógica ocurre localmente en el chip.
00:02:50Y dado que el ESP32 tiene un almacenamiento no volátil (NVS) limitado, puedes escribir algo como:
00:02:56"recuerda que el GPIO4 es mi sensor de puerta", y a partir de ese momento, ZClaw guardará estos mapeos
00:03:02en el almacenamiento local, y sabrá que debe activar ese pin GPIO específico cuando hables de sensores
00:03:09de puertas. Todo eso suena genial en teoría, pero ahora quiero probarlo por mi cuenta en mi pequeño
00:03:14microcontrolador ESP32-C3 y ver cómo rinde. En primer lugar, vamos a instalar ZClaw en el
00:03:22controlador. Conectémoslo a nuestro portátil mediante USB-C y luego clonemos el
00:03:28repositorio de ZClaw. Desde aquí, solo tenemos que ejecutar el script de instalación, y la configuración es bastante sencilla.
00:03:34Primero te pedirá que compiles el firmware, y si es la primera vez que lo haces,
00:03:39podría tardar un minuto o dos en terminar. A continuación, tenemos que grabarlo en nuestro ESP32
00:03:44ejecutando el script de "flash". Y finalmente, tenemos que aprovisionarlo ejecutando el script de "provision".
00:03:50En este paso de aprovisionamiento, te pedirá el SSID de la red Wi-Fi a la que quieras conectarte,
00:03:55luego te pedirá que elijas un proveedor de IA. Puede ser OpenAI, Anthropic, OpenRouter
00:04:01o Ollama. En mi caso, elegiré OpenRouter. Después, tendrás que introducir tu clave de API, así como
00:04:07tu contraseña de Wi-Fi. En este punto, es posible que diga que tiene algunos problemas para conectarse a la
00:04:12red, pero no te preocupes por eso. Es posible que funcione cuando lo ejecutemos, así que escribe "Y" para
00:04:18continuar. Ahora te pedirá tu token de acceso de Telegram. Para conseguirlo, tienes
00:04:24que escribirle al "BotFather" en Telegram para que cree un nuevo bot para ti. Una vez que pases por ese proceso,
00:04:30BotFather te proporcionará un token de acceso para tu bot específico. Ese es el que tienes que
00:04:35pegar aquí. Luego te pedirá los IDs de usuario que tienen permiso para chatear con este bot.
00:04:41Aquí debes especificar tu propio ID. Para obtenerlo, necesitas enviar un mensaje a
00:04:47UserInfoBot, y te devolverá tu ID de usuario de la aplicación Telegram. Una vez introducido todo eso,
00:04:53tu ZClaw debería estar instalado y listo para funcionar. Podemos ejecutar el script "monitor" para activarlo
00:04:59y ver los registros de ZClaw en tiempo real. Ahora viene la parte divertida. Vamos a probar el
00:05:05hardware real. Tenía planeado hacer esta demo con un montaje normal en una protoboard. Incluso soldé los
00:05:11pines de cabecera en mi chip para este propósito. Pero luego me di cuenta de que, por alguna razón, al ejecutar el chip
00:05:17conectado a la placa, no podía mantener una conexión Wi-Fi estable de forma fiable. Posiblemente porque los
00:05:23raíles metálicos de la placa de pruebas interfieren con la señal Wi-Fi. No tenéis idea de cuánto tiempo me llevó
00:05:28darme cuenta de este problema. En fin, en su lugar, tuve que conectar mi chip a estas pinzas especiales
00:05:34que me permiten cablearlos a la protoboard de forma externa. Y por alguna extraña razón, esta
00:05:40configuración funcionó perfectamente. No hubo problemas de conexión y el chip pudo mantener una conexión Wi-Fi
00:05:45fiable de esta manera. A continuación, monté un circuito sencillo. Tengo el raíl de 3.3 voltios alimentado
00:05:51y un solo LED actuando como nuestro indicador de estado. El ánodo está unido al GPIO3, que el agente ZClaw
00:05:58conmutará como una salida digital. Y en el otro lado, tengo una simple resistencia de 220 ohmios conectada
00:06:05al raíl de tierra para controlar la corriente y no quemar nuestro diodo. Este es el típico
00:06:11"hola mundo" para pruebas de hardware embebido. Y ahora llega la parte emocionante. Ya puedo pedirle a ZClaw
00:06:18que active este diodo chateando con él a través de Telegram. Con esta configuración, puedo decirle a ZClaw
00:06:24que este diodo conectado al pin GPIO2 es una luz. Así que puedo decir: "trata el GPIO como la luz principal".
00:06:34Y como veis, el GPIO2 ahora está guardado como la luz principal. Y lo recordará para futuros
00:06:42comandos. Así que ahora puedo pedirle: "enciende la luz principal". Y al hacerlo, la luz principal
00:06:51se enciende y parpadea. Tras unos minutos chateando con ZClaw, pronto te das cuenta de que sus
00:06:58capacidades son bastante limitadas. Y eso es porque, si miramos el código, solo tiene una cantidad limitada
00:07:03de herramientas a su disposición. Puede realizar lecturas y escrituras en los GPIO, manejar operaciones básicas
00:07:11de almacenamiento de memoria, dirigirse a ti con una personalidad específica... y poco más. Pero eso no significa que no podamos
00:07:17añadir nuestras propias herramientas, ¿verdad? Así que para la siguiente demo, decidí hacer algo más interesante.
00:07:23Tengo aquí una pantalla TFT GC9A01 de 240x240. Y quiero conectarla a ZClaw y asegurarme de que puede mostrar
00:07:32cualquier texto que le pida por pantalla. Para ello, modifiqué un poco el código. Añadí una nueva
00:07:38llamada a herramienta en el archivo C de herramientas que me permite solicitar que se muestre un texto específico. También puedo especificar
00:07:44de qué color quiero que sea el texto. Luego, le pedí a Claude que programara la función de visualización
00:07:50por mí en un archivo C aparte. Y, por último, la añadí al archivo de cabecera de los manejadores de herramientas. También tuve que
00:07:56añadir el controlador específico para mi pantalla GC9A01 como una dependencia para el proyecto ESP IDF. Y con
00:08:05esos cambios, recompilé el proyecto, lo volví a instalar y lo aprovisioné de nuevo. Así que ahora he aumentado
00:08:12el proyecto ZClaw original con mi propia herramienta personalizada. Veamos si podemos hacer que escriba algo de texto
00:08:18en mi pantalla. Para la segunda demo, el cableado es un poco más complicado. Pero básicamente, es
00:08:24solo la forma estándar de conectar un dispositivo externo a tu microcontrolador. No voy a entrar
00:08:29en detalles sobre todo el montaje del cableado. Pero si os interesa, podéis pausar el vídeo aquí y tomar
00:08:34nota del diagrama de cableado si queréis replicarlo por vuestra cuenta. Aquí tengo mi ESP 32.
00:08:41Está conectado a mi pantalla aquí. Y ahora tengo abierto el chat de Telegram con el bot
00:08:48ZClaw. Y ahora puedo, por ejemplo, pedirle al bot que muestre un texto que diga "hola mundo". Veamos
00:08:58qué pasa. Oh, mirad eso. Al instante muestra "hola mundo" en nuestra pantalla. ¿Puedes mostrar en la
00:09:09pantalla cómo te sientes hoy? "No soy capaz de tener sentimientos como los humanos, pero estoy aquí y listo
00:09:17para ayudarte con lo que necesites". Mirad, el bot dice "suscríbete". Así que creo que deberíais hacerle
00:09:24caso a Zclaw en esto. Vamos con una difícil ahora. ¿Puedes decirme cuál es el sentido de la vida y mostrarlo
00:09:29en pantalla? Vamos allá. 42. Oh, Dios mío. Zclaw dice que el sentido de la vida es 42. Lo sabía. Lo sabía,
00:09:42chicos. Así que ahí lo tenéis. Eso es Zclaw en pocas palabras. Me parece un pequeño proyecto de IA
00:09:47muy divertido para trastear. Pero para montajes de producción reales, no le veo mucho sentido a realizar
00:09:53esta comunicación con el agente a través de una aplicación de mensajería, cuando en realidad se podría hacer todo de forma
00:09:59más eficiente mediante una interfaz API web personalizada. Pero es un concepto curioso,
00:10:04de todos modos. Ahora bien, lo que sería impresionante sería poder pedirle a Zclaw que escriba código personalizado
00:10:11a través de la app de mensajería, y que luego compilara y ejecutara inmediatamente ese código recién escrito en el
00:10:17controlador sobre la marcha. Eso sí que sería algo especial. Si descubrís cómo hacerlo,
00:10:22decídmelo en los comentarios de abajo. Y, amigos, no solemos hacer tutoriales de hardware en este canal
00:10:27muy a menudo. Pero si os ha gustado este, y os gustaría ver más temas de hardware explorados
00:10:33en el futuro, por favor hacédmelo saber pulsando el botón de "me gusta" debajo del vídeo. Soy
00:10:38Andris, de Betterstack, y os veré en los próximos vídeos.

Key Takeaway

ZClaw demuestra que es posible ejecutar agentes de IA funcionales y personalizables en hardware de bajo costo como el ESP32, permitiendo el control de dispositivos físicos a través de aplicaciones de mensajería.

Highlights

ZClaw es un agente de IA diseñado para ejecutarse en microcontroladores ESP32 con solo 888 KB de firmware.

El sistema permite interactuar con el hardware local mediante una interfaz de chat en Telegram.

ZClaw soporta conectividad segura HTTPS y puede integrarse con proveedores como OpenAI, Anthropic y Ollama.

Es posible expandir las capacidades del chip añadiendo controladores personalizados para sensores y pantallas.

El costo del hardware es significativamente menor que el de una computadora tradicional, rondando los 5 dólares.

El agente puede recordar configuraciones de pines GPIO utilizando el almacenamiento no volátil (NVS) del chip.

Timeline

Introducción y concepto de ZClaw

El video comienza con una demostración humorística donde la IA responde que el sentido de la vida es 42. El presentador explica que, tras la explosión de OpenClaw, han surgido muchas variantes, siendo ZClaw la más pequeña orientada a microcontroladores. Se destaca que este firmware ocupa apenas 888 kilobytes, lo que permite su ejecución en chips económicos de 5 dólares. El objetivo principal es ofrecer capacidades de IA agéntica similares a modelos más grandes pero en un entorno embebido. Esta sección establece la premisa de que no se requiere hardware costoso para experimentar con agentes de IA.

Arquitectura técnica y conectividad

ZClaw está construido sobre el framework ESP-IDF, lo que le otorga una base sólida para el desarrollo en sistemas embebidos. Incluye una pila de red que admite Wi-Fi, TLS y criptografía para comunicarse de forma segura con endpoints HTTPS sin intermediarios. Gracias a esta estructura, los usuarios pueden añadir controladores adicionales para diversos sensores IoT o complementos de firmware. El autor menciona haber integrado una pantalla TFT circular para expandir la interfaz visual del dispositivo. La seguridad es un punto clave, ya que las claves de API no se exponen a servidores externos no cifrados.

Casos de uso y gestión de memoria

El presentador detalla cómo ZClaw tiene acceso total a los pines GPIO para leer sensores y monitorear el estado del sistema. Los usuarios pueden programar tareas como recordatorios visuales con LEDs para actividades cotidianas como regar plantas. Una característica fundamental es el uso del almacenamiento no volátil (NVS) para recordar el mapeo de los pines. Por ejemplo, se le puede decir al bot que un pin específico corresponde a un sensor de puerta y este lo recordará permanentemente. Esto permite una interacción más natural y persistente con el hardware a través de lenguaje sencillo.

Proceso de instalación y configuración

Se explica paso a paso cómo instalar el firmware conectando el chip mediante USB-C y clonando el repositorio oficial. El proceso incluye la compilación, la grabación (flash) y el aprovisionamiento del dispositivo con credenciales de Wi-Fi. El usuario debe elegir un proveedor de IA como OpenRouter u OpenAI e ingresar su clave de API correspondiente. Además, se requiere configurar un bot de Telegram a través de “BotFather” y obtener el ID de usuario mediante “UserInfoBot”. Esta configuración garantiza que solo los usuarios autorizados puedan enviar comandos al microcontrolador.

Demostración de hardware y resolución de problemas

Durante las pruebas, el autor descubre que el uso de protoboards metálicas puede interferir con la señal Wi-Fi del ESP32-C3. Tras solucionar este inconveniente mediante una conexión externa, logra montar un circuito básico con un LED y una resistencia de 220 ohmios. Al interactuar por Telegram, le asigna el nombre “luz principal” al GPIO y el agente ejecuta el comando de encendido exitosamente. Esta prueba confirma que la lógica de la IA en la nube puede traducirse en acciones físicas locales de forma eficiente. Es el equivalente al “hola mundo” pero aplicado a agentes de IA agénticos.

Personalización avanzada con herramientas y pantalla

El presentador admite que las capacidades iniciales de ZClaw son limitadas, por lo que decide añadir herramientas personalizadas en lenguaje C. Utiliza una pantalla TFT GC9A01 y modifica el código para permitir que la IA envíe texto y colores específicos a la pantalla. Con la ayuda de Claude para la programación de funciones de visualización, logra integrar el controlador dentro del proyecto ESP-IDF. Este proceso demuestra la extensibilidad del sistema para desarrolladores que deseen ir más allá de los comandos básicos. Finalmente, recompila e instala el firmware actualizado para activar las nuevas funciones visuales.

Prueba final y conclusiones del proyecto

La demo final muestra al bot respondiendo preguntas complejas y mostrando el texto “hola mundo” y otros mensajes en la pantalla circular. El autor reflexiona sobre el potencial de ZClaw como un proyecto educativo y divertido para entusiastas de la electrónica. Sugiere que para entornos de producción sería más eficiente usar una API web directa en lugar de Telegram. Propone como un reto futuro la posibilidad de que la IA escriba y compile código directamente en el chip durante la ejecución. El video concluye invitando a los espectadores a apoyar más contenido sobre hardware si les resultó interesante.

Community Posts

View all posts