Este Chip de $5 Consegue Rodar um Agente de IA OpenClaw Completo (zclaw)

BBetter Stack
Computing/SoftwareConsumer ElectronicsInternet Technology

Transcript

00:00:00Você pode me dizer qual é o sentido da vida e mostrar na tela? Vamos lá.
00:00:0342. Meu Deus. O ZClaw diz que o sentido da vida é 42. Eu sabia. Eu sabia, pessoal.
00:00:15Desde a explosão do OpenClaw, a internet foi inundada com todo tipo de
00:00:21agentes de IA com tema de lagosta. PicoClaw, NanoClaw, IronClaw, ZeroClaw, TrustClaw e até Nanobot.
00:00:29Ok, esse último não é bem uma lagosta, mas vocês entenderam. E entre todos esses "claws",
00:00:34acho que tropecei no menor de todos eles. Chama-se ZClaw. É um equivalente
00:00:39OpenClaw feito especificamente para microcontroladores como o ESP32. E é incrivelmente minúsculo. O
00:00:46orçamento total do firmware é de apenas 888 kilobytes. Mas, apesar disso, ele oferece os mesmos recursos
00:00:53de IA agente de seus irmãos maiores, mas roda em um chip de 5 dólares em vez de um Mac Mini de 800.
00:01:01Neste vídeo, vamos dar uma olhada no que o ZClaw é capaz, como instalá-lo em seu próprio hardware
00:01:06e depois vamos testá-lo com uma pequena demonstração divertida. Vai ser muito legal, então vamos nessa.
00:01:11O ZClaw se autoproclama como o menor assistente de IA possível para microcontroladores ESP32 com um
00:01:23orçamento total de firmware de apenas 888 kilobytes. Ele é construído sobre o framework ESP-IDF
00:01:31e já vem com uma pilha de rede pronta para uso que suporta Wi-Fi, junto com a pilha
00:01:36TLS e de criptografia e um pacote de certificados com metadados do app. Isso permite que o minúsculo ESP32 fale
00:01:43diretamente e de forma segura com endpoints HTTPS, como conversar com seu modelo de IA através de um chat
00:01:49do Telegram sem expor suas chaves a um intermediário não criptografado. E como é baseado no framework
00:01:55ESP-IDF, você pode adicionar drivers adicionais para seus sensores de IoT ou plugins de firmware personalizados
00:02:02para aumentar as capacidades do seu assistente. Eu até consegui pareá-lo com meu display TFT circular
00:02:08para a demonstração que você verá mais adiante neste vídeo. Mas qual é o caso de uso real desta ferramenta?
00:02:13Bem, primeiro de tudo, o ZClaw tem acesso total ao seu microcontrolador, então você pode usá-lo para ler
00:02:19pinos de GPIO e sensores, monitorar verificações de integridade, e também pode pedir para realizar tarefas agendadas,
00:02:25como configurar um lembrete de status com LED piscando quando for hora de regar as plantas, ou agendar uma
00:02:32verificação recorrente de equipamentos para seu sistema. E tudo isso é feito conversando com seus agentes de IA
00:02:37através de um app de mensagens como o Telegram, onde o ESP32 atua como um cliente, o LLM processa seus prompts
00:02:43na nuvem usando seu provedor de IA escolhido, e a execução da lógica acontece localmente no chip.
00:02:50E como o ESP32 tem um NVS ou armazenamento não volátil limitado, você pode digitar algo como:
00:02:56"lembre-se que o GPIO4 é o meu sensor de porta", e a partir desse momento, o ZClaw armazenará esses mapeamentos
00:03:02no armazenamento local, e saberá acionar o pino GPIO específico ao falar sobre sensores de porta.
00:03:09Tudo isso parece legal na teoria, mas agora quero testar por conta própria no meu pequeno
00:03:14microcontrolador ESP32-C3 e ver como ele se comporta. Primeiro, vamos gravar o ZClaw no controlador.
00:03:22Então vamos conectar o controlador ao notebook via USB-C e, em seguida, clonar o repositório do ZClaw.
00:03:28A partir daqui, só precisamos rodar o script de instalação, e a configuração é bem direta.
00:03:34Primeiro, ele pedirá para compilar o firmware, e se for a sua primeira vez rodando a compilação,
00:03:39pode levar um minuto ou dois para terminar. Em seguida, precisamos gravá-lo no nosso ESP32
00:03:44rodando o script de flash. E, finalmente, temos que provisioná-lo rodando o script de provisionamento.
00:03:50Nesta etapa de provisionamento, ele pedirá o SSID do Wi-Fi ao qual você deseja se conectar,
00:03:55então pedirá para escolher um provedor de IA. Pode ser OpenAI, Anthropic, OpenRouter
00:04:01ou Ollama. No meu caso, escolherei o OpenRouter. Em seguida, você precisará inserir sua chave de API,
00:04:07bem como a senha do Wi-Fi. E, neste ponto, pode ser que ele diga que está com problemas para se conectar à
00:04:12rede, mas não se preocupe com isso. Ainda pode funcionar quando executarmos, então apenas digite Y para
00:04:18prosseguir. Agora ele pedirá seu token de acesso do Telegram. Para conseguir isso, você terá
00:04:24que enviar uma mensagem para o BotFather no Telegram para criar um novo bot para você. Ao passar por esse processo,
00:04:30o BotFather fornecerá um token de acesso para o seu bot específico. E é esse que você deve
00:04:35colar aqui. Então, ele pedirá os IDs de usuário que têm permissão para conversar com este bot.
00:04:41Aqui você precisa especificar seu próprio ID. Mas para conseguir isso, você precisa enviar uma mensagem para o
00:04:47UserInfoBot, e ele devolverá seu ID de usuário no app do Telegram. Depois de inserir tudo isso,
00:04:53seu ZClaw deve estar instalado e pronto para rodar. Podemos então executar o script de monitoramento para ativá-lo
00:04:59e ver os logs chegando do ZClaw em tempo real. Agora vem a parte divertida. Vamos testar o
00:05:05hardware real. Eu estava planejando fazer essa demo em uma protoboard comum. Até soldei os
00:05:11pinos de barramento no meu chip para isso. Mas então percebi que, por algum motivo, ao rodar o chip
00:05:17preso à placa, ele não conseguia manter uma conexão Wi-Fi estável de forma confiável. Possivelmente porque os
00:05:23trilhos de metal na protoboard interferem no sinal do Wi-Fi. Vocês não têm ideia de quanto tempo levei
00:05:28para perceber esse problema. Mas, enfim, tive que conectar meu chip a esses grampos de pinos especiais
00:05:34que me permitem conectá-los à protoboard externamente. E, por algum motivo estranho, essa
00:05:40configuração funcionou perfeitamente. Não houve problemas de conexão e o chip manteve um Wi-Fi estável
00:05:45desta forma. Em seguida, montei um circuito simples. Tenho a linha de 3,3 volts alimentada
00:05:51e um único LED atuando como nosso indicador de status. O ânodo está ligado ao GPIO3, que o agente ZClaw
00:05:58alternará como uma saída digital. E do outro lado, tenho um resistor simples de 220 ohms conectado
00:06:05à linha de terra para controlar a corrente e não queimar nosso diodo. Este é o seu simples
00:06:11setup "Olá Mundo" para testes de hardware embarcado. E agora vem a parte emocionante. Posso pedir ao ZClaw
00:06:18para ativar este diodo conversando com ele pelo Telegram. Com essa configuração, agora posso dizer ao ZClaw
00:06:24que este diodo conectado ao pino GPIO2 é uma luz. Então posso dizer: "trate o GPIO como a luz principal".
00:06:34E você pode ver que o GPIO2 agora está salvo como a luz principal. E ele lembrará disso para comandos
00:06:42futuros. Então agora posso pedir a ele: "ligue a luz principal". E ao fazer isso agora, a luz principal
00:06:51está ligada e piscando. Após alguns minutos conversando com o ZClaw, você logo percebe que suas
00:06:58capacidades são bem limitadas. E isso é porque, se olharmos o código, ele tem apenas uma quantidade limitada
00:07:03de ferramentas à disposição. Ele pode realizar leituras e gravações em GPIOs. Pode lidar com operações básicas
00:07:11de armazenamento em memória e falar com você em uma persona específica. E é basicamente isso. Mas isso não significa
00:07:17que não podemos adicionar nossas próprias ferramentas, certo? Então, para a próxima demo, decidi fazer algo mais interessante.
00:07:23Tenho aqui um display TFT GC9A01 de 240x240. E quero conectá-lo ao ZClaw e garantir que ele possa exibir
00:07:32qualquer texto que eu solicite na tela. Para esse fim, modifiquei um pouco o código. Adicionei uma nova
00:07:38chamada de ferramenta no arquivo C de ferramentas que me permite solicitar a exibição de um texto específico. E também posso
00:07:44especificar a cor que desejo para o texto. Em seguida, pedi ao Claude Code para gerar a função de
00:07:50exibição para mim em um arquivo C separado. E, por último, adicionei ao arquivo de cabeçalho dos manipuladores de ferramentas.
00:07:56Também precisei adicionar o driver específico para o meu display GC9A01 como uma dependência para o projeto ESP IDF.
00:08:05Com essas mudanças, recompilei o projeto, gravei e provisionei novamente. Agora aumentei
00:08:12o projeto ZClaw original com minha própria ferramenta personalizada. Vamos ver se conseguimos fazer ele desenhar algum texto
00:08:18no meu display. Para a segunda demonstração, a fiação é um pouco mais complicada. Mas, basicamente,
00:08:24é apenas a forma padrão de conectar um dispositivo externo ao seu microcontrolador. Não vou detalhar
00:08:29toda a fiação agora. Mas se você estiver interessado, pode pausar o vídeo aqui e anotar
00:08:34o diagrama de fiação se quiser replicar por conta própria. Então, tenho meu ESP32
00:08:41bem aqui. Ele está conectado ao meu display. E agora estou com o chat do Telegram aberto com o
00:08:48bot ZClaw. E agora posso, por exemplo, pedir ao bot para exibir o texto dizendo "Olá Mundo". Vamos ver o que
00:08:58isso faz. Olhem só. Ele exibe instantaneamente "Olá Mundo" no nosso display. Você pode mostrar na
00:09:09tela como está se sentindo hoje? "Não sou capaz de sentir como os humanos, mas estou aqui e pronto
00:09:17para ajudar com o que você precisar". Veja, o bot diz "inscreva-se". Então acho que você deveria ouvir o
00:09:24ZClaw nessa. Vamos tentar uma difícil agora. Pode me dizer qual é o sentido da vida e mostrar
00:09:29na tela? Vamos lá. 42. Meu Deus. O ZClaw diz que o sentido da vida é 42. Eu sabia. Eu sabia,
00:09:42pessoal. Então, aí está. Esse é o ZClaw em resumo. Sinto que é um projeto de IA muito divertido
00:09:47para brincar. Mas para projetos de produção reais, não vejo muito sentido em realizar
00:09:53essa comunicação de agente via app de mensagens, quando, na verdade, você poderia fazer tudo de forma mais
00:09:59eficiente através de uma interface de API web personalizada. Mas é um conceito de novidade legal,
00:10:04de qualquer forma. Agora, o que seria impressionante é se eu pudesse pedir ao ZClaw para escrever código personalizado
00:10:11pelo app de mensagens, e então ele compilasse e executasse imediatamente esse novo código escrito no
00:10:17controlador na hora. Isso sim seria algo especial. Se você descobrir como fazer isso,
00:10:22me conte nos comentários abaixo. Pessoal, não fazemos tutoriais de hardware neste canal
00:10:27com muita frequência. Mas se você gostou deste, e gostaria de ver mais tópicos de hardware explorados
00:10:33no futuro, por favor, me avise clicando no botão de curtir abaixo do vídeo. Aqui foi o
00:10:38Andris da Betterstack e vejo vocês nos próximos vídeos.

Key Takeaway

O ZClaw demonstra a viabilidade de transformar microcontroladores simples em agentes de IA funcionais capazes de controlar hardware e sensores através de comandos de voz ou texto via Telegram.

Highlights

O ZClaw é um agente de IA de código aberto projetado especificamente para microcontroladores ESP32 de baixo custo.

O firmware ocupa apenas 888 kilobytes, permitindo a execução de lógica de IA complexa em um chip de 5 dólares.

A ferramenta utiliza o framework ESP-IDF e suporta comunicações seguras HTTPS para interagir com LLMs via Telegram.

É possível mapear pinos GPIO e sensores através de comandos de linguagem natural que o agente armazena localmente.

O sistema permite a expansão de funcionalidades através da adição de drivers personalizados e novas ferramentas em C.

O processamento do modelo de linguagem ocorre na nuvem (OpenAI, Anthropic, etc.), enquanto a execução física é local.

Embora inovador, o autor sugere que interfaces de API web seriam mais eficientes que chats de mensagens para produção.

Timeline

Introdução ao Fenômeno OpenClaw e ao ZClaw

O vídeo começa com uma demonstração bem-humorada onde o agente de IA responde que o sentido da vida é 42. O narrador explica a explosão de projetos baseados no OpenClaw e apresenta o ZClaw como a versão mais compacta dessa tendência. Ele destaca que o firmware consome menos de 1 MB, o que é um feito impressionante para dispositivos de baixo custo. O principal diferencial aqui é a economia, rodando em um hardware de 5 dólares o que antes exigia computadores caros. Esta seção estabelece a premissa de que a IA agora está acessível para entusiastas de hardware e IoT.

Arquitetura Técnica e Segurança do Sistema

Nesta parte, o autor mergulha nos detalhes técnicos que permitem ao ESP32 operar como um agente inteligente. O ZClaw utiliza o framework ESP-IDF e já inclui pilhas de rede para Wi-Fi e criptografia TLS integrada. Isso garante que a comunicação com endpoints HTTPS, como os servidores do Telegram, seja feita de forma segura e direta. A arquitetura permite que o desenvolvedor adicione drivers para sensores de IoT ou plugins de firmware personalizados conforme a necessidade do projeto. É mencionada a integração de um display TFT circular como um exemplo prático de expansão das capacidades originais.

Casos de Uso Práticos e Integração com Hardware

O apresentador detalha como o ZClaw interage fisicamente com o microcontrolador através da leitura de pinos GPIO e sensores. O agente pode realizar tarefas agendadas, como monitorar a saúde do sistema ou ativar LEDs de lembrete para regar plantas. Um ponto crucial é o uso do armazenamento não volátil (NVS) para salvar mapeamentos de pinos feitos por comandos de texto. Por exemplo, ao dizer ao bot que um pino específico é um 'sensor de porta', ele lembrará disso em conversas futuras. Essa capacidade de 'aprendizado' local torna a interação muito mais intuitiva para o usuário final.

Processo de Instalação e Configuração do Firmware

O vídeo fornece um passo a passo detalhado sobre como instalar o ZClaw em um chip ESP32-C3 via conexão USB-C. O processo envolve clonar o repositório, rodar scripts de compilação, flash e, por fim, o provisionamento das credenciais. Durante o provisionamento, o usuário deve configurar o Wi-Fi e escolher um provedor de IA como OpenAI ou Anthropic. Também é necessário configurar um bot no Telegram usando o BotFather para obter o token de acesso necessário. O autor ressalta a importância de obter o ID de usuário correto através do UserInfoBot para garantir a segurança do acesso.

Demonstração 'Olá Mundo' e Desafios de Hardware

Nesta fase de testes reais, o narrador compartilha um problema técnico comum: a interferência das trilhas de metal de uma protoboard no sinal Wi-Fi do chip. Ele resolveu a questão usando grampos de pinos especiais para afastar o microcontrolador da placa de ensaio. A demonstração básica consiste em ligar um LED (o 'Olá Mundo' do hardware) através de comandos enviados pelo Telegram. O agente ZClaw recebe a ordem 'ligue a luz principal', identifica o pino correto e executa a ação física imediatamente. Apesar do sucesso, o autor observa que as ferramentas padrão do código original são limitadas a operações básicas de GPIO.

Customização Avançada e Adição de Display TFT

Para elevar o nível do projeto, o autor adiciona um display TFT circular e modifica o código fonte em C para incluir novas funcionalidades. Ele utiliza o 'Claude Code' para gerar funções de exibição de texto e cores personalizadas no display GC9A01. Após a recompilação, o bot passa a ser capaz de desenhar mensagens na tela sob demanda, como 'Olá Mundo' ou respostas filosóficas. O vídeo encerra com uma reflexão sobre o potencial de agentes de IA em hardware, sugerindo que o próximo passo seria a compilação de código em tempo real. O apresentador convida a comunidade a interagir e sugere que este é um excelente projeto de 'novidade' para entusiastas.

Community Posts

View all posts