这款 5 美元的芯片竟能运行完整的 OpenClaw AI 智能体 (zclaw)

BBetter Stack
컴퓨터/소프트웨어가전제품/카메라AI/미래기술

Transcript

00:00:00你能告诉我生命的意义是什么,并把它显示在屏幕上吗?开始吧。
00:00:0342。天哪。ZClaw 说生命的意义是 42。我就知道,伙计们,我就知道。
00:00:15自从 OpenClaw 爆发以来,互联网上充斥着各种
00:00:21以龙虾为主题的 AI 智能体。PicoClaw、NanoClaw、IronClaw、ZeroClaw、TrustClaw,甚至还有 Nanobot。
00:00:29好吧,最后一个其实不是龙虾,但你懂我的意思。在所有这些 Claw 中,
00:00:34我想我偶然发现了其中最小的一个。它叫 ZClaw。它是一个 OpenClaw
00:00:39的等效版本,专门为 ESP32 等微控制器设计。它非常小巧。
00:00:46整个固件预算仅为 888 KB。但尽管如此,它提供了与其大哥哥们相同的
00:00:53智能代理功能,但它运行在 5 美元的芯片上,而不是 800 美元的 Mac Mini。在视频中,
00:01:01我们将看看 ZClaw 的功能,如何在自己的硬件上安装它,
00:01:06然后我们将通过一个有趣的小演示进行测试。这会非常有趣,让我们开始吧。
00:01:11ZClaw 自称是适用于 ESP32 微控制器的最小 AI 助手,
00:01:23总固件预算仅为 888 KB。它基于 ESP-IDF 开发框架构建,
00:01:31并附带一个开箱即用的网络栈,支持 Wi-Fi、TLS
00:01:36和加密栈,以及包含应用元数据的证书包。这使得小巧的 ESP32
00:01:43能直接安全地与 HTTPS 终端通信,例如通过 Telegram 聊天与 AI 模型对话,
00:01:49而不会将你的密钥暴露给不加密的中间人。由于它是基于 ESP-IDF
00:01:55框架构建的,你可以添加额外的物联网传感器驱动程序或自定义固件插件来增强
00:02:02助手的功能。我甚至成功地将其与我的圆形 TFT 显示屏配对,
00:02:08用于稍后在视频中看到的演示。但这个工具的实际应用场景是什么?首先,
00:02:13ZClaw 拥有对微控制器的完全访问权,因此你可以用它来读取 GPIO
00:02:19和传感器引脚、监控健康检查,你还可以要求它执行定时任务,例如
00:02:25设置 LED 闪烁状态提醒,无论是提醒该浇花了,还是为你的系统
00:02:32安排周期性的设备检查。而所有这一切都是通过与你的 AI 智能体在
00:02:37像 Telegram 这样的消息应用中聊天完成的,其中 ESP32 作为客户端,LLM 在云端
00:02:43使用你选择的 AI 提供商处理提示词,而逻辑执行则在芯片本地完成。
00:02:50由于 ESP32 的 NVS 或非易失性存储空间有限,你可以输入类似以下内容:
00:02:56“记住 GPIO4 是我的门传感器”,从那时起,ZClaw 就会将这些映射
00:03:02存储在本地存储中,并在谈论门传感器时知道
00:03:09去触发特定的 GPIO 引脚。这听起来理论上很酷,但现在我想在自己的
00:03:14ESP32-C3 微控制器上亲自尝试,看看它的表现如何。首先,让我们把 ZClaw 烧录到
00:03:22控制器上。我们将控制器通过 USB-C 连接到笔记本电脑,然后克隆 ZClaw
00:03:28仓库。从这里开始,我们只需要运行安装脚本,设置过程非常简单。
00:03:34它首先会要求你构建固件,如果你是第一次运行构建,
00:03:39可能需要一两分钟才能完成。接下来,我们需要通过运行刷机脚本
00:03:44将其烧录到 ESP32。最后,我们需要运行配置脚本来完成初始化。
00:03:50在配置步骤中,它会询问你想连接的 Wi-Fi SSID,
00:03:55然后让你选择一个 AI 提供商。可以是 OpenAI、Anthropic、OpenRouter
00:04:01或 Ollama。在这里,我选择 OpenRouter。接着,你需要输入 API 密钥
00:04:07以及 Wi-Fi 密码。此时,它可能会提示连接网络
00:04:12存在一些问题,但别担心。运行时可能仍会通过,所以直接输入 Y
00:04:18继续。现在它会要求你提供 Telegram 访问令牌。为了获取令牌,你
00:04:24必须在 Telegram 上给 BotFather 发消息来创建一个新机器人。完成该过程后,
00:04:30BotFather 会为你提供该机器人的特定访问令牌。这就是你要
00:04:35粘贴到这里的东西。然后它会询问允许与此机器人聊天的用户 ID。
00:04:41在这里你需要指定自己的 ID。为了获取 ID,你需要向
00:04:47UserInfoBot 发送消息,它会返回你在 Telegram 应用上的用户 ID。输入完这些,
00:04:53ZClaw 应该就安装好了并准备就绪。然后我们可以执行监控脚本来激活它,
00:04:59并实时查看来自 ZClaw 的日志。现在到了有趣的部分。让我们测试下
00:05:05实际的硬件。我原计划在正常的面包板设置上做这个演示。我甚至为了
00:05:11这个目的在芯片上焊接了排针。但后来我发现,出于某种原因,当芯片
00:05:17连接在板子上运行时,无法可靠地保持稳定的 Wi-Fi 连接。可能是因为
00:05:23面包板上的金属导轨干扰了 Wi-Fi 信号。你不知道我花了多长时间
00:05:28才意识到这个问题。但总之,我不得不把芯片挂到这些特殊的引脚夹上,
00:05:34这样我就可以把它们外部连接到面包板上。出于某种奇怪的原因,
00:05:40这种方案运行完美。没有连接问题,芯片可以通过这种方式保持可靠的 Wi-Fi
00:05:45连接。接着,我搭建了一个简单的电路。我已经接通了 3.3 伏电源轨,
00:05:51并用一个 LED 作为状态指示灯。阳极连接到 GPIO3,ZClaw 代理
00:05:58将把它作为数字输出进行切换。另一端,我接了一个简单的 220 欧姆电阻
00:06:05到地线轨道以控制电流,这样我们就不会烧坏二极管。这就是嵌入式硬件测试中
00:06:11最基础的 Hello World 设置。现在到了令人兴奋的部分。我现在可以通过
00:06:18Telegram 聊天要求 ZClaw 激活这个二极管。有了这个设置,我现在可以告诉 ZClaw
00:06:24连接到 GPIO2 引脚的这个二极管是一盏灯。所以我可以说“将 GPIO 视为路灯”。
00:06:34你可以看到 GPIO2 现在被保存为路灯。它会记住这个
00:06:42供以后命令使用。现在我可以要求它“打开路灯”。当我发出命令,
00:06:51路灯现在就打开并开始闪烁。在与 ZClaw 聊了几分钟后,你很快会发现其
00:06:58功能相当有限。那是由于如果我们看代码,它可支配的
00:07:03工具数量有限。它可以对 GPIO 进行读写。它可以处理基础的内存存储
00:07:11操作,以特定的身份和你交流。基本就这些。但这并不意味着我们不能
00:07:17添加自己的工具,对吧?所以在接下来的演示中,我决定做一些更有趣的事情。
00:07:23我这里有一个 GC9A01 240x240 的 TFT 显示屏。我想把它挂到 ZClaw 上,确保它能
00:07:32显示我在屏幕上提示的任何文本。为此,我修改了一下代码。我在
00:07:38工具 C 文件中添加了一个新的工具调用,让我可以提示要显示的特定文本。我还可以指定
00:07:44文本的颜色。接着,我让 Claude code 为我编写了一个单独的 C 文件中的
00:07:50显示函数。最后,我把它添加到了工具处理器的头文件中。我还
00:07:56需要将 GC9A01 显示屏的特定驱动程序作为 ESP IDF 项目的依赖项添加。完成
00:08:05这些更改后,我重新编译了项目,重新烧录并再次初始化。现在,我用
00:08:12自己的自定义工具增强了原始的 ZClaw 项目。让我们看看能不能让它在我的
00:08:18显示屏上画出一些文字。对于第二个演示,接线要稍微复杂一点。但基本上,这
00:08:24只是将外部设备连接到微控制器的标准方式。我不会详细
00:08:29讲解整个接线设置。但如果你感兴趣,可以在此处暂停视频并
00:08:34记下接线图,如果你想自己复制的话。我的 ESP32
00:08:41就在这里。它连接到了我的显示屏上。现在我打开了与 ZClaw
00:08:48机器人的 Telegram 聊天。例如,我现在可以要求机器人显示文字 “Hello World”。看看
00:08:58会发生什么。噢,看。它立即在我们的显示屏上显示了 “Hello World”。你能
00:09:09在屏幕上显示你今天的感受吗?我无法像人类一样产生情感,但我已经准备好
00:09:17为您提供所需的任何帮助。看,机器人说“订阅”。所以我认为你应该听听
00:09:24ZClaw 的建议。现在来个难的。你能告诉我生命的意义是什么
00:09:29并显示在屏幕上吗?开始吧。42。天哪。ZClaw 说生命的意义是 42。我就知道。我就知道,
00:09:42伙计们。这就是 ZClaw 的概况。我觉得这是一个非常有趣的 AI
00:09:47小项目,值得玩一玩。但对于真正的生产构建,我没看到这种
00:09:53通过消息应用进行智能代理通信的意义,实际上,你可能可以通过
00:09:59自定义构建的 Web API 接口更有效地完成所有这些工作。但这仍然是一个很酷的新颖概念。
00:10:04不过,如果我能通过消息应用提示 ZClaw 编写自定义代码,那将非常令人印象深刻,
00:10:11然后它会立即在控制器上实时编译并执行那些新编写的代码。那
00:10:17可就非常特别了。如果你能想出如何做到这一点,请在下方评论区告诉我。
00:10:22各位,我们这个频道不常做硬件教程。
00:10:27但如果你喜欢这个教程,并希望将来探索更多的硬件话题,
00:10:33请点击视频下方的点赞按钮告诉我。我是来自 Betterstack 的 Andris,
00:10:38我们下期视频再见。

Key Takeaway

ZClaw 证明了通过极简的固件集成,仅需 5 美元的 ESP32 芯片即可实现与云端 AI 协同的智能硬件控制与自然语言交互。

Highlights

ZClaw 是一款专为 ESP32 微控制器设计的超轻量级 OpenClaw AI 智能体,固件占用仅 888 KB。

该系统支持通过 Telegram 聊天界面直接与硬件交互,利用云端 LLM 处理逻辑并实现本地 GPIO 控制。

具备高安全性,内置 Wi-Fi、TLS 和加密栈,确保 API 密钥和通信内容不会通过明文传输。

支持非易失性存储(NVS),允许用户通过自然语言映射引脚功能(如“记住 GPIO4 是门传感器”)。

展示了极高的扩展性,用户可以通过修改 C 代码和工具处理器,自行添加如 TFT 显示屏驱动等自定义功能。

视频演示了从环境搭建、固件烧录到实际控制 LED 灯及显示屏文字的完整流程。

Timeline

项目背景与 ZClaw 简介

视频以一个有趣的测试开场,展示了 AI 智能体通过屏幕回答生命意义的场景。作者指出目前市面上充斥着各种以“龙虾”为主题的 OpenClaw 变体,但 ZClaw 是其中体积最小的一个。它专门针对 ESP32 微控制器优化,固件预算被严格控制在 888 KB 以内。相比于昂贵的 Mac Mini,这款 5 美元的芯片能够提供相似的智能代理功能。这一章节设定了视频的主基调,即探索低成本硬件实现高级 AI 交互的可能性。

技术架构与核心功能

ZClaw 基于 ESP-IDF 开发框架构建,集成了完整的网络协议栈以支持安全的 HTTPS 通信。它通过 Telegram 作为用户交互界面,将 ESP32 作为客户端,由云端 LLM 处理提示词并反馈执行逻辑。该工具拥有微控制器的完全访问权,可以执行读取 GPIO 状态、监控传感器或设置定时任务等操作。由于支持非易失性存储,用户可以让助手记住特定引脚的功能描述。这部分内容详细解释了 ZClaw 如何在有限的硬件资源下实现安全且智能的物联网控制。

安装步骤与配置流程

作者演示了在 ESP32-C3 上安装 ZClaw 的具体步骤,包括克隆仓库、运行安装脚本和烧录固件。在配置阶段,用户需要设置 Wi-Fi 信息并选择 AI 提供商,如 OpenAI 或 Anthropic。为了实现 Telegram 通信,还需要通过 BotFather 获取机器人令牌以及通过 UserInfoBot 获取用户 ID。虽然配置过程中可能会遇到网络连接警告,但通常可以通过继续操作来完成初始化。这一节为想要动手实践的观众提供了清晰的路线图,强调了设置过程的简便性。

硬件测试与 Hello World 演示

在实际硬件测试中,作者分享了一个关于面包板干扰 Wi-Fi 信号的避坑指南,并改用引脚夹连接。他搭建了一个基础电路,将 LED 灯连接到 GPIO 引脚并串联电阻以防烧毁。通过 Telegram 聊天,作者成功演示了如何用自然语言将引脚定义为“路灯”并指令其闪烁。虽然初始工具集仅限于基础的 GPIO 读写和内存操作,但这验证了核心逻辑的可行性。这部分展示了 AI 智能体将模糊的语言指令转化为精确硬件动作的能力。

高级扩展:集成 TFT 显示屏

为了提升项目的趣味性,作者展示了如何为 ZClaw 添加自定义工具以驱动 GC9A01 圆形显示屏。他修改了工具 C 文件,添加了显示文本和颜色选择的函数,并引入了相应的驱动依赖。重新烧录后,ZClaw 能够根据指令在屏幕上即时显示“Hello World”或“订阅”等文字。最令人印象深刻的是,AI 还能根据情绪询问显示特定的回应。这证明了 ZClaw 架构的灵活性,允许开发者根据需求扩展复杂的外部设备支持。

总结与未来展望

作者总结认为 ZClaw 是一个非常有趣的新颖概念,尽管在生产环境中的实用性仍有待商榷。他指出,虽然通过消息应用控制硬件很酷,但自定义 Web API 可能会更加高效。作者提出了一个更具挑战性的愿景:如果能让 AI 实时编写并动态编译 C 代码到控制器上运行,那将是革命性的。最后,他鼓励对此类硬件话题感兴趣的观众点赞支持,以便未来制作更多相关教程。整段视频在对 DIY 技术的启发和对未来智能硬件的思考中圆满结束。

Community Posts

View all posts