|
51| 2
|
[ESP8266/ESP32] 首发|EmbedClawK10运行在行空板K10上的小龙虾 |

|
本帖最后由 汤半泛 于 2026-4-15 17:00 编辑 首发|EmbedClawK10运行在行空板K10上的小龙虾 EmbedClaw K10一个完整的 AI Agent Runtime,运行在我们熟悉的行空板板上,在 AI Agent 技术从云端向边缘端深度渗透的2026年,OpenClaw 凭借其轻量化、可扩展的 AI Agent 架构设计火遍全球,成为端侧智能代理领域的标杆性项目——它首次将「ReAct 循环+工具调用」的核心范式落地到通用计算设备,却仍未触及嵌入式微控制器这一更低成本、更广泛的硬件场景。 EmbedClaw 继承 OpenClaw 对 AI Agent 解耦设计的核心思路,又针对嵌入式硬件做了极致优化,最终实现了微控制器上完整的 AI Agent 全闭环运行。 一、项目核心定位 EmbedClaw是面向ESP32‑S3的原生轻量化AI Agent运行时,继承OpenClaw「通道‑Agent‑推理‑工具」四层解耦架构,同时为嵌入式场景做极致优化:
![]() 二、硬件平台:小身材,承载大智能 EmbedClaw基于行空板K10(ESP32‑S3)构建,硬件极简却足够支撑全功能Agent: • 双核240MHz处理器,FreeRTOS实时调度 • 8MB PSRAM + 16MB Flash • SD卡(FAT32):配置、记忆、技能、会话全存储 • 240×320 LCD:本地交互与状态显示 • AHT20温湿度、WS2812 LED:典型IoT外设 • WiFi:联网接入大模型API与消息通道 在无硬盘、无高端GPU、资源高度受限的嵌入式环境中,实现云端级Agent体验。 ![]() 三、四层架构:嵌入式优化的智能内核 ![]() 1. Channel 消息通道层 多通道并行,低功耗、无阻塞、适配嵌入式网络: • WebSocket:本地调试,端口18789,LWIP轻量实现 • 飞书:长连接推送,无需公网IP • 微信:HTTP轮询,响应最快,日常使用首选 所有通道基于FreeRTOS异步调度,不抢占Agent核心资源。 ![]() 2. Agent 核心层:ReAct思考闭环 严格遵循Thought → Action → Observation → Decision流程: 1. 理解用户意图,规划执行步骤 2. 自动选择并调用工具 3. 接收结果并精简总结 4. 判断继续迭代或直接回答 嵌入式关键优化: • 最大迭代10次,避免资源耗尽 • 结果轻量化压缩,降低内存占用 • 任务完成自动释放资源,稳定不掉线 ![]() 3. LLM 推理层:云端大脑,边缘执行 兼容OpenAI标准API,支持主流模型: • 通义千问(中文优先,推荐) • DeepSeek(低成本高性价比) • OpenAI GPT(通用能力强) LLM负责决策与规划,边缘端负责执行与控制,算力与成本完美平衡。 4. Tools 工具层:AI真正操控物理世界 在OpenClaw基础上,新增嵌入式硬件工具,打通AI×IoT: • 通用能力:联网搜索、记忆读写、文件操作、定时任务 • IoT能力:温湿度读取、LED控制 工具以JSON Schema标准化,支持自然语言快速扩展。 ![]() 四、存储设计:SD卡全解耦,换卡即换“灵魂” 为适配无磁盘嵌入式系统,EmbedClaw全面采用SD卡中心化存储: • config.json:API密钥、模型配置(替代NVS) • memory/:长期记忆、每日笔记 • session/:跨对话历史,最多保存50条 • skills/:Markdown技能文件,热加载无需烧录 • cron.json:定时任务快照 存储架构 ![]() 优势: • 固件与配置完全解耦 • 支持中文长文件名,直接复用OpenClaw技能 • SPI模式兼容更多SD卡,硬件适配更强 内存涨价了,sd卡也涨价了,但是最好不要用廉价的sd卡,因为我们的记忆系统是放sd卡里,我就试过因为sd卡的质量不行,导致无限重启。 五、快速上手(5分钟部署) 废话就不多说了,直接开干吧 步骤 1:准备 SD 卡
存储架构 **配置文件路径**:`/sdcard/embedclaw/config/config.json` 配置文件示例 准备你的api 账号,我用的是便宜的coding plan,各大厂商都在推广,api这个东西后面会发展成为现在手机的流量那样的东西,去整一个套餐吧,马上体会赢麻了的感觉,当然你有白嫖或免费的渠道更好,我的是套餐,不用白不用那种。 ```
Tavily API Key | https://tavily.com (免费额度) ,可以实现实时网络搜索功能,可以去注册一个,免费的,寻找api key的藏身之处也你实力的评价指标。 步骤 2:编译烧录
如果没有编译条件或者就想体验一下的,可以直接烧录固件,烧录的方法保持跟小智烧录方式一致。 offset 0x0 烧录。 步骤 3:WiFi 配网 首次启动会进入 AP 配网模式:长按A键(靠中间的那个),运行状态会变成config mode ,就可以开始连接K10发射出来的 热点,操作跟小智一样的。
![]() 步骤 4:开始对话 联网之后,长按B键 ,设备会重启,如无意外,屏幕中央就会弹出微信注册的二维码,果断掏出你的手机,扫一扫,你的微信就多了一个聊天机器人,或许你已经玩过openclaw, 那还是同一个聊天机器人,同一时间只能连一个设备,下次更换就是了,就是扫一扫这么简单。 六、真实应用场景:AI Agent走进日常物理世界 场景1:远程智能环境管家(家庭/实验室) 你在公司发微信: “看看实验室现在温湿度,太高就帮我开报警灯,每小时记录一次。” EmbedClaw自动执行: 1. 调用aht20_read读取温湿度 2. 判断是否超标 3. 控制LED报警 4. 创建cron定时任务,每小时自动记录 5. 回传结果并持续值守 无需APP、无需网关、不用公网IP。 ![]() ![]() 场景2:随身个人助理(户外/便携设备) 出门前对它说: “查今天北京天气,明天7:30提醒我带伞,顺便记一下我明天要带电脑。” 它会: • 自动联网搜索(web_search) • 设置定时提醒(cron_add) • 写入长期记忆(memory_write) • 下次见面依然记得你的安排 一台口袋设备,就是完整的个人智能助理。 ![]() ![]() 场景3:低成本IoT自动化节点(智慧教室/仓库) 在教室部署多台EmbedClaw设备: • 实时监测环境数据 • 自动根据光照/温度调节设备状态 • 定时上报数据到微信/飞书 • 自然语言添加新规则,不用写代码 ![]() 场景4:嵌入式开发调试助手(开发者工具) 开发者可: • 自然语言添加硬件控制工具 • 自动记录调试日志到SD卡 • 远程查看设备状态 • 一键切换设备功能(技能热加载) 把AI助手直接集成到硬件里。 ![]() 七、核心优化亮点 1. SD卡配置系统:统一配置入口,兼容OpenClaw格式 2. FAT长文件名:中文技能/人设文件直接使用 3. SD卡SPI模式:大幅提升硬件兼容性 4. PWA配网页面:手机端一键配网、状态可视 5. 内存精细化管理:内部RAM预留128KB给SSL/DMA 6. 双核任务分离:UI与网络任务隔离,避免看门狗复位 项目吸收了openclaw的运行机理,使用了小智的部分手脚架,集中大量的debug时间花在内存优化上,系统从“可运行”升级为可长期稳定运行的成品级状态。 八、工具构建 EmbedClaw 提供了17个工具函数,涵盖四大能力:感知类(温度、湿度、光照强度、ADC模拟信号读取)用于环境监测;交互类(RGB LED颜色设置、闪烁、跑马灯、亮度等级控制)用于视觉反馈;存储类(文件读写编辑、目录浏览、定时任务调度、时间获取)用于数 据管理和自动化;以及系统类(内存/存储状态查询、网络搜索、设备重启、工厂重置)用于系统监控和控制,构成完整的嵌入式AI Agent工具链。但你仍然可以继续构建属于自己的工具函数,最简单的方法是 直接vibe coding 打开本项目,一句话,帮我增加XXX工具函数就完成了,这就是时代的红利,你还在玩什么? 九、结语 EmbedClawK10 是一个基于 ESP32-S3 的 AI Agent 运行时,通过将 LLM、工具、代理和通道解耦为模块化架构,实现了在资源受限的嵌入式设备上运行对话式 AI 的能力,其设计思路清晰(ReAct 循环驱动、消息队列解耦、上下文分层管理),工程实践规范(配置分层、单元测试、多板卡抽象),文档齐全,但受限于 MCU 算力和内存,目前更适合轻量模型和原型验证,生产部署需评估算力是否满足需求。 未来,AI Agent不再只属于云端与高端设备,而是嵌入每一盏灯、每一个传感器、每一台便携设备。而EmbedClaw,正是这场边缘智能革命的起点。 sd卡数据包: embedclaw.zip |
沪公网安备31011502402448© 2013-2026 Comsenz Inc. Powered by Discuz! X3.4 Licensed