|
13| 4
|
[试用测评] 【花雕动手做】AI 视觉传感器二哈识图2之识别标签数据 |
|
一、相关知识点 1、HUSKYLENS 2(二哈识图2)是DFRobot推出的新一代AI视觉传感器,搭载6TOPS算力的Kendryte K230双核RISC-V芯片,集成1GB LPDDR4内存与8GB存储,支持人脸识别、物体检测、姿态估计等20余种预置AI模型,同时允许用户通过自训练模型部署实现定制化识别 。其硬件配置包括200万像素摄像头、2.4英寸触摸屏、可更换镜头模组(支持显微/夜视)及RGB补光灯,搭配UART/I2C接口可无缝连接Arduino、树莓派等开发板,实现实时图传与多模态交互。内置MCP服务打通本地视觉与大模型能力,例如识别午餐图片后可生成膳食建议,而模型广场提供车牌识别、跌倒检测等垂直领域即用型方案。作为教育利器,它已融入《中小学人工智能通识教育指南》课程体系,通过Mind+图形化编程工具降低AI开发门槛,助力创客教育与STEAM实践。 ![]() 2、行空板 K10 是一款专为中小学信息科技教学和创客项目设计的国产 AIoT 开发板,以 ESP32-S3 为核心,高度集成 2.8 英寸全彩 LCD 屏、摄像头、双麦扬声器、WiFi 蓝牙模块及温湿度、光线、加速度等多种传感器,无需额外配件即可实现离线语音识别(支持 200 词库)、人脸识别、二维码读取、物联网联动等功能,支持 Mind + 图形化编程与 MicroPython 代码编程,兼顾入门便捷性与功能扩展性,丰富的扩展接口还能连接外部传感器、执行器,轻松落地 AI、物联网类创意项目,是编程学习与科创实践的高性价比选择。 ![]() 3、Mind + 是 DFRobot 旗下蘑菇云科创教育团队研发的、拥有自主知识产权的国产青少年编程软件,它兼容 Scratch3.0,既支持零基础学习者拖拽图形化积木编程,也能切换至 Python/C/C++ 代码编程,且积木可自动转换为对应代码助力进阶学习,同时适配行空板M10\ K10、Arduino、micro:bit 等众多主流开源硬件与上百种电子模块,集成图像识别、语音识别等 AI 功能及物联网开发能力,还搭配实时交互、程序烧录脱机运行等模式与丰富教学案例,适配校内外编程教学、创客项目及竞赛等场景,是兼顾低入门门槛与高拓展性的科创教育工具。 二、硬件连接 准备材料 行空板K10 x 1 HUSKYLENS 2 x 1 USB数据线 x 2 4pin连接线(或杜邦线)x 1 准备一根USB数据线和一根4Pin白色硅胶线。使用USB数据线连接电脑与行空板K10,使用4Pin黑胶先连接行空板K10与HuskyLens 2,再使用额外的USB数据线n连接示意图如下连接HUSKYLENS 2的Type-C接口与电源,为HUSKYLENS 2进行额外供电。接线图可参考下图。 ![]() ![]() ![]() |
|
本帖最后由 驴友花雕 于 2025-11-18 05:17 编辑 三、AprilTag 标签识别是一种视觉识别与空间定位技术,其核心目标是:通过摄像头自动检测图像中的 AprilTag 标签,并精确识别其身份编号、位置坐标与空间姿态(方向角度)。AprilTag 标签识别是视觉 AI 中极具工程价值的技术之一。它是机器人视觉、无人机导航、增强现实(AR)等领域中常用的定位与识别手段,具有高精度、低误识率、识别速度快等优势。AprilTag标签在线生成网站链接:https://www.2weima.com/aruco.html (1)什么是 AprilTag? AprilTag 是一种类似二维码的二维视觉标记系统,由黑白方块组成,但结构更简洁,识别更稳定。每个标签包含: 唯一 ID 编码:每个标签代表一个独立编号,便于识别与区分。 定位边框:四角的黑白边框用于快速检测与几何定位。 内部编码区域:用于识别身份与容错处理。 ![]() (2)AprilTag 标签识别的基本流程 图像采集:通过摄像头获取包含标签的图像。 标签检测:识别图像中是否存在 AprilTag 标签。 ID 解码:解析标签的唯一编号。 姿态估计:计算标签在三维空间中的位置与方向(6自由度)。 结果输出:返回标签 ID、位置坐标、旋转角度等信息。 (3)AprilTag 与二维码的区别 ![]() (4)应用场景举例 机器人导航:识别地面或墙上的标签,实现路径规划与定位。 无人机降落:通过识别地面标签进行精准悬停或着陆。 教育实验:学生用标签训练 AI 视觉识别与空间计算。 机械臂控制:识别工件上的标签,辅助抓取与装配。 AR 增强现实:识别标签位置叠加虚拟内容。 (5)标签设计与使用建议 标签尺寸应根据识别距离调整(越远越大) 打印时保持高对比度与清晰边缘 安装时避免反光、遮挡或倾斜过大 可使用 3D 打印或激光雕刻制作耐用标签。 (6)相关场景 ![]() ![]() ![]() |
|
四、HUSKYLENS 2能识别出现在画面中的AprilTag标签,可以通过编程获取画面中检测到的标签相关数据。可以读取的标签数据有:指定标签的数据,包括标签ID、标签内容、标签宽度、标签高度以及标签中心点的X坐标位置和Y坐标位置等、检测到的标签总数。 1、实际测试的几个范本 ![]() ![]() ![]() ![]() 2、测试实验代码 |
|
3、代码解读: 系统架构分析 1. 硬件平台组成 cpp ESP32-S3: 提供强大的计算能力和丰富的IO接口 UniHiker: 集成显示屏和用户交互接口的开发平台 HUSKYLENS: 专为嵌入式设计的AI视觉传感器,内置多种算法 2. 软件架构层次 text 应用层: AprilTag识别显示系统 ↓ 算法层: HUSKYLENS固件(封装AprilTag算法) ↓ 驱动层: I2C通信协议 + 屏幕驱动 ↓ 硬件层: 摄像头模组 + 处理芯片 + 显示屏 核心技术原理 1. AprilTag算法解析 AprilTag是一种视觉基准标记系统,其工作原理: 识别流程: text 图像采集 → 边缘检测 → 四边形检测 → 编码解码 → 位姿估计 技术优势: 高精度: 可达到亚像素级别的定位精度 抗干扰: 对光照变化和部分遮挡具有鲁棒性 快速识别: 优化算法实现毫秒级识别速度 2. 数据处理流程详解 cpp 关键函数深度解析 1. 结果获取函数对比 cpp 2. 数据提取宏分析 cpp 显示系统架构 1. 双缓冲显示机制 cpp 2. 信息层级设计 text 第2行: [中心标签ID] - 最高优先级,视觉焦点 第3行: [标签总数] - 环境感知,总体情况 第4-8行: [首个标签详情] - 详细信息,深度分析 3. 颜色编码策略 cpp 实时性分析 1. 时序控制策略 cpp 设计考量: 响应速度: 50ms延迟保证对标签移动的快速响应 计算负载: 平衡识别精度和处理器负担 功耗控制: 适中的刷新率有利于节能 2. 数据处理优化 cpp |
沪公网安备31011502402448© 2013-2025 Comsenz Inc. Powered by Discuz! X3.4 Licensed