|
21| 1
|
你点我播,会唱儿歌和读绘本的陪伴精灵 |

本帖最后由 章 于 2026-6-23 13:34 编辑 ![]() 【视频演示】 【项目背景】 现在有许多二胎家庭,弟弟妹妹总是会拿着书让爸爸妈妈讲故事或唱歌,而爸爸妈妈经常又很忙,有时就让家里的天猫精灵或小爱同学播放相应的故事,可如果外出游玩时就不方便了,于是就想设计一个作品,即可以像天猫精灵或小爱同学那样用语音来控制播放内容,又可以让弟弟妹妹自己拿书本扫一下就可以听故事,所以就有了这个陪伴精灵的作品。 【功能介绍】 1、事先打印好标签贴在绘本上,然后再让哈士奇摄像头对这些标签进行学习。 2、当把绘本放到哈士奇摄像头前,它就通过标签识别功能识别标签,然后通过识别到标签的ID号自动播放相应的故事或歌曲。 3、事先让语音识别模块学习相应的命令识,这样就可以用语音来控制作播放的内容。 4、标签识别和语音识别都是离线的,所以无需网络支持而且携带方便。 【硬件清单】
HuskyLens AI摄像头是一款简单易用的人工智能视觉传感器,采用了新一代的AI芯片Kendryte K210,内置64位400MHz双核RISC-V 处理器,运行神经网络算法的速度比STM32H743快1000倍以上,板载UART / I2C接口,可以连接到Arduino、micro:bit等主流控制器。它内置6种功能:人脸识别、物体追踪、物体识别、巡线追踪、颜色识别、标签识别。仅需一个按键即可完成AI训练,摆脱繁琐的训练和复杂的视觉算法,直接输出识别结果给控制器,实现硬件无缝对接。 MP3语音模块内置8 MB存储空间,无需外接SD卡,若一个音效以秒计算,8M的内存可以存储两百多个音效供您选用。存储方式和使用U盘一样简单,可随时更新模块内的音效。使用上非常的简单,依然沿用DFRobot-Gravity接口,减少了接线的烦恼;支持MP3、WAV音频格式,可做指定播放,循环播放,30级音量调节等。适用于各种需要有音效或者语音的项目,例如:智能小车、气象站、智能家居、车载导航、收费站、安监检测、机器语音导航等等。模块板载喇叭接口,可以直接推动8Ω3W无源小喇叭,使用简单。 ASR-THREE离线语音识别模块内置一颗专用于语音处理的人工智能芯片,可广泛应用于家电、家居、照明、玩具等产品领域,实现语音交互及控制。芯片内置自主研发的脑神经网络处理器BNPU,支持300条命令词以内的本地语音识别,支持中文、英文、方言。支持离线语音学习功能,当芯片识别到ID后,通过串口发送对应的ID号。 【设计组装】 1、外观结构设计与切割 外观结构的材料采用3MM的椴木板,根据硬件组装的需求及作品外观的设想,先利用LaserMaker软件在电脑上设计出其外壳图纸,再用激光切割机切割出来。外观结构设计图如图1所示: ![]() 图1 外观结构设计图 2、把HuskyLens AI摄像头用螺丝固定在小猪佩奇的背面相应位置,如图2所示: ![]() 图2 安装HuskyLens AI摄像头 3、把ASR-THREE离线语音识别模块安装在顶部面板上。如图3所示: ![]() 图3 安装ASR-THREE离线语音识别模块 4、把主控板、MP3语音模块安装在底面板上。如图4所示: ![]() 图4 安装Arduino主控板、MP3语音模块 5、把喇叭安装在侧面板上。如图5所示: ![]() 图5 安装喇叭 6、把底面板和侧面板组装在一起。如图6所示: ![]() 图6 组装底面板和侧面板 7、按接线图的指示把各个传感器与Arduion主控板连接起来。如图7所示: ![]() ![]() 图7 电路接线图 8、最后再把各个部分组装在一起,这样整个结构就组装完成了。如图8所示: ![]() 图8 完成组装 9、为了使外观更加美观,对佩奇进行了涂色。如下图:如图9所示: 图9 作品美化 【程序编写】 1、程序的编写软件是Mind+,打开Mind+软件,切换到上传模式。如图10所示: ![]() 图10 切换到上传模式 2、作品使用的主控板是“Arduino Uno”,传感器有“HUSKYLENS AI摄像头”,执行器有“串口MP3模块”,我们先选择相应的主控板和传感器、执行器。点击左下角的“扩展”,在弹出窗口的“主控板”选项卡中选择“Arduino UNO”,在“传感器”选项卡中选择“HUSKYLENS AI摄像头”,在“执行器”选项卡中选择“串口MP3模块”。如图11、图12、图13、图14所示: ![]() 图11 添加“扩展” ![]() 图12 添加“Arduino Uno”主控板 ![]() 图13 添加“HuskyLens AI 摄像头”传感器 ![]() 图14 添加“串口MP3模块” 3、这个作品还可以用语音来控制MP3的播放,语音识别模块使用的是好好搭搭的离线语音识别模块,这个模块在Mind+默认状态下是没加载的,需要在用户库里自行添加,切换到“用户库”选项卡,在下面的输入框内输入“好好搭搭”,回车确定,下面就会出现离线语音识别模块,点击它就会加载上,最后点击左上角的“返回”,返回到编程主界面。如图15、图16所示: ![]() 图15 添加“离线语音识别模块” ![]() 图16 返回到编程主界面 4、在主程序下先对模块进行一些初始化设置,选中左侧底部的“用户库”,把语音识别初始化积木拖出来,在上面的接线中离线语音识别模块是接在主控板的13针脚上的,所以后面的引脚号选13,因为这个语音识别模块是利用串口进行通讯的,波特率为115200,所以在这里还要设置一下串口波特率。 选中左侧的传感器,把HuskyLers摄像头的初始化和算法切换积木块拖出来接上,并把算法改为“标签识别”,因为识别绘本主要是通过识别绘本上所贴的标签来识别的。 选中左侧的执行器,把初始化串口MP3模块和音量设置这两个积木拖出来接上,根据实际情况更改串口号及音量大小。初始化部分程序如图17所示: ![]() 图17 初始化程序 5、把准备好的MP3素材拷贝到串口MP3模块中,由于这个模块内置8 MB存储空间,所以根据需要对MP3进行压缩,以便可以放入更多内容。再把准备好的标签贴在绘本上,然后利“HUSKYLENS AI摄像头”对其进行学习,分别记住其ID号。 把传感器中的“HuskyLens请求一次数据存存入结果”积木手稿到主程序的循环执行中,这样主控板就会随时向HUSKYLENS请求数据,此模块调用之后“结果”中才会获取最新的数据。然后再去判断,根据所获取的ID号来播放相应的MP3乐曲。具体程序及说明如如图18: ![]() 图18 标签识别及相应MP3播放程序 6、通过识别书本上的标签来控制MP3的播放功能实现了,接下来要实现通过语音来控制MP3的播放。新建一个“语音识别”函数,在这个函数中先判断语音识别模块有没有发送数据给主控板,如果有就把发送过来的数据赋值给变量“识别号”,接着再去判断识别号的值,如果识别号等于53,就让MP3模块播放第1首歌曲,如果识别号等于54就播放第2首歌,以此类推。程序如图19所示: ![]() 图19 “语音识别”函数程序 好好搭搭的离线语音识别模块它不但内置了一些常用的固定命令词条外,还新增命令词自学习功能,自学习的命令词不但支持普通话,也支持方言,还可以是一段口哨、一个响指、一声猫叫等,支持17条自学习命令词。根据学习的方法,自学习相关的命令词,注意自学习的命令词的ID号是从53开始的,所以自定义命令词、ID号、MP3歌曲都要一一对应起来。 7、为了能随时进行语音控制,我们把“语音识别”这人函数放入到主程序的循环执行当中就可以了,至此整个程序就写好了,完成程序如图20 : ![]() 图20 陪伴精灵完整程序 【结语】 陪伴精灵的功能基本上能按设想的实现了,标签识别灵敏度、准确度都很高,但语音识别效果还不是很好,在受周围环境声音影响,特别是MP3还在播放时,语音控制就不太灵了,如果离麦克风比较近就好一点,有没有什么好的办法解决这个问题呢?能不能再增加一个按钮来控制喇叭的通和断,按下按钮就断开喇叭,松开按钮就接通喇叭,这样,在要用语音控制时按下按钮,这样喇叭就不发声了,减少了声音的干扰,命令说完了,再松开按钮。你们有没有什么好的办法呢? 作者其它帖子 ◆ 科技助力健身:仰卧起坐测试仪的功能设计与实现 ◆ 再也不怕找不到空车位了——空车位引导系统 ◆ 告别上下车上锁下锁的烦恼——车位智能锁 ◆ 基于图像识别技术的作业提交助手 ◆ 从此不再害怕背古诗——古诗点播机 ◆ 一个具有视觉识别功能的留言管家 ◆ 防疫门禁 ◆ 拉风侠——垃圾分类小助手 ◆ 垃圾分类训练机 ◆ 盲人伴侣 ◆ 终点计时器 ◆ 无限梦幻镜 ◆ 智能药盒 ◆ 乒乓球收割机——AI捡球机器人 ◆ 捡球机器人 ◆ 变脸机器人 ◆ 多功能测量仪 ◆ 防近视笔筒 ◆ 猜拳机器人 ◆ 炫彩小夜灯 ◆ 麦昆PLUS巡线&避障 ◆ 手势控制MP3播放器&万能遥控器 ◆ 小便池自动冲洗器 ◆ 百变乐器 ◆ 留言机 ◆ 【2020】创意时钟 ◆ 爱的传递——AI爱心储物柜 ◆ 智能储蓄罐 ◆ 和弦吉他的设计与制作 ◆ 看得见的心跳 ◆ 保险箱 ◆ 乐高积木遇见麦克纳姆轮——动手搭建一辆麦克纳姆轮小车 ◆ 小尚,别跟丢了!——自动跟随的麦克纳姆轮小车 ◆ 来吧!一起动手制作一台架子鼓 ◆ 激光打靶器 ◆ 钥匙忘带提醒器 ◆ 麦昆智能晾衣架 ◆ 炫彩电子钢琴的设计与制作 ◆ 萌宠机器人的设计与制作 ◆ DIY留声机 ◆ 智能马桶 ◆ 坐姿矫正仪 ◆ 基于物联网的智能闸道、人数统计与安全预警系统 ◆ 远程监测温度和亮度 ◆ 来来来,让我们一起来打地鼠! ◆ 变色龙 ◆ 龙舟 ◆ 多脚怪 |
沪公网安备31011502402448© 2013-2026 Comsenz Inc. Powered by Discuz! X3.4 Licensed