17666| 22
|
[项目] [测评]“人工智能三剑客”之离线语音识别模块 |
本帖最后由 digi_cow 于 2021-2-23 10:49 编辑 春节前在DF商城看到上架两款新品,分别是离线语音识别模块、离线语音合成模块,它们和二哈识图一起组成了“人工智能三剑客”。其中语音识别模块有现货,语音合成模块接受预定。心痒痒想在春节尝鲜,看商城公告春节发货截止日期2月7日,于是6日上午匆匆下单,美滋滋等着发货。然而, 6日是周末,人家已放假了…… 18日开工后发货还是及时的,昨天收到后兴冲冲测试了下,录制了一个测试视频放朋友圈。虽然还没有拿它们作出什么像样的作品,但中午朱老师在掌控群里说老师们对这个模块很感兴趣,所以先写个简单的测评吧! “剑客”初印象 下单的时候没有看附件清单,所以包装里倒出来下图中的这么一条麦克风还是很意外的。领夹式,做工很好,用来录个网课也能用上。 配送清单 Gravity:I2C语音识别模块 x1 Gravity-4P I2C/UART传感器连接线 x1 领夹式麦克风(3.5mm三极接口) x1 接下来给主角一组闪亮的特写 模块正面 板载的语音识别芯片ICRoute LD3320和麦克风 查了下LD3320的技术资料, 厂家罗列了以下主要特点: LD3320的技术特征其实也就是这款语音识别模块的技术特征。说人话,这是一款能离线独立实现语音识别的人工智能芯片,且具有准确率高,无需训练,拿起来就用的优势。 板载LED 板载按钮 这两个部件有什么用呢?原来这款模块支持三种识别模式,指示灯和按钮是配合不同模式使用的。 Mind+的用户库里已提供该模块的库文件,导入后可以直观看到模块下拉菜单中的对应设置选项。 模块背面除了有个可接配套麦克风的MIC接口,还有个3.5mm LineIn接口,所以该模块还可以通过音频线与手机、电脑等具备音频输出功能的设备相连。突发奇想,是不是可以借助它,让一些老古董,比如磁带随身听、收音机啥的变身某种具备人工智能属性的有趣装置? 小试“剑术” 来都来了,总要比划比划啊!同门师兄“二哈识图”指挥过的机械臂你能搞定不? o 材料清单 掌控板×1 I/O拓展板×1 离线语音识别模块×1 SG90舵机×2 2自由度云台套件×1 o 引脚定义 o 连线示意图 o 程序设计 程序设计比较简单,模块初始化后以拼音的方式添加关键词 记得别落下了“设置完成 开始识别”这句。 o 效果测试 响应速度比联网的方式优秀多了。 识别到关键词后, 指示灯会闪烁一下, 随即作出相应动作。 看图片很难完整感受, 大家戳视频吧! 小结 无论对于创客制作还是人工智能教学,我觉得三剑客都是风口上的好东东,理由如下: 1.做中学,让学习人工智能的梯度更加平滑 个人认为适合中小学生学习人工智能的路径大概有三个阶段: 在软硬件门槛没有降低之前,阶段二和阶段三的顺序可能需要互换,这样的难度和跨度会让孩子们“然后没有了然后”。而“三剑客”的凑齐,则可以让孩子们尽早尝试用低门槛的人工智能软硬件解决学习、生活中的真实问题,这样更容易激发孩子们学习人工智能的兴趣,也让学习的梯度更加平滑,让更多的孩子找到内驱力。 2.为现阶段涉及人工智能的科创活动提供具备可操作性的平台。 在“三剑客”出现之前,教学和赛事中涉及的人工智能项目一般还需要联网实现,由此导致的教学、赛事组织的复杂性,以及由于响应延时导致的较差的体验感,是相关教学和活动开展的瓶颈。现在,图像识别、语音合成、语音识别三个人工智能重要方向的离线实现,足够组成一个适合孩子们的更具备可操作性的学习与活动平台啦。 |
© 2013-2024 Comsenz Inc. Powered by Discuz! X3.4 Licensed