14402| 5
|
DFR0177(语音识别模块)评测 |
本帖最后由 沧海笑 于 2012-9-28 18:39 编辑 试验项目名称:DFR0177(语音识别模块)控制LED 时间:2012-04-03 硬件:DFR0177(语音识别模块) Arduino UNO LED 绿、红各一枚 连线:DFR0177叠加在UNO上,LED红色作为信号指示灯,经过220欧姆电阻连接在数字口7;绿色LED经过220欧姆电阻连接在数字口8 (叠加后的样子就是这样的) 评测情况: 1、 基本情况:程序编译、上传口,信号灯(红色)点亮后,进入识别状态,说“开灯”;绿色LED点亮。信号灯中止500毫秒,进入下一个识别状态,说“关灯”;绿色LED熄灭。 2、 关于关键词设置。源代码中,设置了两个关键词,“kai deng”,“guan deng”;按照拼音对照,语音采集后,识别,如果相符就执行相应的流程。根据与DFR客服的请教,查看相应技术资料后,增加了多个垃圾词过滤;相近的词汇充实后,可以有效过滤垃圾词,于是增加了“kai”,“guan”,“deng”,“a a”,“a ou”,最后一个a ou,是因为我的孩子正在牙牙学语阶段,对“啊欧”比较感兴趣,于是增加了这个词,结果证明,兴趣大增。LD3320的原理是最后用汉语拼音比照,因此非特定人、可以识别方言的宣传是这么来的。比如:英文的one,你可以用拼音“wan”代替,当然,官方资料也承认,不是什么方言和外语都可以用汉语拼音代替的,所以也不要抱太大幻想。 3、关于用户体验:注意需要在信号灯亮后,再开始说话,环境尽量不要嘈杂,如果七嘴八舌肯定是有问题的。声音不要太大,也没必要正对着板载MIC说,我测试过隔着半米,是肯定没问题。但是识别率做不到100%(我感觉十次总有至少一次识别有问题),这一点要有思想准备,不是百发百中那种感觉,弄好了90%以上应该是可以做到的。 但是,用户体验和识别率统计是两码事,比如你玩IPAD,要是你100个手势,有2个识别不出,你会有感觉,有5个识别不出,你会很有感觉,有9个识别不出,虽然识别率也有91%,但是,会严重影响你的体验。 所以,还是要看做什么用途,要是简单的互动玩具,一定没问题的。要是精确控制小车,还要进一步研究。(这段话昨天和三水聊过) 小结: 刚开始接触这款板卡,做工精良。但是大家对它还是要有一个准确的定位,我认为是娱乐级的,起到一个学习、互动的目的,不要想象和重量级(基于PC)的语音识别系统相比。这是基于特定关键词的识别,所以使用的场合是有限的。你在选择和使用时要对自己的目的有准确定位,比如我就是希望做一个很简单的互动玩具,提升孩子学习语言的兴趣,把卡片、LED与语言结合起来,我觉得是可行的。不要想象一个不到200元的板卡可以神奇地无所不能,我们在学习arduino初期,对UNO不也有过这样的期望吗? 下一步还可以将语音是别的结果送回PC(或者树莓派),用上位机程序处理,并且做出丰富的互动效果。 附件:附上我在网上搜索的一个资料《语音识别芯片LD3320高阶秘籍》,来自:www.icroute.com。大家一起学习研究。 语音识别芯片 LD3320 高阶秘籍.rar |
1. 该板子占用io太多,不如用iic,否则其他模块就要用iic扩展,如果碰上两个叠层冲突就比较麻烦; 2. 如果能联网,则可以通过api来更新识别组,根据上一次的识别结果来调用下一个组,以实现更大规模的识别 |
© 2013-2024 Comsenz Inc. Powered by Discuz! X3.4 Licensed