492浏览
查看: 492|回复: 0

[其它] [测评]“我在,你说!”人工智能三剑客之语音合成模块

[复制链接]
本帖最后由 digi_cow 于 2021-3-15 08:23 编辑

语音合成模块音效演示-无LOGO.gif

在上一篇测评“人工智能三剑客”之离线语音识别模块推出后,小伙伴们跃跃欲试,有的还准备拿来备战更名后的第二十二届全国信息素养提升实践活动,可见创客圈对这方面产品的期待。但是光能听懂人话,不能说人话的智能设备显然不够完善,论坛里也有小伙伴询问“语音识别和语音合成模块能否同步使用?”当时我也只能做吃瓜群众,因为语音合成模块还处于预售状态啊!

image2.png


大概粒子小姐姐看到了我的回复,昨天给我寄来了尚未发售的语音合成模块,让我得以进一步进行测试,也好回答社区里小伙伴关切的问题。

  • 概览

由于不是正式发售的产品,这次收到的模块是没有包装的裸板,没有任何附件。
image3.jpeg

模块正面,可以看到板载的 “大喇叭”占据了一半身材。
模块尺寸可以参考wiki上的图纸。我要大赞特赞这次DF给新模块的图纸标注了孔距!这为结构件的建模开孔带来了极大的便利!以往实践中我们只能基于实物测量,由于板上的孔是空心的,即便用上游标卡尺,也容易有误差,要反复调整才能让我这种强迫症患者满意。有了这个图纸,你甚至可以在收到模块前提前进入结构件的设计制作环节。希望今后DF将标注孔距作为产品说明的标配!
image4.jpeg
背面有一颗标识为IFLYTEK XF S5152CE的语音合成芯片。IFLYTEK其实就是大名鼎鼎的科大讯飞,官网上有这颗芯片的开发指南。

image5.jpeg

image6.jpeg

image7.png
image8.png

从开发指南的介绍看,这款芯片还有很多功能可以深入挖掘。比对目前的库文件和wiki上的样例代码,我们可以看到Mind+也在逐渐完善对它的支持,可设置的功能日渐丰富。
image9.png
Wiki上的样例代码
image10.png

用户库目前包含的积木块


那么这款备受期待的语音合成模块实际效果如何呢?我们来尝试做一个类似于“天猫精灵”的语音互动装置,简单测试一下!

  • 材料清单


Micro:bit×1
I/O拓展板×1
Gravity:I2C语音识别模块×1
Gravity:中英文语音合成模块×1

  • 硬件连接

由于是工程样品,
没有附带连接线,
我们需要先找一条4芯的IIC连接线。
image11.jpeg
本项目只需将语音识别模块、语音合成模块,连接到拓展板的IIC接口即可。为了示意明晰,下面的线路图简化了连线。有关线序,连接IIC口时,大家注意模块和拓展板的引脚标注一一对应即可。

image12_副本_副本.gif


image13.jpeg
实物连接

  • 程序设计   
第一步需要通过用户库添加两个模块的库文件。(后续待Mind+版本更新后,应该会进入官方库文件列表)
image14.png

image15.png
按照以上流程设计程序
image16.png

  • 测试
该模块支持多种音色,这里我选了代表性的男声1、女生1,还有搞笑的唐老鸭音效。



板载扬声器在听感上完全满足小型项目的需要。如果你的项目需要更洪亮的声音,可以通过模块预留的音频输出接口,外接有源音箱乃至广播功放。

image17.png image18.png


  • 小结


不可否认,这是继语音识别模块后,又一款填补空白的产品。作为一款自带喇叭、使用简单的离线语音合成模块,可以让创客项目,特别是中小学创客赛事中的项目,拥有全新维度的开发空间。犹如哈士奇出现后创客圈的现象级反应,我预感一大波基于离线语音识别、语音合成的富有情怀的创客项目正在孵化中。
image19.jpeg

三剑客到齐
创想如虎添翼!

二维码280_GIF.gif




您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

为本项目制作心愿单
购买心愿单
心愿单 编辑
[[wsData.name]]

硬件清单

  • [[d.name]]
btnicon
我也要做!
点击进入购买页面
上海智位机器人股份有限公司 沪ICP备09038501号-4

© 2013-2021 Comsenz Inc. Powered by Discuz! X3.4 Licensed

mail