K10自制“小智”之知识点学习机——K10+大模型+离线语音
本帖最后由 春秋大仙 于 2025-7-16 14:56 编辑现状:K10刷了"小智"固件后,瞬间变身智能语音助手——创客圈和科创教育的老师们玩得不亦乐乎。但总有些"不安分"的老师会想:"这固件是别人家的娃,能不能自己生一个?"理想很丰满:K10+Mind+=自制“小智”
理论上完全可行!K10自带麦克风、喇叭,还能联网,只要:
[*]"借脑":连个大模型(比如GPT或DS)
[*]"开口说话":调用语音识别+合成库
李东风老师已经搞定了"借脑"部分(图形化库直连大模型),但"开口说话"还卡在技术瓶颈——K10还没有调用语音识别API的图形化库,板载离线语音只能听懂关键词,不会唠整段嗑...迂回战术:知识点学习机既然不能自由恋爱,那就先相亲——把关键词塞进包办婚姻的模板里!· 设好填空题模板:"请告诉我一个关于()的知识点"· 让K10当红娘:识别到关键词(如"语文")后,自动填进括号里发给大模型效果如下:https://www.bilibili.com/video/BV1GVuJzUE6A/嗯,其实有点尴尬,但确实“迂回”了。先凑合吧。毕竟所有伟大的发明,都是从"凑合能用"开始的。接下来就简单看一下实现过程:【初始化程序】1.打开Mind+选择上传模式,左下角扩展-主控,选择K10。除了K10的板载功能,我们还需要两个库,联网和大模型。分别在网络服务和用户库里,搜索并加载“Wi-Fi”和“Deepseek大语言模型”即可。2.连接wifi,初始化大模型和离线语音识别。3.初始化“迂回”方式,建一个列表叫“名称”,然后定义一个函数来初始化名称列表,把你想到的学科名字一个一个加入列表,我想到了12个。再定义一个函数添加离线语音识别的命令词,把这12个学科名称的语音一一添加即可。最后设置一个变量x,用来确定ID号和检索列表第x项,全部的初始化指令就完成了。【功能实现程序】1.功能逻辑很简单,当用“你好小行”唤醒语音识别后,判断有没有检测的命令词ID,如果检测到了,就把ID号对应的列表里的学科名字发给大模型并等待响应,响应内容可以放在一个字符变量里,然后把变量显示在屏幕上并用离线语音合成读出变量内容即可。2. 注意,因为我设置了12个学科,所以每轮要执行12次,一轮结束后,记得把变量x设置回1。然后就是“迂回”,我们要发一个完整的句子给大模型,这个句子就需要“人工拼接”一下。可以用运算符里的合并,把“请给我将一个”、“列表名称的第x项”、“学科的知识”拼起来再发给大模型。尾声:本来准备这个项目做教师培训的时候,内心os“这也太寒酸了”,实践了一下还挺香,这种方式减少了一定的联网压力,毕竟离线识别,翻车率堪比国乒失冠(最近好像没那么稳了),也是个不错的方式嘛。当然还是希望K10能快点实现语音API自由,可以真的自制自己的K10小赵、小钱、小孙、小李.....
补一嘴,设置语音合成的语速是4,是因为K10的离线语音合成读整段文字是不会断句的......我测了一下,4这个语速,相对听着舒服一些...... 春秋大仙 发表于 2025-7-16 15:00
补一嘴,设置语音合成的语速是4,是因为K10的离线语音合成读整段文字是不会断句的......我测了一下,4这个 ...
下面的手机支架我也有同款 hnyzcj 发表于 2025-7-16 16:28
下面的手机支架我也有同款
哈哈,DF有啥是陈老师没有的
页:
[1]