查看: 2048|回复: 3

[K10项目分享] K10自制“小智”之知识点学习机——K10+大模型+离线语音

[复制链接]

本帖最后由春秋大仙于 2025-7-16 14:56 编辑

现状：

K10刷了"小智"固件后，瞬间变身智能语音助手——创客圈和科创教育的老师们玩得不亦乐乎。但总有些"不安分"的老师会想："这固件是别人家的娃，能不能自己生一个？"

理想很丰满：K10+Mind+=自制“小智”
理论上完全可行！K10自带麦克风、喇叭，还能联网，只要：

"借脑"：连个大模型（比如GPT或DS）
"开口说话"：调用语音识别+合成库

李东风老师已经搞定了"借脑"部分（图形化库直连大模型），但"开口说话"还卡在技术瓶颈——K10还没有调用语音识别API的图形化库，板载离线语音只能听懂关键词，不会唠整段嗑...

迂回战术：知识点学习机

既然不能自由恋爱，那就先相亲——把关键词塞进包办婚姻的模板里！

· 设好填空题模板："请告诉我一个关于（）的知识点"

· 让K10当红娘：识别到关键词（如"语文"）后，自动填进括号里发给大模型

效果如下：

嗯，其实有点尴尬，但确实“迂回”了。先凑合吧。毕竟所有伟大的发明，都是从"凑合能用"开始的。

接下来就简单看一下实现过程：

【初始化程序】

1.打开Mind+选择上传模式，左下角扩展-主控，选择K10。除了K10的板载功能，我们还需要两个库，联网和大模型。分别在网络服务和用户库里，搜索并加载“Wi-Fi”和“Deepseek大语言模型”即可。

2.连接wifi，初始化大模型和离线语音识别。

3.初始化“迂回”方式，建一个列表叫“名称”，然后定义一个函数来初始化名称列表，把你想到的学科名字一个一个加入列表，我想到了12个。再定义一个函数添加离线语音识别的命令词，把这12个学科名称的语音一一添加即可。最后设置一个变量x，用来确定ID号和检索列表第x项，全部的初始化指令就完成了。

【功能实现程序】

1.功能逻辑很简单，当用“你好小行”唤醒语音识别后，判断有没有检测的命令词ID，如果检测到了，就把ID号对应的列表里的学科名字发给大模型并等待响应，响应内容可以放在一个字符变量里，然后把变量显示在屏幕上并用离线语音合成读出变量内容即可。

2. 注意，因为我设置了12个学科，所以每轮要执行12次，一轮结束后，记得把变量x设置回1。然后就是“迂回”，我们要发一个完整的句子给大模型，这个句子就需要“人工拼接”一下。可以用运算符里的合并，把“请给我将一个”、“列表名称的第x项”、“学科的知识”拼起来再发给大模型。

尾声：

本来准备这个项目做教师培训的时候，内心os“这也太寒酸了”，实践了一下还挺香，这种方式减少了一定的联网压力，毕竟离线识别，翻车率堪比国乒失冠（最近好像没那么稳了），也是个不错的方式嘛。当然还是希望K10能快点实现语音API自由，可以真的自制自己的K10小赵、小钱、小孙、小李.....

K10 大模型语音识别合成——知识点.zip

使用道具举报

精彩评论(3)

春秋大仙 初级技匠
楼主|

发表于 2025-7-16 15:00:09

补一嘴，设置语音合成的语速是4，是因为K10的离线语音合成读整段文字是不会断句的......我测了一下，4这个语速，相对听着舒服一些......

使用道具举报

hnyzcj 版主

发表于 2025-7-16 16:28:16

春秋大仙发表于 2025-7-16 15:00
补一嘴，设置语音合成的语速是4，是因为K10的离线语音合成读整段文字是不会断句的......我测了一下，4这个 ...

下面的手机支架我也有同款

使用道具举报

春秋大仙 初级技匠
楼主|

发表于 2025-7-17 15:19:26

hnyzcj 发表于 2025-7-16 16:28
下面的手机支架我也有同款

哈哈，DF有啥是陈老师没有的

使用道具举报

为本项目制作心愿单

购买心愿单

心愿单 编辑

[[wsData.name]]

硬件清单

[[d.name]]

我也要做!

点击进入购买页面

撰写新帖

关于楼主

楼主的其它帖子

创造力兑换

心愿单

创客导航

热门版块