【2020】用虚谷号打造一个智能语音助理
正月初五,国内冠状病毒肺炎形式严峻,相应国家号召,继续在家学习。在论坛里多次看到有老师发古德微的树莓派作品,咱虚谷号用户肯定也要有所表示。
今天和大家分享一个用虚谷号打造的一个智能语音助理。
一、简介
主要实现如下功能:
[*]智能语音识别,作为语音助手当然是必须项了,为了应景,这里用“抗击肺炎”作为唤醒词。
[*]基于思知AI机器人开放平台的智能语义解析。
[*]实现论坛自动签到。
[*]智能获取论坛最新发帖文章。
因为虚谷号只有 micro hdmi,没有3.5mm的音频输出口,而我没有 micro hdmi的线,
所以声音的输出我用了蓝牙音箱,
但是因为虚谷号系统版本的原因,对于蓝牙音箱的声音输入又不支持,手头又没有麦克风,
所以声音的输入我用了带有录音功能的摄像头,
{:5_128:},心好累。。。
设备一览图:
二、实现解析:
1.声音的获取主要是用pyaudio库录音,并用wave库保存为 wav 格式,这两个库虚谷号在最新固件里已内置。
主要用rec函数来处理:
def rec(file_name='xuguhao.wav'):
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("开始录音,请说话...")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
print("录音结束!")
stream.stop_stream()
stream.close()
p.terminate()
wf = wave.open(file_name, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()
return file_name
2.语音识别用了百度的在线语音识别功能:
""" 你的 APPID AK SK """
APP_ID = ""
API_KEY = ""
SECRET_KEY = ""
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
def audio_to_text(wav_file):
with open(wav_file, 'rb') as fp:
file_context = fp.read()
print("开始识别...")
# 识别本地文件
res = client.asr(file_context, 'wav', 16000, {
'dev_pid': 1536,
})
res_str = res.get("result")
return res_str
其中 百度语音的 aip 库,虚谷号最新固件已内置。
app_id需要自己注册获得,基于篇幅原因这里不展开讲了。
如有需要请自行百度。
3.文字转语音(TTS)也是用的百度接口,
def text_to_speech(text):
global client
result = client.synthesis(text, 'zh', 1, {'vol': 5,})
if not isinstance(result, dict):
with open('return.mp3', 'wb') as f:
f.write(result)
mplayer('return.mp3')
4.声音播放输出用了mplayer 播放器,如有需要请在虚谷号里自行安装:
sudo apt-get install mplayer
5.论坛的签到在这里:
def df_sign(req_session, formhash):
url_sign = 'https://mc.dfrobot.com.cn/plugin.php?id=dsu_paulsign%3Asign&operation=qiandao&infloat=1&sign_as=1&inajax=1'
payload = 'formhash={}&qdxq=yl&qdmode=2&todaysay=&fastreply=0'.format(formhash)
response = req_session.post(url_sign, payload, headers=headers)
if '成功' in response.text:
print('签到成功')
return 0
elif '已经签到' in response.text:
print('你已经签到')
return 1
else:
print('未知错误')
return 2
因为论坛的cookies时间很短,所以每次签到,需要先登录,登录函数如下:
def df_login():
url_first = 'https://mc.dfrobot.com.cn/member.php?mod=logging&action=login'
url_dflogin = 'https://login.dfrobot.com.cn/member/auth'
req_session = requests.session()
response = req_session.get(url_first)
response = req_session.post(
url=url_dflogin,
data=payload,
headers=headers,)
formhash_text = response.text
pre_find = 'name="formhash" value="'
index_formhash = formhash_text.find(pre_find)
if index_formhash > 0:
formhash = formhash_text
return req_session, formhash
else:
return
6.论坛文章的获取:
def get_new_topic(req_session):
global last_time
url_new_topic = 'https://mc.dfrobot.com.cn/forum_api.php?act=ajax_forum&module=new&page=1'
response = req_session.get(url_new_topic, headers=headers).json()
ret_topic = []
if not response:
return ()
for value in response:
if value['publish'] > last_time:
ret_topic.append(value['title'])
else:
break
last_time = response['publish']
return tuple(ret_topic)
7.最后,语音助理的核心用了
思知 AI机器人开放平台,https://console.ownthink.com ,
本来想用tuling123的接口,可是现在不手持身份证进行认证审核不给权限。不能忍,就不用了。
sess = requests.get('https://api.ownthink.com/bot?appid={}&userid=kylin&spoken={}'.format(sess_app_id, value))
answer = sess.json()
value = answer['data']['info']['text']
接口比较简单,直接 get一下就好了,如有需要自己看官网文档,这里不展开了。
三、完整代码
四、成功视频
https://www.bilibili.com/video/av85581586?pop_share=1
好听话的机器人,脾气也好。{:5_179:} 多谢分享,学习了。 不错的分享
页:
[1]