【MaixPy教程】用maixHub训练模型进行开源硬件识别

前言
年前参加了dfrobot的活动:DF冬季AI挑战赛有幸进入第二轮,大方的木子给了200的优惠券。在逛了DF商城时候无意间发现了一个宝贝:Maix Dock AI开发板!又有液晶屏和摄像头!!难道它不香吗?现在想想它是真的香


它是基于k210 AI芯片,作为核心处理单元,k210带独立FPU的双核处理,64位的CPU位宽,8M的片上SRAM,400M的可调标称频率,支持乘法、除法和平方根运算的双精度FPU,在AI处理方面k210可进行卷积、批归一化、激活、池化等运算。也可以进行语音方向扫描和语音数据输出的前置处理工作,可实现人脸检测,语音识别,颜色、物体识别,MNIST手写数字识别,Feature map显示,tiny yolov2 20分类等多种功能。
什么是K210 AI芯片呢?可以看一下大神稚辉君的帖子:嵌入式AI从入门到放肆【K210篇】-- 硬件与环境 想要详细了解MaixPy的资料可以查看:矽速科技官网
硬件准备
准备数据集
- 用手机拍摄我们的Arduino、microbit、掌控板、树莓派的图片(ps:识别的准确定和我们的数据集的大小有关):

数据集处理
将图片数据集按分类保存为单独的文件夹, 子目录的名字为最后生成label的名字。
注意:分类文件夹数量要大于 2个!
例如:
数据集文件目录结构
|-Dir_name
|-Class_1
|- pic01.jpg
|- pic02.jpg
|- pic03.jpg
|-Class_2
|- pic01.jpg
|- pic02.jpg
|- pic03.jpg

-
使用转换工具处理文件夹
工具下载地址:预处理软件
- 将预处理软件下载完成之后,解压后点击.exe文件即可使用

选择文件夹确定即可

选择我们准备好的数据集

执行完成后会生成zip文件(这个之后我们在模型训练的网站上会有用到)

*注意:
建议的图片分辨率 224224, 上传之前可以使用工具批量转换一下
每个分类不要低于40张图片,否则无法开始训练
数据集压缩后大小不超过20M
子目录名不能使用汉字, 否则生成的label无法显示**
训练模型
获取机器码
-
下载key_gen固件 key_gen_v1.2.zip
-
下载kflash-gui kflash-gui
-
使用kflash-gui 烧录 key_gen 固件

- 打开串口终端(Xcom), 重启开发板, 可以看到打印出的机器码。
Please Send Bellow Data to Sipeed --> support@sipeed.com:
6f80dccbe29**********cc7e9d69f92
Generate key end
其中 6f80dccbe29**********cc7e9d69f92 就是对应开发板的机器码
提交训练任务
- 打开Maixhub模型训练平台并创建一个任务

在填写邮箱处填写接受模型的邮箱在填写机器码处填写机器码
- 上传数据集,选择我们前面准备好的数据集

- 进行数据训练,训练的时间和我们的数据集大小有关

训练好后,我们的邮箱会接受的我们的训练模型:

这里可以看到我的准确度还是比较低的。我们下载并解压下来可以看到下面这个文件:

里面有我们的的数据模型,和我们模式的一些准确度、损失度等信息



烧录模型到flash
模型有两种使用方式, 可以使用sd卡或烧录flash的方式来运行模型脚本。
使用sd卡
-
烧录最新Maixpy固件
-
将邮件中的zip 解压
-
将所有文件放到sd卡根目录
-
将sd卡插到开发板上, 重启开发板
烧录模型到flash
- 打开 kflash-gui, 选择解压出的kfpkg文件(模型内自带maixpy 固件,不需要单独烧录)

程序的编写
在邮件中的训练模型解压文件中,有boot.py,就是我们的识别模型程序了,我们现在用MaixPY IDE打开(具体使用操作及相关API文档可以参考官方wiki):

# refer to http://blog.sipeed.com/p/680.html
import sensor, image, lcd, time
import KPU as kpu
lcd.init()
lcd.clear()
#lcd.mirror(1)
try:
img = image.Image("/sd/startup.jpg")
lcd.display(img)
except:
lcd.draw_string(lcd.width()//2-100,lcd.height()//2-4, "Error: Cannot find startup.jpg", lcd.WHITE, lcd.RED)
sensor.reset()
sensor.set_pixformat(sensor.RGB565)
sensor.set_framesize(sensor.QVGA)
sensor.set_windowing((224, 224))
sensor.set_vflip(0)
sensor.set_hmirror(0)
sensor.run(1)
f=open('/sd/labels.txt','r')
labels=f.readlines()
f.close()
task = kpu.load('/sd/f1ba58e5f3d2011d3320a4fd0cd2ca69_813835c56cbfc4cfaf63052b70ba2c6e.smodel')
lcd.clear(0xFFFF)
clock = time.clock()
while(True):
img = sensor.snapshot()
clock.tick()
fmap = kpu.forward(task, img)
fps=clock.fps()
plist=fmap[:]
pmax=max(plist)
max_index=plist.index(pmax)
a = lcd.display(img, oft=(48,0))
lcd.draw_string(48, 224, "%.2f:%s "%(pmax, labels[max_index].strip()))
print(fps)
a = kpu.deinit(task)
程序演示