查看: 3868|回复: 0

[官方资料] Jetson Nano 2GB 系列文章（18）：Utils 的 videoSource 工具

前两篇已经用 10 行 Python 代码展现了 Hello AI World 强大而且简便的物件检测识别能力，虽然大部分的人都将目光集中在了深度学习的三大推理识别（图像分类、物件检测、语义分割），但是在整个项目中，其实还有两个非常重要的功臣功能，那就是 videoSource() 与 videoOutput() 这两个专司输入与输出的接口。

如果你认为这两个功能只是简单地负责数据接收与显示的话，这就大大浪费了项目作者的心血结晶，因此我们在进入本项目另外两个深度学习推理应用之前，先要把这两个幕后功臣的内涵展现出来，因为这与后面的应用息息相关。本文先就 videoSource() 这个功能进行说明。

有经验的开发人员都清楚，输入源的种类十分多样，并且格式非常繁琐，其中还包括图像的颜色空间（color space）变化，要全部集成在一个函数中去调用，已经是非常高难度的事情了，如果这个函数还能为我们集成 Jetson 的编解码芯片的调用，以及将许多非常图像处理的计算交由 CUDA 核去计算，这就是一个值得我们为之欢呼的功能了。

videoSource() 功能是项目作者一个集大成的作品，具备以下特点：

1.支持 7 种输入源方式
A. CSI 摄像头：”csi://0”
B. USB 摄像头：”/dev/video<N>”，其中 <N> 置换成指定的 USB 摄像头编号
C. RTP 视频流：“rtp://<remote_ip>:1234”
D. RTSP 视频流：“rtsp://username:password@<remote-host>:1234”
E. 视频文件：“完整文件名”，例如 “input.mp4”
F. 图像文件：“完整文件名”，例如 “room_0.jpg”
G. 文件夹：如果识别 “完整文件名” 是个文件夹时，就会把目录下文件整批作为输入

2.支持 7 种视频格式 ：H.264、 H.265、VP8、 VP9、 MPEG-2、MPEG-4 以及 MJPEG
3.支持 9 种图像格式 ：JPG、 PNG、TGA、BMP、GIF、PSD、 HDR、 PIC 以及 PNMs
4.自动根据数据源，调用合适的 NVDEC 解码功能
5.将数据计算紧密结合 CUDA 计算核

这样一列出来，是否已经感受到了这一功能的强大呢？由于集成这么多特点，可以使代码的调用变得异常简单，而且完全发挥 Jetson Nano 2GB 的硬件计算资源，兼具 “易用” 与 “高效” 两个极端的特色。接下来我们就用几个简单的代码，带着大家体验一下这个工具的用法。
现在请大家先回忆一下用 openCV 建立 CSI 摄像头对象的代码，如下：

Jetson Nano 2GB 系列文章（18）：Utils 的 videoSource 工具图1