如何在NVIDIA Jetson平台创建多摄像头管道

多摄像头应用越来越流行；它们对于实现自主机器人、智能视频分析（ iva ）和 ar / vr 应用至关重要。无论具体的用例如何，都必须始终执行一些常见任务：
俘虏
预处理
编码
陈列
在许多情况下，您还希望在摄像头流上部署 dnn ，并在检测上运行自定义逻辑。图 1 显示了应用程序的一般流程。
图 1 本项目实施的管道流程
在本文中，我将展示如何在 nvidia jetson 平台上高效地实现这些常见任务。具体来说，我介绍了 jetmulticam ，一个易于使用的 python 软件包，用于创建多摄像头管道。我在一个带有环绕摄像头系统的机器人上演示了一个特定的用例。
多摄像头硬件
选择相机时要考虑的参数有很多：分辨率、帧速率、光学、全局/滚动快门、界面、像素大小等。
在这个特定的多摄像头设置中，可以使用以下硬件：
nvidia jetson xavier nx 单元
leopard imaging 提供的支持 gmsl2 的 carrier board
leopard imaging 的 3 × imx185 gmsl2 cameras
imx185 摄像头的视野约为 90 °。如图 2 所示，以 270 °的总视场相互垂直安装。
图 2 安装摄像头是为了最大限度地提高水平视野
摄像头使用 gmsl 接口，该接口在距离 jetson 模块几米远的位置提供了很大的灵活性。在这种情况下，可以将摄像头升高约 0.5 米，以获得更大的垂直视野。
图 3 gmsl 接口可以灵活地将摄像头定位在远离 jetson 模块的位置
开始使用 jetmulticam
首先，在 jetson 板上下载并安装 nvidia jetpack sdk 。然后，安装jetmulticam软件包：
$ git clone https://github.com/nvidia-ai-iot/jetson-multicamera-pipelines.git $ cd jetson-multicamera-pipelines$ bash scripts/install_dependencies.sh$ pip3 install cython$ pip3 install . 基本多摄像机流水线安装完成后，可以使用camerapipeline类创建基本管道。通过 initializer 参数传递要包含在管道中的摄影机列表。在下面的示例中，元素[0, 1, 2]对应于设备节点/dev/video0、/dev/video1和/dev/video2。
from jetmulticam import camerapipelinep = camerapipeline([0, 1, 2]) 就这样，管道已经初始化并启动。现在，您可以从管道中的每个摄像头读取图像，并以numpy阵列的形式访问它们。
img0 = p.read(0) # img0 is a np.arrayimg1 = p.read(1)img2 = p.read(2) 通常，在一个循环中读取相机是很方便的，如下面的代码示例所示。管道从主线程异步运行，read始终获取最新的缓冲区。
while true: img0 = p.read(0) print(img0.shape) # >> (1920, 1080, 3) time.sleep(1/10) 更复杂的人工智能管道现在，您可以构建更复杂的管道。这一次，使用camerapipelinednn类组成更复杂的管道，以及 ngc 目录 peoplenet 和 dashcamnet 中的两个预训练模型。
import timefrom jetmulticam import camerapipelinednnfrom jetmulticam.models import peoplenet, dashcamnetif __name__ == __main__: pipeline = camerapipelinednn( cameras=[2, 5, 8], models=[ peoplenet.dla1, dashcamnet.dla0, # peoplenet.gpu ], save_video=true, save_video_folder=/home/nx/logs/videos, display=true, ) while pipeline.running(): arr = pipeline.images[0] # np.array with shape (1080, 1920, 3) dets = pipeline.detections[0] # detections from the dnns time.sleep(1/30) 下面是管道初始化的分解：
摄像机模型硬件加速保存视频显示视频主回路摄像机首先，与前面的示例类似，cameras参数是传感器列表。在这种情况下，使用与设备节点关联的摄像头：
/dev/video2 /dev/video5 /dev/video8cameras=[2, 5, 8] 模型第二个参数 models 使您能够定义要在管道中运行的预训练模型。
models=[ peoplenet.dla1, dashcamnet.dla0, # peoplenet.gpu ], 在这里，您将从 ngc 部署两个经过预训练的模型：
peoplenet ：一种能够识别人、脸和包的物体检测模型。 dashcamnet ：能够识别四类对象的模型：汽车、人、路标和自行车。有关更多信息，请参阅 ngc 中的 model cards 。
硬件加速模型使用 nvidia 深度学习加速器（ dla ）实时运行。具体来说，可以在 dla0 （ dla core 0 ）上部署 peoplenet ，在 dla1 上部署 dashcamnet 。
在两个加速器之间分配模型有助于提高管道的总吞吐量。此外， dla 甚至比 gpu 更节能。因此，在最高时钟设置的满载情况下，系统消耗的电量仅为~ 10w 。最后，在这种配置中， jetson gpu 仍然可以使用 jetson nx 上的 384 cuda 内核自由加速更多任务。
下面的代码示例显示了当前支持的模型/加速器组合的列表。
pipeline = camerapipelinednn( # ... models=[ models.peoplenet.dla0, models.peoplenet.dla1, models.peoplenet.gpu, models.dashcamnet.dla0, models.dashcamnet.dla1, models.dashcamnet.gpu ] # ...) 保存视频接下来的两个参数指定是否存储编码的视频，并定义用于存储的文件夹。
save_video=true,save_video_folder=/home/nx/logs/videos, 显示视频作为最后的初始化步骤，将管道配置为在屏幕上显示视频输出，以便进行调试。
display=true 主回路最后，定义主循环。在运行期间，图像在pipeline.images下可用，检测结果在pipeline.detections下可用。
while pipeline.running(): arr = pipeline.images[0] # np.array with shape (1080, 1920, 3) dets = pipeline.detections[0] # detections from the dnns time.sleep(1/30) 下面的代码示例显示了结果检测。对于每次检测，您都会得到一个包含以下内容的字典：
对象类以像素坐标定义为[左、宽、顶、高]的对象位置检测置信度>>> pipeline.detections[0][ # ... { class: person, position: [1092.72 93.68 248.01 106.38], # l-w-t-h confidence: 0.91 }, #...] 用自定义逻辑扩展人工智能管道
作为最后一步，您可以使用 dnn 输出扩展主循环以构建自定义逻辑。具体来说，您可以使用摄像头的检测输出在机器人中实现基本的人员跟随逻辑。源代码可在 nvidia-ai-iot/jetson-multicamera-pipelines github repo 中找到。
要找到要跟踪的人，请解析管道。检测输出。此逻辑在 find_closest_human 函数中实现。
根据 dets2steer 中边界框的位置计算机器人的转向角。
如果人在左图中，最大限度地左转。
如果人在正确的形象中，尽量向右转。
如果人在中心图像中，则按边界框中心的 x 坐标成比例旋转。
生成的视频将保存到/home/nx/logs/videos，正如您在初始化过程中定义的那样。
解决方案概述
下面简要介绍一下在下面的示例中配置jetmulticam works. the package dynamically creates and launches a gstreamer pipeline with the number of cameras that your application requires. figure 4 shows how the underlying gstreamer管道时的外观。如您所见，系统中所有关键操作（由绿色方框表示）都受益于硬件加速。
图 4 系统的内部组件 jetmulticam package
首先，使用多个摄像头nvarguscamerasrc在视频图上捕获。使用nvvidconv或nvvideoconvert重新缩放每个缓冲区并将其转换为 rgba 格式。接下来，使用服务器提供的component对帧进行批处理 deepstream sdk 。默认情况下，批次大小等于系统中的摄像头数量。
要部署 dnn 模型，请利用 nvinfer 元素。在演示中，我在 jetson xavier nx 上提供的两种不同加速器 dla core 1 和 dla core 2 上部署了两种型号， peoplenet 和 dashcamnet 。然而，如果需要的话，可以将更多的模型堆叠在彼此之上。
生成的边界框被nvosd元素覆盖后，使用nvoverlaysink将其显示在 hdmi 显示屏上，并使用硬件加速的 h264 编码器对视频流进行编码。保存到。 mkv 文件。
python 代码中可用的图像（例如pipeline.images［0］）通过回调函数或 probe 解析为numpy数组，并在每个视频转换器元素上注册。类似地，在最后一个nvinfer元素的 sinkpad 上注册了另一个回调函数，该元素将元数据解析为用户友好的检测列表。有关源代码或单个组件配置的更多信息，请参阅 create_pipeline 函数。
结论
nvidia jetson 平台上的硬件加速与 nvidia sdks 结合，可以实现卓越的实时性能。例如，下面的示例在三个摄像头流上实时运行两个对象检测神经网络，同时保持 cpu 利用率低于 20% 。
本文展示的jetmulticam包使您能够用 python 构建自己的硬件加速管道，并在检测之上包含自定义逻辑。
关于作者
tomasz lewicki 是 nvidia 的嵌入式工程实习生。他拥有圣何塞州立大学计算机工程硕士学位，华沙工业大学华沙工业大学机器人工程学学士学位。他的兴趣集中在计算机视觉和机器人应用的深度学习上。

关于2019年安防技术发展趋势的详细剖析
全方面解读一汽丰田卡罗拉双擎底盘
人工智能迎来重大资本红利多家公司抢占先机
Σ ADC中有关噪声的十大问题
分析锂电池电解液技术的发展趋势
如何在NVIDIA Jetson平台创建多摄像头管道
高质量单身男女的七夕小确幸，就是TCL这块巨幕智屏
赭曲霉毒素快速检测仪的参数
ResNet原始结果无法复现？大神何恺明受到了质疑
未来的智能电视都可以通过语音进行控制
MWC2018 5G似是提前到来 “后全面屏”时代有些尴尬
OEM厂商占据主导继续巩固，中国未来10年发动机维修需求为482亿美元
华为p10对比小米6，一场黑科技的的较量
选择用佳能手机照片打印机pv-123印美，生活更加炫彩夺丽
荣耀畅玩8C评测好不好用
运放CLC1001的运用
工业智能网关BL110应用之十三：如何配置软件连接
一加9相机详情曝光：有三颗后置摄像头
谷歌和AMD帮助台积电测试和验证3D堆栈封装技术，有望成为首批客户
RFID技术下的应急仓储管理系统解决方案