Mobileye公布最新自动驾驶方案

2020年9月24日,吉利汽车与mobileye正式签约,将使用eyeq5做自动驾驶,同时,mobileye也公布了最新的自动驾驶方案。
11个摄像头中,4个鱼眼短距离的泊车用摄像头,7个远距离自动驾驶用摄像头,包括前向6个,后向1个。与eyeq4最大不同之处在于三目摄像头被双目取代了,三目摄像头实际是单目摄像头在不同fov上的扩展,特斯拉和国内新兴造车的辅助驾驶或自动驾驶方案都是采用三目。而mobileye这次没有用三目,挡风玻璃后视镜位置是两个单目摄像头,fov分别是28度和120度。
考虑到两个摄像头之间的距离,显然不是奔驰那样传统的stereo camera立体双目摄像头,并且根据这两个摄像头的fov看,也不是主摄像头。倒车镜上则有一个fov为100度的摄像头,a柱下方还有一个侧向的fov为100度的摄像头。 实际上mobileye的前部六个摄像头(可能后部的摄像头也参与了)构成了sfm(structurefrom motion)。stereo vision(立体视觉)sfm比较稀疏,再进一步稠密化就是multi viewstereo,即mvs。虽然这七个摄像头都是单目,但他们是合在一起工作的,应该叫多目立体视觉。 mobileye有关sfm的专利主要有三个,一个是2014年的densestructure from motion,另一个是2017年的stereoauto-calibration from structure-from-motion,还有一个是2020年的comfortresponsibility sensitivity safety model(长达197页),其中虽未提及sfm具体算法,但描述了sfm stereo image的处理流程。
mobileye的stereo image处理流程
自动驾驶领域,感知部分的任务就是建立一个准确的3d环境模型。深度学习加单目三目是无法完成这个任务的。单目和三目摄像头的致命缺陷就是目标识别(分类)和探测(detection)是一体的,无法分割的。
必须先识别才能探测得知目标的信息,而深度学习肯定会出现漏检,也就是说3d模型有缺失,因为深度学习的认知范围来自其数据集,而数据集是有限的,不可能穷举所有类型,因此深度学习容易出现漏检而忽略前方障碍物,如果无法识别目标,单目就无法获得距离信息,系统就会认为前方障碍物不存在危险,不做任何减速,特斯拉多次事故大多都是这个原因。 传统算法,则可能无法识别前方障碍物,但依然能够获知前方障碍物的信息,能够最大限度地保证安全。当然这需要传感器配合,激光雷达和双目立体视觉都是以传统算法为核心(因为它不需要识别目标,自然就不需要深度学习,当然你也可以用深度学习处理激光雷达数据,但不是为了识别目标)。
其次,深度学习是一个典型的黑盒子系统,汽车上任何事物都必须具备可解释性和确定性,深度学习并不具备。传统车厂尽量避免在直接有关汽车安全领域使用深度学习,当然,深度学习是识别目标准确度最高的方法,不得不用。大部分车厂会坚持使用可解释的具备确定性的传统图像算法,直到深度学习变成白盒子。
上图为waymo深度学习科学家drago anguelov 2019年2月在mit在讲述无人车感知系统时,坦承机器学习的不足,单目系统漏检无法避免,特别是在交通复杂的中国。深度学习的漏检和算力没有任何关系,再强大的算力也无法避免漏检,也就无法避免事故。 若要解决漏检这个问题,或者说构建一个没有缺失的3d环境模型就必须用将识别与探测分离,无需识别也可以探测目标的信息,忘掉深度学习,传统的做法是激光雷达和双目立体视觉。但激光雷达商业化,车载化一直进展缓慢,双目的缺陷是立体匹配算法门槛太高,在线标定非常困难,只有奔驰、斯巴鲁、路虎和雷克萨斯运用的比较好。宝马虽然高端车型使用双目,但实测结果并不理想,宝马如今也部分放弃了双目路线,电动suv领域还未放弃双目。
除了激光雷达和双目立体视觉外还有一种方法,这就是今天要说的主角:sfm。在双目立体视觉中,两个相机之间的相对位姿是通过标定靶精确标定出来的,在重建时直接使用三角法进行计算;而在sfm中该相对位姿是需要在重建之前先计算的。双目必须两个镜头输入两张照片双目重建方法,sfm和mvs属于单目重建多目立体视觉,输入的是一系列同一物体和场景的多视图。sfm得到的通常是稀疏点云,而经过mvs处理极线约束后可建立稠密点云,可以媲美激光雷达点云,也就是mobileye所说的vidar。
sfm的框架图
structure frommotion(sfm)是一个估计相机参数及三维点位置的问题。一个基本的sfm pipeline可以描述为:对每张2维图片检测特征点(feature point),对每对图片中的特征点进行匹配,只保留满足几何约束的匹配,最后执行一个迭代式的、鲁棒的sfm方法来恢复摄像机的内参(intrinsic parameter)和外参(extrinsic parameter)。并由三角化得到三维点坐标,然后使用bundle adjustment进行优化。常见的sfm方法可以分为增量式(incremental/sequentialsfm),全局式(global sfm),混合式(hybrid sfm),层次式(hierarchica sfm)。这些都是传统opencv算法,跟深度学习无关,而如今,简单易学深度学习横扫一切,复杂难学的传统算法人才非常稀缺,导致sfm几乎没有商业化的例子。
sfm最初是假定相机围绕静态场景运动,实际就是相机获取在目标不同位置的图像,因此可以用放置多个相机取代运动的单一相机。为了避免干扰,28度fov与两个100度fov的摄像头构成sfm系统。sfm通常针对静止目标(古建筑物居多),移动目标难度极大,干扰因素比较多,大部分人都望而却步。 在mvs重建精准3d尺寸模型领域有个难点,即尺度因子不确定性,这个可以用其他传感器如高精度imu获取真实尺寸校准,但高精度imu太贵了,还有一种方法就是dnn。也可以看作用先验尺寸数据推算实际尺寸。当然也有传统的非深度学习方法。
上图即mobileye的vidar,基于比较简单的神经网络dnn,对算力要求远低于图像识别分类的cnn。基于深度学习的3d点云和mesh重构是较难以计算的,因为深度学习一个物体完整的架构需要大量数据的支持。传统的3d模型是由vertices和mesh组成的,因此不一样的数据尺寸data size造成了训练的困难。所以后续大家都用voxelization(voxel)的方法把所有cad model转成binary voxel模式(有值为1,空缺为0)这样保证了每个模型都是相同的大小。利用一个标准的cnn结构对原始input image进行编码,然后用deconv进行解码,最后用3d lstm的每个单元重构output voxel。3d voxel是三维的,它的精度成指数增长,所以它的计算相对复杂。
这个多目立体视觉制造出来的vidar与真实的lidar当然有一定差距,与传统的双目立体视觉相比精度也有一定差距,毕竟双目立体视觉发展了20年,不过多目比双目覆盖面更广。
mobileye supervision的系统框架图
在2020年mobileye的专利里也提到了双处理器设置,第一个视觉处理器检测道路标识、交通标识,并根绝roadbook做定位,第二个视觉处理器则处理sfm,并发送到第一个视觉处理器,构建起一个带有完整道路结构的3d环境模型。 和英伟达、特斯拉以及一堆视觉加速器厂家比,mobileye并不擅长硬件高算力,eyeq5的算力只有24tops,低于英伟达xavier的32tops,2022年即将量产的orin高达200tops。
mobileye擅长的是算法,sfm和mvs将筑起一道算法护城河,并借此提高安全。eyeq5预计在2021年3月量产,尽管其算力与许多国内初创厂家相比都低,但高算力不代表安全,eyeq5依然获得吉利、宝马等4个大整车厂的订单。 加入佐思数据平台会员,可获得mobileye立体视觉专利完整版。
原文标题:忘掉单目和三目吧,mobileye转向立体视觉
文章出处:【微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。


基于eSIM卡的深度解析
如何选用硬件在环测试系统 I/O接口
中软国际携手深开鸿发布KaihongOS创新智联系列产品
打破技术垄断,国内集成电路产业已形成强大竞争力
漏洞挖掘工具afrog软件简介
Mobileye公布最新自动驾驶方案
我国5G手机商用正式开启,4G手机迎来降价潮
晶振电路中C1,C2电容的选择问题
OPPO成为第一批搭载骁龙888的旗舰手机
USDT是否真的具备稳定币的特性
vivo公开“一种柔性屏控制方法及电子设备”新专利
全站仪数据采集的操作步骤详解
IPS获广泛认可 LGD继续引领液晶技术革新
热电阻怎么判断好坏
一文详解音频信号压缩电路
摩尔定律未跟上云端市场脚步 Google给我们更厉害芯片
移动通信视频技术Nancy Codec
Intersil推出业内最小双路3A/单路6A降压电源模块
我国IPv6发展的规模现在怎么样了
西门子S7-1500的案例分步详解