前言
大家好, 我叫stefano gasperini, 在此宣传我们的iccv 2023的工作, 更多详细信息可查看我们的论文: https://arxiv.org/abs/2308.09711, 和我们的项目网站: https://md4all.github.io.
代码:https://github.com/md4all/md4all
在cver微信公众号后台回复:md4all,可下载本论文pdf和代码
首先请大家观看这样一个例子:
你能在彩色图片中看到树吗?
我们的单目深度估计网络在所有条件下都能输出可靠的深度估计值,即使在黑暗中也是如此!
背景
虽然最先进的单目深度估计方法在理想环境下取得了令人印象深刻的结果,但在具有挑战性的光照和天气条件下,如夜间或下雨天,这些方法却非常不可靠。
在这些情况下, 传感器自带的噪声、无纹理的黑暗区域和反光等不利因素都违反了基于监督和自监督学习方法的训练假设。自监督方法无法建立学习深度所需的像素的对应关系,而监督方法则可能从传感器真值中(如上图中的 lidar 与 nuscenes 的数据样本)中学习到数据瑕疵。
方法
在本文中,我们提出了 md4all 解决了这些安全关键问题。md4all 是一个简单有效的解决方案,在不利和理想条件下都能可靠运行,而且适用于不同类型的监督学习。
我们利用现有方法在完美设置下的工作能力来实现这一目标。因此,我们提供的有效训练信号与输入信号无关。首先,通过图像转换,我们生成一组与正常训练样本相对应的复杂样本。然后,我们通过输入生成的样本并计算相应原始图像上的标准损失,引导网络模型进行自监督学习或完全监督学习。
如上图所示,我们进一步从预先训练好的基线模型中提炼知识,该模型只在理想环境下进行推理,同时向深度模型提供理想和不利的混合输入。
我们的 github 代码库中包含所提方法的实现代码, 欢迎访问:
https://github.com/md4all/md4all
结果
通过 md4all,我们大大超越了之前的解决方案,在各种条件下都能提供稳健的估计。值得注意的是,所提出的 md4all 只使用了一个单目模型,没有专门的分支。
上图显示了在 nuscenes 数据集的挑战性环境下的预测结果。由于场景的黑暗程度和噪声带来的影响,自监督方法 monodepth2 无法提取有价值的特征(第一行)。有监督的 adabins 会学习到来自传感器数据的瑕疵,并造成道路上的空洞预测现象(第二行)。在相同的架构上应用,我们的 md4all 提高了在标准和不利条件下的鲁棒性。
在本文中,我们展示了 md4all 在标准和不利条件下两种类型的监督下的有效性。通过在 nuscenes 和 oxford robotcar 数据集上的大量实验,md4all 的表现明显优于之前的作品(如上图数据所示)。
图像转换
我们还显示了为训练 md4all 而生成的图像转换示例 (如上图所示)。我们通过向模型提供原始样本和转换样本的混合数据进行数据增强。这样一个模型就能在不同条件下恢复信息,而无需在推理时进行修改。
在此,我们开源共享所有不利条件下生成的图像,这些图像与 nuscenes 和牛津 robotcar 训练集中的晴天和阴天样本相对应。欢迎访问:
https://forms.gle/31w2tvttivnypb916
这些图像可用于未来深度估计或其他任务的稳健方法。
AMG-Microwave天线的特征
AMD处理器在德国市场大受欢迎
魅族:正确的事情做到极致,盈利也如此
国巨新一代触觉致动器让虚拟触感更多元!
Mesh无线自组网针对各种无线传输的应用
TUM&谷歌提出md4all:挑战性条件下的单目深度估计
骨传导耳机到底好在哪里?这几个优点你得知道
能源管控信息系统,能源托管,能效分析系统,源中瑞Dave
曾经中国最强外包公司开启数字化转型,能否吃下32万亿大蛋糕?
沿海地区使用大疆的经纬M200系列等动力冗余度较高的无人机进行作业
主流16位单片机学习详解:飞思卡尔MC9S12G系列
PCB设计时处理去耦电容和旁路电容的注意事项
基于凌阳16位单片机的智能车电路模块设计
手机不好做!黑莓视线转移,全力打造自动驾驶汽车?
华为P10闪存门最新消息:华为P10闪存门事件深入人心,如何测试手机内存
一种通用自动测试软件平台设计
赛目科技副总经理杨强出席2023中国人工智能投融资峰会自动驾驶主题论坛并演讲
纯电动商用车动力系统匹配、基本参数及设计要求
突破!中国科学家采用超快摄像机捕获光的运动 每秒4万亿帧
冷轧机涨轴轴头磨损的修复方法