本文是对 cvpr2019 论文《generalized intersection over union: a metric and a loss for bounding box regression》的解读,通过对 loss 的修改提升检测任务的效果,觉得思路很棒。
该文作者来自斯坦福大学与澳大利亚阿德莱德大学。
iou是检测任务中最常用的指标,由于iou是比值的概念,对目标物体的scale是不敏感的。然而检测任务中的bbox的回归损失(mse loss, l1-smooth loss等)优化和iou优化不是完全等价的(见下图)。
而且 ln范数对物体的scale也比较敏感。这篇论文提出可以直接把iou设为回归的loss。然而有个问题是iou无法直接优化没有重叠的部分。为了解决这个问题这篇paper提出了giou的思想~
iou与l2范数的优化不是等效的。要将iou设计为损失,主要需要解决两个问题:
预测值和ground truth没有重叠的话,iou始终为0且无法优化
iou无法辨别不同方式的对齐,比如方向不一致等。
iou 无法代表 overlap 的方式
giou
所以论文中提出的新 giou 是怎么设计的呢:
假如现在有两个任意性质 a,b,我们找到一个最小的封闭形状c,让c可以把a,b包含在内,然后我们计算c中没有覆盖a和b的面积占c总面积的比值,然后用a与b的iou减去这个比值:
giou有如下性质:
与iou类似,giou也可以作为一个距离,loss可以用 (下面的公式)来计算
同原始 iou 类似,giou 对物体的大小不敏感。giou 总是小于等于 iou,对于 iou,有
giou 则是
在两个形状完全重合时,有
由于 giou 引入了包含 a,b 两个形状的 c,所以当 a,b 不重合时,依然可以进行优化。
总之就是保留了iou的原始性质同时弱化了它的缺点。于是论文认为可以将其作为iou的替代。
giou 作为 bbox 回归的损失
具体一点,如何计算损失呢?我们以 2d detecation 为例:
假设我们现在有预测的 bbox 和 groud truth 的 bbox 的坐标,分别记为:
注意我们规定对于预测的 bbox 来说,有
主要是为了方便之后点的对应关系。
作者做了一系列的实验(针对分割任务和分类任务有一定 loss 的调整设计,不过论文中没有详细给出)结果是 iou loss 可以轻微提升使用 mse 作为 loss 的表现,而 giou 的提升幅度更大,这个结论在 yolo 算法和 faster r-cnn 系列上都是成立的:
pascal voc 2007上的提升with yolo
ms coco的提升with yolo
pascal voc 2007 with faster-rcnn
更多内容大家可以参考项目主页:
https://giou.stanford.edu/
代码实现:
https://github.com/generalized-iou
原文链接:
https://zhuanlan.zhihu.com/p/57992040
被中国植入监控微芯片?苹果、亚马逊对彭博报道提出质疑
一名测试工程师的职场感悟
英伟达a100和a800的区别
努比亚红魔游戏手机,烈焰红8GB+128GB版本,现已大降价
显示器处理器芯片是什么?显示器处理器芯片市场的发展趋势
斯坦福学者提出GIoU,目标检测任务的新Loss
TQC粘度杯VF2029/VF2030/VF2031/VF2032的介绍
5G时代会让微软成功进入电信消费市场吗?
[组图]我做高频用的电子元件
如何从智能合约中生成Java Wrapper
实惠的智能家居——无线温控插座它来了
AI替代人类进程是否会加快
迷你洗衣机并没有想象的好 挑选产品得选择合适得当的
宁德时代与国网成立合资公司助力储能发展
单片机电源供电电路设计方案
SpaceX将让月球旅行成真?已签下首位私人乘客
惠东江波汽车音响改装为您找到中国好声音
VR是如何让人产生身临其境的感觉
华尔思与思必驰签署战略合作协议,开展AI技术战略合作
壁挂式流量计