近日,世界最权威的人脸检测公开评测集wider face公布最新评测结果,滴滴ai labs团队联合北京邮电大学pris团队提出的人脸检测dfs算法,在wider face的easy、medium和hard三个评测子集的六项评估结果中, 超过了国内外众多科技公司和高校院所,取得了五项第一、一项第二的好成绩,充分彰显了滴滴在人脸检测领域的创新能力。
wider face是目前业界公开的数据规模最大、检测难度最高的人脸检测数据集之一,由香港中文大学于2016年建立,共包含32,203张图像和393,703个人脸标注。其中40%的数据为训练集(training),10%的数据为验证集(validation),50%的数据为测试集(testing)。每个集合中的数据根据人脸检测的难易程度分为“easy”、“medium”、“hard”。
由于汇集了人脸尺寸大小变化、拍照角度引起的人脸姿态变化、不同程度的人脸遮挡、表情变化、光照强弱差异以及化妆等多种影响因素,该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含卡耐基梅隆大学、加州大学圣地亚哥分校、北航、浙大、京东、腾讯优图、百度、华为云、ibm沃森研究院等)在这个数据集上验证了自己的算法效果。
最新评测结果显示, ai labs团队提出的dfs算法在wider face人脸检测平台中,在官方验证集和测试集的六项评估结果中取得五项第一、一项第二。其中在“easy”、“medium”和“hard”三个测试子集中,dfs算法性能分别达到96.3% ap,95.4% ap,90.7% ap。
图1 验证集性能曲线图
图2 测试集性能曲线图
dfs算法以卷积神经网络中的特征融合为切入点,为了防止高层特征图上的语义信息覆盖低层特征图上的细节信息,提出了特征融合金字塔(feature fusion pyramid)结构,其以空间和通道注意力机制的方式融合高低层特征,在不失细节信息的同时将语义信息作为上下文线索(contextual cues)增强低层特征;另外,dfs算法提出了一种辅助训练单阶段检测器的语义分割分支(semantic segmentation branch),促使检测网络以一种自监督的方式实现注意力机制以及学到更好的特征。具体地说,dfs算法独特的语义分割分支分层地利用更强的语义分割监督信息监督训练网络,使得用于预测人脸的各级特征图专注于各自最适宜检测到的不同尺寸的人脸。
图3 dfs算法网络框架图
目前人脸检测和识别技术已经在滴滴平台广泛使用,用于司机人不符检测、行程中车内录像时的乘客隐私保护等场景,并已形成成熟的技术解决方案,帮助外部合作伙伴进一步提高效率。
实际上,滴滴已经多次在图像视频领域相关竞赛或评测中获得世界级第一。在去年7月的cvpr 2018 wad自动驾驶挑战赛中,揽获了二、三、四名的好成绩;而在去年9月eccv 2018 coco & mapillary挑战赛中,滴滴技术团队首次参赛即获得mapillary街景检测单项世界第一。
此次人脸检测技术再破世界纪录,也充分体现了滴滴在计算机视觉领域强大技术实力,滴滴将持续进行更多探索,不断优化出行交通感知理解、智能交互等技术,用先进的ai技术提升用户体验、助力行业转型升级,进而构建智能出行新生态。
思特威推出高端ADAS应用8.3MP高分辨率车规级图像传感器新品SC850AT,赋能高级辅助驾驶与自动驾驶应用
工业物联网能耗监测系统应用
韩国电信公司推出了一款名叫N bot的服务机器人
为什么要进行数据清洗呢?
高压电缆故障及隐患监测系统:保障电力安全的重要工具
世界最权威的人脸检测公开评测集WIDER FACE公布最新评测结果
高通加Win10,能撼动Intel的地位么?
电池单格短路现象造成原因及修复方法
最常用的两种无线充电方式原理
迪进国际推出适用于工业4.0普及的蜂窝式路由器
6G运存手机大比拼:三星C9 Pro、OPPOR9s Plus、一加3T、VivoX9 Plus、360N5,性价比超高!
大深教你对对射式光电传感器安装注意事项
云智能正在推动云计算应用
电动汽车补贴如何影响主要电动汽车市场的电池供应链?
电动车控制器电源管理IC U6119简介
未来地铁试跑成功 车窗变身触控屏
redis的主要方法
杨元庆diss折叠屏是怎么回事?他都说了什么?
爱普生BT-35E虚拟现实眼镜:将是医生好帮手 学校好老师 生活好助手
新思科技携手台积公司推出“从架构探索到签核” 统一设计平台