阿里达摩院突破自动驾驶技术难题:实现3D物体检测精度速度兼得

简介: 达摩院的研究人员提出一个通用、高性能的检测器,在自动驾驶领域最重要的测试集之一 KITTI的鸟瞰(BEV)数据集上,检测速度达到25FPS ,一举占据榜首。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

最新消息,阿里达摩院又有新的研究进展,这次在自动驾驶3D物体检测领域。

达摩院的研究人员提出一个通用、高性能的检测器,在自动驾驶领域最重要的测试集之一 KITTI的鸟瞰(BEV)数据集上,检测速度达到25FPS ,一举占据榜首,与排名第二的方案相比,减少了一半多,同时精度也远超其他的单阶段检测器。可以说首次实现3D物体检测精度与速度兼得。

image

达摩院研究团队表示:“检测器是自动驾驶系统的核心组件之一,但该领域一直缺少创新和突破,此次我们实现3D检测精读和速度的提升,将有助于提高自动驾驶系统的安全性。”

从实验结果来看,他们显然取得了良好进展,而且研究的主要完成人员(一作),还是一名达摩院的实习生。

同时,该研究也得到了同行们的认可,被计算机视觉领域顶级会议CVPR 2020收录。他们是如何做到的呢?我们借助阿里达摩院提供的解读,一一来看。

如何实现精度和速度兼得?

众所周知,与普通2D图像识别应用不同,自动驾驶系统对精度和速度的要求更高,不仅需要快速识别周围环境的物体,还要对物体在三维空间中的位置做精准定位。

仅靠传感器和算法模型,通常无法平衡视觉识别的精度和速度。因此,检测器成为提升自动驾驶系统安全性的一个关键因素。

image

经过多年研究,当前业界主流的单阶段检测器在检测速度上很好,但在检测精度却差强人意。

这就是达摩院研究的出发点:寻找一种能二者兼得的方法。

他们提出的思路是:将两阶段检测器中对特征进行细粒度刻画的思想,移植到单阶段检测中。

在他们的模型中,用于部署的检测器, 即推断网络, 由一个骨干网络和检测头组成。

骨干网络用3D的稀疏网络实现,用于提取含有高语义的体素特征。检测头将体素特征压缩成鸟瞰图表示,并在上面运行2D全卷积网络来预测3D物体框。

他们在训练中利用一个辅助网络将单阶段检测器中的体素特征,转化为点级特征并施加一定的监督信号。

在实现上,他们将卷积特征中的非零信号映射到原始的点云空间中, 然后在每个点上进行插值,来获取卷积特征的点级表示。使得卷积特征也具有结构感知能力,来提高检测精度。

image

而在做模型推断时,辅助网络并不参与计算(detached),保证单阶段检测器的检测效率。

另外,他们还提出一个工程上的改进:Part-sensitive Warping (PSWarp),用于处理单阶段检测器中存在的 “框-置信度-不匹配” 问题。

核心思路是:利用采样器, 用生成的采样网格在对应的局部敏感特征图上进行采样,生成对齐好的特征图。最终能反映置信度的特征图,是K个对齐好特征图的平均。

image

单阶段方法,能达到两阶段方法精度

阿里达摩院的研究人员,在KITTI数据集上评估了方法的有效性。下图(PR Curve)中,实线为两阶段方法, 虚线为单阶段方法。

image

可以看出,达摩院提出的单阶段方法(黑色)能够达到两阶段方法才能达到的精度。

下图展示了他们在KITTI 鸟瞰(BEV) 和 3D 测试集上的结果。

image

可以看出,他们提出的方法,可以在不增加额外计算量的情况下,达到25FPS 的检测速度,而且还能保持精度。具体的检测效果如下:

image

两位共同一作,都是达摩院研究实习生

研究论文,标题为“Structure Aware Single-Stage 3D Object Detection from Point Cloud”,共有5名研究人员参与,分别来自阿里达摩院和香港理工大学。

第一作者是Chenhang He,是阿里达摩院的研究实习生,正在香港理工大学读博,预计2022年毕业。

他的导师是达摩院高级研究员、香港理工大学电子计算学系讲座教授、IEEE Fellow张磊,也是这一研究的通讯作者。

另一位第一作者Hui Zeng,也是是阿里达摩院的研究实习生,同样是张磊的博士生,预计在今年毕业。

其他作者,分别是达摩院高级研究员、IEEE Fellow华先胜、达摩院资深算法专家黄建强等。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-03-19
本文作者: 乾明
本文来自:“51CTO”,了解相关信息可以关注“51CTO

相关文章
|
Oracle 关系型数据库
集成平台即服务(iPaaS)软件
本文研究全球及中国市场集成平台即服务(iPaaS)软件现状及未来发展趋势,侧重分析全球及中国市场的主要企业,同时对比北美、欧洲、中国、日本、东南亚和印度等地区的现状及未来发展趋势
|
4月前
|
API 数据安全/隐私保护 网络架构
API接口
API(应用程序编程接口)是软件间通信的标准方式,通过定义规则和协议,便于开发者构建和集成服务。它通常基于RESTful架构或GraphQL实现,使用HTTP方法进行数据交互。以RESTful API为例,它通过GET、POST、PUT、DELETE等方法执行数据操作。示例中使用Python的requests库调用OpenWeatherMap API获取天气信息,展示了GET请求的实现。实际应用中,API还需结合OAuth 2.0等认证机制保障安全性。
|
传感器 监控 安全
物联网(IoT):定义、影响与未来
物联网(IoT):定义、影响与未来
1992 3
|
存储 缓存 负载均衡
|
人工智能 文字识别 API
20行代码教你如何批量提取图片中文字
大家好,我是志斌~ 之前志斌在考研的时候遇到了一个问题,就是要将图片中的文字给提取出来,当时是J哥帮忙搞出来的,现在已经考完研了,也学会了提取方式,现在来给大家分享一下。
1457 0
20行代码教你如何批量提取图片中文字
|
计算机视觉 Python
【Python实战】——Python+Opencv是实现车牌自动识别
【Python实战】——Python+Opencv是实现车牌自动识别
|
测试技术 开发工具 git
多人协作多版本开发冲突的正确解决姿势
多人协作多版本开发冲突的正确解决姿势
558 0
多人协作多版本开发冲突的正确解决姿势
|
消息中间件 存储 编解码
MQ 介绍|学习笔记
快速学习 MQ 介绍
1439 0
MQ 介绍|学习笔记
|
存储 数据采集 运维
关于 Data Lake 的概念、架构与应用场景介绍
本文详细介绍了 Data Lake 的概念、架构与应用场景介绍。
3404 2
关于 Data Lake 的概念、架构与应用场景介绍