阿里巴巴“NASA计划”新进展:刷新视觉计算世界纪录

简介: 5月18日,全球权威机器视觉算法测评平台KITTI的世界纪录再此被刷新。阿里云将其车辆检测的准确率拉升至90.46%。阿里巴巴iDST视觉计算研究员华先胜详细解读了背后的技术。

5 18 日,全球权威机器视觉算法测评平台 KITTI 的世界纪录再此被刷新。来自中国的科技公司阿里云将其车辆检测的准确率拉升至 90.46% 。车辆检测被认为是实现无人驾驶的关键技术,极具挑战。


7f254be5de921ebe01ad24ffae3feb466ded5f76

据了解,此次重大技术突破是由阿里巴巴iDST视觉计算研究员华先胜领导的团队完成。他们提出了基于区域融合决策和上下文相关的多任务深度神经网络,用于复杂场景下的车辆检测任务,重点解决其中多视角,多姿态以及车辆遮挡等问题。

在网络结构设计上,团队利用反卷积操作提高了小目标的召回率,同时拼接了多层特征以融合低层的局部信息和高层的语义信息,提高了边框定位的准确率。在训练过程中,还借鉴了GAN(生成对抗网络)中的对抗训练模式。

华先胜表示,现在我们已经将这样的技术集成到阿里云ET当中,并在城市大脑中得以应用。它能够帮助城市大脑准确的看懂车流信息,快速的做出全局性判断。华先胜是视觉识别和搜索领域的国际级权威学者,曾获选国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM杰出科学家。

城市大脑是包括阿里云在内的13家企业联合杭州市政府发起的项目,旨在构建一个城市级的人工智能中枢,让城市能够与人类友好互动。这其中分析视频是城市大脑获取信息的关键。

以交通治理为例,通过这项技术,城市大脑通过普通摄像头就可以感知复杂路况下车辆的运行状态和轨迹,对这些数据进行实时分析。基于此,进行多种智能交通优化。在视频数据处理规模上,全球罕有。

 

在视觉计算领域的持续攻坚,是阿里巴巴“NASA”计划的一部分。该计划聚焦于机器学习、芯片、IoT、操作系统、生物识别等核心领域,他们希望能解决10年、20年后的困难。此前,已在光量子计算机、全浸没液冷服务器等方面取得重大进展。


KITTI是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,可以用于评测目标检测等计算机视觉技术在复杂真实环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,有大量的微小目标、欠曝和过曝、多种视角变化以及各种遮挡情况。

 

相关文章
|
7月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
简介: 互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。
破壁人AI百度:科技公司反内卷的典型样本
|
7月前
|
机器学习/深度学习 敏捷开发 人工智能
技术创新与实践:从理论到应用的跨越
在当今快速发展的科技时代,技术创新已成为推动社会进步的引擎。本文探讨了技术创新的重要性以及理论与实践之间的密切关系,通过案例分析和实践经验总结,展示了技术创新从理论到应用的跨越,以及其在各个领域的应用前景。
186 0
|
7月前
|
人工智能 搜索推荐 算法
智库观察丨超拟人大模型和个性化场景化的AI服务
以情绪价值为核心的超拟人大模型能够使AI 拥有自己的“个性”和“情感”,从而呈现出丰富的立体化“人格”,为用户提供量身定制的AI服务。
智库观察丨超拟人大模型和个性化场景化的AI服务
|
机器学习/深度学习 存储 缓存
遍览数年历史视频、挖掘用户隐藏兴趣,快手终身行为建模方案TWIN入选KDD 2023
遍览数年历史视频、挖掘用户隐藏兴趣,快手终身行为建模方案TWIN入选KDD 2023
688 0
|
存储 小程序 API
|
7月前
|
存储 并行计算 Java
一文读懂 PyTorch 显存管理机制
一文读懂 PyTorch 显存管理机制
426 1
|
机器学习/深度学习 算法 Python
基于CNN-GRU-Attention混合神经网络的负荷预测方法(Python代码实现)
基于CNN-GRU-Attention混合神经网络的负荷预测方法(Python代码实现)
248 0
|
存储 弹性计算 运维
阿里云云电脑怎么样?价格是多少?可以代替传统电脑吗?
阿里云云电脑怎么样?价格是多少?可以代替传统电脑吗?
600 0