DAMO-YOLO项目原作解读:兼顾速度与精度的高效目标检测框架

简介: DAMO-YOLO项目原作解读:兼顾速度与精度的高效目标检测框架

目标检测是计算机视觉中的一个重要领域,它主要研究的是如何从输入的图像或者点云中定位出感兴趣物体的位置,在视觉 AI 的应用落地中发挥着基石的作用。现在市面上已经涌现了许多优秀易用的目标检测框架,但是在目标检测应用领域,仍然有以下几个重点问题没有解决:一是模型尺度单一,难以充分发挥用户的芯片算力。二是模型的多尺度检测能力弱,难以覆盖复杂多变的检测场景。三是模型的速度-精度曲线不够理想,在针对速度限制取舍模型时,会发现精度损失难以接受。

针对上述几个问题,结合阿里达摩院的技术积累,DAMO-YOLO 提出了自己的解法。DAMO-YOLO 中引入了 TinyNAS 技术,使得用户可以根据硬件算力进行低成本的检测模型定制,提高硬件使用效率并获得更高的精度。DAMO-YOLO 中还对检测模型的 neck、head 结构进行重新设计,创新性提出了 Heavy-Neck 模型设计范式,显著提升了模型的多尺度检测能力。最后,DAMO-YOLO 还提供了一套支持全尺度模型、异构鲁棒的蒸馏方案,实现无痛涨点,充分发挥模型潜力。此外,为了方便用户使用 DAMO-YOLO 解决自己的问题,还开源了多个工业应用模型。

机器之心最新一期线上分享邀请到了阿里巴巴达摩院算法工程师许贤哲,为大家解读他们近期的工作 DAMO-YOLO。


分享主题:DAMO-YOLO:兼顾速度与精度的高效目标检测框架

分享嘉宾:许贤哲,阿里巴巴达摩院算法工程师,天津大学通信与信息系统硕士,先后研究行人重识别、无监督学习、目标检测等方向,多次夺得 ICCV、CVPR 竞赛冠军,并担任 ECCV、CVPR 等会议审稿人。

分享摘要:DAMO-YOLO 是一个面向工业落地的目标检测框架,兼顾模型速度与精度,其训练的模型效果超越了目前的一众 YOLO 系列方法,并且仍然保持极高的推理速度。DAMO-YOLO 引入 TinyNAS 技术,使得用户可以根据硬件算力进行低成本的检测模型定制,提高硬件利用效率并且获得更高精度。DAMO-YOLO 还对检测模型中的 neck、head 结构设计,以及训练时的标签分配、数据增广等关键因素进行了优化,取得了精度和速度的全面提升。最后,DAMO-YOLO 提出了一套全尺度蒸馏方案,进一步实现全尺度模型的无痛涨点。具体细节可以参考我们的开源代码和技术报告。另外,为了方便用户使用 DAMO-YOLO 解决自己的问题,还开源了多个工业应用模型。

相关链接:

1)SOTA!模型平台项目主页链接:

https://sota.jiqizhixin.com/project/damo-yolo

2)论文链接:

https://arxiv.org/pdf/2211.15444v2.pdf

3)代码仓库:

https://github.com/tinyvision/damo-yolo

相关文章
|
机器学习/深度学习 编解码 算法
超详细!手把手带你轻松掌握 MMDetection 整体构建流程(一)
作为系列文章的第一篇解读,本文主要是从整体框架构建角度来解析,不会涉及到具体算法和代码,希望通过本文讲解: - MMDetection 整体构建流程和思想 - 目标检测算法核心组件划分 - 目标检测核心组件功能
1181 0
超详细!手把手带你轻松掌握 MMDetection 整体构建流程(一)
|
算法 Go 文件存储
DAMO-YOLO: 兼顾速度与精度的新目标检测框架
我们团队最近开源了DAMO-YOLO!其效果达到了YOLO系列的SOTA,欢迎各位试用!​简介DAMO-YOLO是一个兼顾速度与精度的目标检测框架,其效果超越了目前的一众YOLO系列方法,在实现SOTA的同时,保持了很高的推理速度。DAMO-YOLO是在YOLO框架基础上引入了一系列新技术,对整个检测框架进行了大幅的修改。具体包括:基于NAS搜索的新检测backbone结构,更深的neck结构,精
1426 0
DAMO-YOLO: 兼顾速度与精度的新目标检测框架
|
4月前
|
Ubuntu Linux 网络安全
Ubuntu 16.04 LTS发布:新特性与全面支持
Canonical还发布了Ubuntu Server 16.04 LTS版本。该版本不仅包括LXD 2.0这一提供类似虚拟机体验的容器管理器,还集成了Docker 1.10、libvirt 1.3.1、QEMU 2.5、Open vSwitch 2.5.0以及Ceph Jewel 10.1.2 RC等众多组件。值得注意的是,Ubuntu Server 16.04 LTS还支持远程内核崩溃转储功能,通过SSH和NFS可轻松进行转储操作。此外,该版本还配备了最新的OpenStack发布Mitaka,由OpenStack Identity、OpenStack Imaging、OpenStack Bl
|
人工智能 数据可视化 计算机视觉
Ultralytics YOLO11来啦!更快!更强!
YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。
Ultralytics YOLO11来啦!更快!更强!
|
11月前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
609 7
MySQL事务日志-Undo Log工作原理分析
|
JavaScript 前端开发
typeScript基础(8)_ts类型断言
本文介绍了TypeScript中的类型断言,它用于在编译时告诉TypeScript某个对象具有特定的类型,即使它看起来不具备。类型断言可以用来访问一个类型上存在而另一个类型上不存在的属性或方法。需要注意的是,类型断言并不会在运行时改变JavaScript的行为,因此如果断言不当,运行时仍然可能出错。文章还提醒避免将类型断言为`any`类型或进行多重断言。
259 2
|
存储 负载均衡 Java
Jetty技术深度解析及其在Java中的实战应用
【9月更文挑战第3天】Jetty,作为一款开源的、轻量级、高性能的Java Web服务器和Servlet容器,自1995年问世以来,凭借其卓越的性能、灵活的配置和丰富的扩展功能,在Java Web应用开发中占据了举足轻重的地位。本文将详细介绍Jetty的背景、核心功能点以及在Java中的实战应用,帮助开发者更好地理解和利用Jetty构建高效、可靠的Web服务。
893 2
|
小程序 JavaScript 开发者
微信小程序构建npm
微信小程序构建npm
849 4
|
缓存 Ubuntu Linux
error while loading shared libraries: libxcb-icccm.so.4: cannot open shared object file: No such file or directory 问题如何处理
【5月更文挑战第16天】error while loading shared libraries: libxcb-icccm.so.4: cannot open shared object file: No such file or directory 问题如何处理
2628 0
|
编解码 计算机视觉
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA(2)
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA
488 0