RT-DETR改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络

简介: RT-DETR改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络

一、本文介绍

本文记录的是基于ShufflenetV2的RT-DETR目标检测轻量化改进方法研究FLOPs是评价模型复杂独的重要指标,但其无法考虑到模型的内存访问成本和并行度,因此本文在RT-DETR的基础上引入ShufflenetV2,==使其在在保持准确性的同时提高模型的运行效率==。

模型 参数量 计算量 推理速度
rtdetr-l 32.8M 108.0GFLOPs 11.6ms
Improved 19.2M 62.9GFLOPs 10.5ms

专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:RT-DETR改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、ShuffleNet V2设计原理

ShuffleNet V2是一种高效的卷积神经网络架构,其模型结构及优势如下:

2.1 模型结构

  • 回顾ShuffleNet v1ShuffleNet是一种广泛应用于低端设备的先进网络架构,为增加在给定计算预算下的特征通道数量,采用了点组卷积和瓶颈结构,但这增加了内存访问成本(MAC),且过多的组卷积和元素级“Add”操作也存在问题。
    • 引入Channel Split和ShuffleNet V2:为解决上述问题,引入了名为Channel Split的简单操作。在每个单元开始时,将$c$个特征通道的输入分为两个分支,分别具有$c - c'$和$c'$个通道。一个分支保持不变,另一个分支由三个具有相同输入和输出通道的卷积组成,以满足G1(平衡卷积,即相等的通道宽度可最小化MAC)。两个$1 \times 1$卷积不再是组式的,这部分是为了遵循G2(避免过多的组卷积增加MAC),部分是因为拆分操作已经产生了两个组。卷积后,两个分支连接,通道数量保持不变,并使用与ShuffleNet v1相同的“通道洗牌”操作来实现信息通信。对于空间下采样,单元进行了略微修改,删除了通道拆分操作,使输出通道数量加倍。
    • 整体网络结构:通过反复堆叠构建块来构建整个网络,设置$c' = c/2$,整体网络结构与ShuffleNet v1相似,并在全局平均池化之前添加了一个额外的$1 \times 1$卷积层来混合特征。

      2.2 优势

  • 高效且准确:遵循了高效网络设计的所有准则,每个构建块的高效率使其能够使用更多的特征通道和更大的网络容量,并且在每个块中,一半的特征通道直接通过块并加入下一个块,实现了一种特征重用模式,类似于DenseNet,但更高效。
    • 速度优势明显:在与其他网络架构的比较中,ShuffleNet v2在速度方面表现出色,特别是在GPU上明显快于其他网络(如MobileNet v2、ShuffleNet v1和Xception)。在ARM上,ShuffleNet v1、Xception和ShuffleNet v2的速度相当,但MobileNet v2较慢,这是因为MobileNet v2的MAC较高。
    • 兼容性好:可以与其他技术(如Squeeze - and - excitation模块)结合进一步提高性能。

论文:https://arxiv.org/pdf/1807.11164.pdf
源码:https://gitcode.com/gh_mirrors/sh/ShuffleNet-Series/blob/master/ShuffleNetV2/blocks.py?utm_source=csdn_github_accelerator&isLogin=1

三、实现代码及RT-DETR修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/144212651

目录
相关文章
|
20小时前
|
机器学习/深度学习 计算机视觉 网络架构
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 StarNet,超级精简高效的轻量化模块
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 StarNet,超级精简高效的轻量化模块
74 63
RT-DETR改进策略【模型轻量化】| 替换骨干网络 CVPR-2024 StarNet,超级精简高效的轻量化模块
|
17天前
|
NoSQL JavaScript 前端开发
Java访问MongoDB
Java访问MongoDB
39 21
|
4天前
|
缓存 负载均衡 Java
2025春招 SpringCloud 面试题汇总
大家好,我是V哥。SpringCloud是面试中的重点,涵盖基础概念、组件细节、高级特性及性能优化等内容。为帮助大家更好地准备2025年的Spring Cloud面试,我整理了一系列常见面试题及答案,涉及服务注册与发现(Eureka)、配置管理(Spring Cloud Config)、负载均衡(Ribbon)、断路器(Hystrix)、微服务网关(Spring Cloud Gateway)等关键知识点。此外,还包括分布式事务管理、链路追踪(Sleuth+Zipkin)、安全性(OAuth2)以及性能优化和实践经验。希望这些内容能助你一臂之力,顺利通过面试。欢迎关注威哥爱编程,全栈之路就你行。
120 24
|
15天前
|
数据挖掘 Unix 数据处理
Pandas高级数据处理:管道操作
Pandas 是 Python 中流行的数据分析库,提供丰富的结构化数据处理功能。`pipe` 方法(管道操作)简化了数据处理步骤的串联,避免嵌套调用带来的代码混乱。通过定义函数并使用 `pipe` 串联,如筛选特定类别产品和计算销售额平均值,使代码更清晰易读。常见问题包括函数参数传递不正确、返回值类型不匹配及复杂逻辑难以维护。合理设计与编程习惯能充分发挥管道操作的优势,提高代码可读性和可维护性。
41 16
|
10天前
|
Web App开发 网络协议 Linux
A Brief Introduction to DNS
This article is also posted on my blog, feel free refer to it for the latest revisions: [A Brief Introduction to DNS](https://blog.timerring.com/posts/a-brief-introduction-to-dns/)
194 83
A Brief Introduction to DNS
|
6天前
|
物联网 数据处理 C#
C#实现上位机开发,串口通信,读写串口数据并处理16进制数据
C#实现上位机开发,串口通信,读写串口数据并处理16进制数据。在自动化、物联网以及工业控制行业中,上位机开发是一项重要的技能。本教程主要介绍使用C#进行上位机开发,重点在于串口通信和数据处理。
146 82
|
10天前
|
缓存 Java 数据库
SpringBoot缓存注解使用
Spring Boot 提供了一套方便的缓存注解,用于简化缓存管理。通过 `@Cacheable`、`@CachePut`、`@CacheEvict` 和 `@Caching` 等注解,开发者可以轻松地实现方法级别的缓存操作,从而提升应用的性能和响应速度。合理使用这些注解可以大大减少数据库的访问频率,优化系统性能。
154 89
|
14天前
|
人工智能 安全 API
为何最近谈论 SSE 和 WebSocket 的人越来越多了?
因为实时通信已经成了大模型应用的标配。
为何最近谈论 SSE 和 WebSocket 的人越来越多了?
|
6天前
|
消息中间件 存储 NoSQL
java连接redis和基础操作命令
通过以上内容,您可以掌握在Java中连接Redis以及进行基础操作的基本方法,进而在实际项目中灵活应用。
69 30
|
10天前
|
JavaScript 开发者
ES6的export命令
在 ES6(ECMAScript 2015)中,模块化是一个非常重要的概念。它允许开发者将代码拆分成更小、更可管理的片段,并且可以轻松地在这些片段之间共享功能。`export` 命令是 ES6 模块系统的一个关键部分,用于将模块中的变量、函数、类等导出,以便在其他模块中使用。以下是对 ES6 中 `export` 命令的详细解析。
65 33

热门文章

最新文章