YOLOv11改进策略【卷积层】| 利用MobileNetv4中的UIB、ExtraDW优化C3k2

2025-02-04 8

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： YOLOv11改进策略【卷积层】| 利用MobileNetv4中的UIB、ExtraDW优化C3k2

一、本文介绍

本文记录的是利用ExtraDW优化YOLOv11中的C3k2，详细说明了优化原因，注意事项等。ExtraDW是MobileNetv4模型中提出的新模块，允许以低成本增加网络深度和感受野，具有ConvNext和IB的组合优势。可以在提高模型精度的同时降低一定量的模型参数。

专栏目录：YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址：YOLOv11改进专栏——以发表论文的角度，快速准确的找到有效涨点的创新点！

二、UIB介绍

Universal Inverted Bottleneck（UIB）通用反向瓶颈结构。

基于MobileNetV4
- UIB建立在MobileNetV4之上，即采用深度可分离卷积和逐点扩展及投影的反向瓶颈结构。
- 在反向瓶颈块（IB）中引入两个==可选的==深度可分离卷积，一个在扩展层之前，另一个在扩展层和投影层之间。
UIB有四种可能的实例化形式：
- Inverted Bottleneck (IB)：对扩展后的特征激活进行空间混合，以增加成本为代价提供更大的模型容量。
- ConvNext：通过在扩展之前进行空间混合，使用更大的核尺寸实现更便宜的空间混合。
- ExtraDW：文中引入的新变体，允许以低成本增加网络深度和感受野，具有ConvNext和IB的组合优势。
- FFN：由两个1x1逐点卷积（PW）组成的栈，中间有激活和归一化层。

在这里插入图片描述

结构组成：

灵活性：
- 在每个网络阶段，可以灵活地进行空间和通道混合的权衡调整，根据需要扩大感受野，并最大化计算利用率，增强模型对输入特征的感知能力。
效率提升：
- 提供了一种廉价增加网络深度和感受野的方式。相比其他结构，它在增加网络深度和感受野的同时，不会带来过高的计算成本。
- 在论文中，与其他注意力机制结合时，能有效提高模型的运算强度，减少内存访问需求，从而提高模型效率。