一、本文介绍
本文记录的是利用ScConv优化YOLOv11的目标检测网络模型。深度神经网络中存在大量冗余,不仅在密集模型参数中,而且在特征图的空间和通道维度中。ScConv
模块通过联合减少卷积层中空间和通道的冗余,有效地限制了特征冗余,本文利用ScConv
模块改进YOLOv11
,提高了模型的性能和效率。
专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!
二、SCConv介绍
SCConv
:针对特征冗余的空间和通道重构卷积
SCConv(Spatial and Channel reconstruction Convolution)
模块是为了解决卷积神经网络中特征冗余导致的计算资源消耗大的问题而提出的,其设计的原理和优势如下:
2.1、原理
SCConv
由两个单元组成:空间重建单元(SRU)和通道重建单元(CRU)。- SRU:利用分离和重建操作来挖掘特征的空间冗余。具体来说,通过
Group Normalization(GN)层
的缩放因子评估不同特征图的信息含量,将特征图根据权重分为信息丰富的和信息较少的两部分,然后通过交叉重建操作将这两部分进行组合,以减少空间冗余并增强特征的表示。 - CRU:利用
Split - Transform - Fuse策略
来挖掘特征的通道冗余。首先将空间精炼后的特征图的通道进行分割和挤压,然后通过高效的卷积操作(如GWC和PWC)对分割后的特征图进行变换,以提取高级代表性信息并减少计算成本,最后使用简化的SKNet
方法自适应地融合输出特征,从而减少通道维度的冗余。
2.2、优势
- 减少冗余计算:通过挖掘空间和通道维度的冗余,
SCConv
能够减少模型的计算量和参数数量,从而降低计算成本。- 促进代表性特征学习:SRU和CRU的设计有助于增强特征的表示能力,生成更具代表性和表达性的特征。
- 通用性和灵活性:
SCConv
是一个即插即用的模块,可以直接替换各种卷积神经网络中的标准卷积,无需对模型架构进行额外的修改。 - 性能提升:实验结果表明,嵌入
SCConv
的模型在降低复杂度和计算成本的同时,能够实现更好的性能,在图像分类和目标检测等任务中超越了其他先进的方法。
三、实现代码及YOLOv11修改步骤
模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址: