一、本文介绍
本文记录的是利用GsConv
优化YOLOv11
的颈部网络。深度可分离卷积(DSC)
在轻量级模型中被广泛使用,但其在计算过程中会分离输入图像的通道信息,导致特征表示能力明显低于标准卷积(SC)
,而GsConv
采用混合策略,使DSC
的输出通过打乱特征更接近SC
,从而优化模型的性能。本文利用GsConv+Slim Neck
改进YOLOv11
的颈部网络,==使其在提升特征表示能力的同时降低计算成本和内存占用。==
专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!
二、GsConv介绍
Slim-neck by GSConv
: 实时检测器架构的轻量级设计
GsConv
是一种新的轻量级卷积技术,其设计原理、优势如下:
2.1、设计原理
- 为了减轻深度神经网络的高计算成本,许多轻量级模型使用
深度可分离卷积(DSC)
来减少参数和浮点运算(FLOPs),但深度可分离卷积
的缺点是在计算过程中分离了输入图像的通道信息,导致特征表示能力低于标准卷积(SC)
。 - 为了缓解
DSC
的固有缺陷,GsConv
采用了一种混合策略,通过对SC
和DSC
生成的特征进行打乱(shuffle),使DSC
的输出尽可能接近SC
。具体来说,GsConv
使用SC
(通道密集卷积)生成的特征渗透到DSC
生成的特征的每一部分,通过均匀混合来允许SC
的信息充分混合到深度可分离卷积
的输出中,从而尽可能地保留特征之间的隐藏连接。
Slim-neck
结构:
2.2、优势
- 精度提升:通过添加
DSC层
和打乱操作,增强了非线性表达能力,从而使轻量级卷积的表示能力尽可能接近SC
,在精度上有显著提升。 - 计算成本降低:
GSConv
在保持较低时间复杂度的情况下,能以更少的计算成本捕获更多的空间和通道特征。 - 适应性强:
GSConv
灵活且易于适应,可根据需要添加简单的辅助分支来完成特定设计,进一步扩展其应用范围。例如,可以添加坐标编码辅助分支来优化检测精度,或者在辅助分支上使用大核大小的DSC
来解决浅网络难以捕获足够感受野的问题。
论文:https://arxiv.org/pdf/2206.02424
源码:https://github.com/AlanLi1997/Slim-neck-by-GSConv
三、实现代码及YOLOv11修改步骤
模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址: