YOLOv11改进策略【卷积层】| RCS-OSA 通道混洗的重参数化卷积二次创新C3k2

2025-02-04 8

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： YOLOv11改进策略【卷积层】| RCS-OSA 通道混洗的重参数化卷积二次创新C3k2

一、本文介绍

本文记录的是利用RCS-OSA模块优化YOLOv11的目标检测网络模型。RCS-OSA的全称为Reparameterized Convolution based on channel Shuffle - One - Shot Aggregation，即基于通道混洗的重参数化卷积 - 一次性聚合。优势在于RCS模块的重复堆叠确保了特征的重用，并增强了相邻层特征之间不同通道的信息流，从而可以提取更丰富的特征信息，并降低了内存访问成本。本文将深入分析RCS-OSA模块的特点，结合YOLOv11，实现精准涨点。

专栏目录：YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址：YOLOv11改进专栏——以发表论文的角度，快速准确的找到有效涨点的创新点！

二、RCS-OSA介绍

RCS-YOLO: A Fast and High-Accuracy Object Detector for Brain Tumor Detection

为克服DenseNet中密集连接的低效问题，同时为了在YOLO架构中更好地进行特征提取和信息融合，提高计算效率和检测性能，设计了RCS-OSA模块。

2.1 原理

2.1.1 OSA模块

One-Shot Aggregation (OSA)模块通过用多感受野表示多样化特征，并在最后特征图中仅聚合一次所有特征来克服DenseNet的低效。

2.1.2 RCS模块

将RCS与OSA结合，RCS模块的重复堆叠确保了特征的重用，并增强了相邻层特征之间不同通道的信息流。

在这里插入图片描述

RCS的结构。(a)培训阶段的RepVGG。(b)模型推理（或部署）期间的RepConv。带有黑色外边框的矩形表示张量的特定模操作；渐变颜色的矩形表示张量的特定特征，矩形的宽度表示张量的通道。

2.2 结构

(1). 通道拆分与多分支构建

给定输入张量的特征维度为$C\times H\times W$，经过通道拆分操作（channel split operator）后，被分成两个维度相等（$C\times H\times W$）的不同通道方向的张量。
对于其中一个张量，使用恒等分支（identity branch）、$1\times1$卷积和$3\times3$卷积来构建训练时的RCS。

(2). 结构重参数化

在推理阶段，恒等分支、$1\times1$卷积和$3\times3$卷积通过结构重参数化被转换为$3\times3$的RepConv。这种多分支拓扑架构在训练时可以学习丰富的特征信息，而简化的单分支架构在推理时可以节省内存消耗，实现快速推理。

(3). 通道拼接与通道混洗

对其中一个张量进行多分支训练后，将其与另一个张量以通道方式拼接（concatenated in a channel - wise manner）。
同时应用通道混洗操作（channel shuffle operator）来增强两个张量之间的信息融合，使得能够以较低的计算复杂度实现输入的不同通道特征之间的深度测量。

在这里插入图片描述

2.3 优势

语义信息提取：在骨干网络和颈部网络的不同阶段使用不同数量的堆叠RCS实现语义信息提取。
降低内存成本：保持相同数量的输入通道和最少的输出通道，从而降低内存访问成本（MAC）。
提高计算效率：与Efficient Layer Aggregation Networks (ELAN)相比，FLOPs降低近50%，MAC也降低，实现了高精度快速推理。