YOLOv11改进策略【Backbone/主干网络】| ICLR-2023 替换骨干网络为:RevCol 一种新型神经网络设计范式

简介: YOLOv11改进策略【Backbone/主干网络】| ICLR-2023 替换骨干网络为:RevCol 一种新型神经网络设计范式

一、本文介绍

本文记录的是基于RevCol的YOLOv11目标检测改进方法研究RevCol是一种新型神经网络设计范式,它由多个子网(列)及多级可逆连接构成,正向传播时特征逐渐解缠结且保持信息。可逆变换借鉴可逆神经网络思想,设计多级可逆单元用于解决模型对特征图形状的限制以及与信息瓶颈原则的冲突。本文将其应用到v11中,并配置了原论文中的revcol_tinyrevcol_smallrevcol_baserevcol_largerevcol_xlarge五种不同大小的模型,以适应不同的需求。


专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、RevCol模型设计

2.1 出发点

  • 信息瓶颈原则的局限:传统监督学习网络遵循信息瓶颈原则(IB),如图所示,靠近输入的层包含更多低级信息靠近输出的层富含语义信息,即与目标无关的信息在逐层传播中逐渐被压缩。但这种方式可能导致下游任务性能不佳,尤其当学习到的特征过度压缩或语义信息与目标任务无关,且源任务和目标任务存在领域差距时。

在这里插入图片描述

  • 解缠结特征学习的需求:提出构建网络学习解缠结表示,不同于IB学习,解缠结特征学习旨在将任务相关概念或语义分别嵌入到几个解耦维度,同时保持整个特征向量大致与输入有相同信息量,类似于生物细胞机制。

在计算机视觉任务中,学习解缠结特征是合理的,例如在ImageNet预训练时,高级语义表示被调整,同时低级信息(如边缘位置)也应在其他特征维度中保留,以满足下游任务(如对象检测)的需求。

2.2 原理

2.2.1 可逆变换的核心作用

  • 基于可逆神经网络:可逆变换在特征解缠结中起关键作用,灵感源于可逆神经网络。以RevNet为例,如图(a)所示,它将输入分区,通过可逆映射进行计算,但存在对特征维度约束过强及网络不完全可逆的问题。

在这里插入图片描述

  • 提出广义可逆公式:将RevNet的公式推广为更通用的形式,如图(b)所示,通过增加递归阶数m,放松了对特征图尺寸的约束,使其能更好地与现有网络架构合作,且网络仍保持可逆性
  • 多级可逆单元:将公式重构成多列形式,如图(c)所示,每列由一组m个特征图及其母网络组成,称为多级可逆单元,作为RevCol的基本组件。

    2.2.2 中间监督机制

  • 解决信息丢失问题:尽管多级可逆单元能在列迭代中保持信息,但下采样块仍可能在列内丢弃信息。为缓解此问题,提出中间监督方法
  • 监督方式:在前面列的最后一级特征(Level 4)添加两个辅助头,一个是解码器用于重建输入图像,另一个是线性分类器。通过最小化二进制交叉熵(BCE)重建损失和以交叉熵(CE)损失训练线性分类器,对不同列设置不同权重的复合损失,以最大化特征与预测之间的互信息下限。

2.3 结构

2.3.1 宏观设计

  • 多子网与可逆连接:如图所示,RevCol网络由N个结构相同(权重不一定相同)的子网(列)组成,每个子网接收输入副本并生成预测。列之间采用可逆变换传播多级特征(从低级到高级语义表示),最后一列预测输入的最终解缠结表示。

在这里插入图片描述

  • 特征提取与传播:输入图像先由补丁嵌入模块分割成非重叠补丁,再输入各子网。从每个列提取四级特征图用于列间信息传播。对于分类任务,使用最后一列的Level 4特征图;对于下游任务,使用最后一列的所有四级特征图。列间可逆连接采用简化的多级可逆单元实现,即取当前列一个低级特征和前一列一个高级特征作为输入,保持可逆性同时减少GPU资源消耗。

    2.3.2 微观设计

  • 基于ConvNeXt的修改:默认采用ConvNeXt块实现各列,并进行修改以适配宏观架构。
    • 融合模块:在原始ConvNeXt的各级中,修改补丁合并块,将LayerNorm放在补丁合并卷积之后,通道数在补丁合并卷积中翻倍,并引入上采样块。上采样块由线性通道映射层、LayerNorm和特征图插值层组成,线性通道映射层通道数减半,两个块的输出相加后传入后续的残差块。
    • 卷积核大小:将原始ConvNeXt中的7×7卷积默认修改为3×3,以加快训练速度,虽增大卷积核可提高精度,但RevCol的多列设计已扩大有效感受野,限制了大卷积核带来的精度提升。
    • 可逆操作γ:采用可学习的可逆通道缩放作为可逆操作γ,每次特征求和时,为抑制特征幅度使训练稳定,同时在训练时截断γ的绝对值,避免反向计算时数值误差过大

2.4 优势

  • 特征解缠结优势:在RevCol中,各列最低级保持低级特征,最后一列最高级具有高度语义,信息在列间无损传播时逐渐解缠结,一些特征图语义性增强,一些保持低级。这使模型对依赖高低级特征的下游任务更灵活,可逆连接对解缠结机制起关键作用,对比无可逆连接的HRNet等模型,在实验中有性能优势。
  • 内存节省优势:传统网络训练需大量内存存储前向传播的激活以用于梯度计算,而RevCol由于列间连接可逆,在反向传播时可从最后一列到第一列重建激活,训练时只需在内存中维护一列的激活。实验表明,随着列数增加,RevCol大致保持O(1)的额外内存消耗,而非可逆架构的内存消耗随列数线性增加。
  • 新的缩放因子优势RevCol架构中,列数成为除深度(块数)和宽度(每个块的通道数)之外的新维度。在一定范围内,增加列数与同时增加宽度和深度有相似效果,有利于模型扩展到大模型和大数据集上。

论文:https://arxiv.org/pdf/2212.11696.pdf
源码:https://github.com/megvii-research/RevCol

三、实现代码及YOLOv11修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/143429022

目录
相关文章
|
3天前
|
机器学习/深度学习 编解码 自动驾驶
YOLOv11改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
YOLOv11改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
32 16
YOLOv11改进策略【模型轻量化】| 替换骨干网络为MoblieNetV1,用于移动视觉应用的高效卷积神经网络
|
3天前
|
机器学习/深度学习 存储
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
29 15
YOLOv11改进策略【模型轻量化】| PP-LCNet:轻量级的CPU卷积神经网络
|
3月前
|
机器学习/深度学习 计算机视觉 Python
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力本文提出了一种简单且高效的卷积神经网络(ConvNets)注意力模块——SimAM。与现有模块不同,SimAM通过优化能量函数推断特征图的3D注意力权重,无需添加额外参数。SimAM基于空间抑制理论设计,通过简单的解决方案实现高效计算,提升卷积神经网络的表征能力。代码已在Pytorch-SimAM开源。
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
|
4月前
|
机器学习/深度学习 数据可视化
KAN干翻MLP,开创神经网络新范式!一个数十年前数学定理,竟被MIT华人学者复活了
【10月更文挑战第12天】MIT华人学者提出了一种基于Kolmogorov-Arnold表示定理的新型神经网络——KAN。与传统MLP不同,KAN将可学习的激活函数放在权重上,使其在表达能力、准确性、可解释性和收敛速度方面表现出显著优势,尤其在处理高维数据时效果更佳。然而,KAN的复杂性也可能带来部署和维护的挑战。论文地址:https://arxiv.org/pdf/2404.19756
81 1
|
2月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
80 17
|
2月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。
|
2月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
61 10
|
2月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
在数字化时代,网络安全和信息安全已成为我们生活中不可或缺的一部分。本文将介绍网络安全漏洞、加密技术和安全意识等方面的内容,并提供一些实用的代码示例。通过阅读本文,您将了解到如何保护自己的网络安全,以及如何提高自己的信息安全意识。
70 10
|
2月前
|
存储 监控 安全
云计算与网络安全:云服务、网络安全、信息安全等技术领域的融合与挑战
本文将探讨云计算与网络安全之间的关系,以及它们在云服务、网络安全和信息安全等技术领域中的融合与挑战。我们将分析云计算的优势和风险,以及如何通过网络安全措施来保护数据和应用程序。我们还将讨论如何确保云服务的可用性和可靠性,以及如何处理网络攻击和数据泄露等问题。最后,我们将提供一些关于如何在云计算环境中实现网络安全的建议和最佳实践。
|
2月前
|
监控 安全 网络安全
网络安全与信息安全:漏洞、加密与意识的交织
在数字时代的浪潮中,网络安全与信息安全成为维护数据完整性、保密性和可用性的关键。本文深入探讨了网络安全中的漏洞概念、加密技术的应用以及提升安全意识的重要性。通过实际案例分析,揭示了网络攻击的常见模式和防御策略,强调了教育和技术并重的安全理念。旨在为读者提供一套全面的网络安全知识框架,从而在日益复杂的网络环境中保护个人和组织的资产安全。

热门文章

最新文章