YOLOv11改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数

简介: YOLOv11改进策略【损失函数篇】| WIoU v3:针对低质量样本的边界框回归损失函数

一、背景

  • 现有问题:大多数现有工作假设训练数据中的样本都是高质量的,专注于增强边界框回归损失的拟合能力。然而,在低质量样本盲目增强边界框回归会损害定位性能
  • 解决思路:本文使用Wise-IoU,其动态非单调FM使用异常值程度而非IoU来评估锚框的质量,并提供一种有效的梯度增益分配策略。减少高质量锚框的竞争力,同时降低低质量样本产生的有害梯度,使WIoU能够专注于普通质量的锚框,从而提高检测器的整体性能。

专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

二、原理

Wise-IoU是一种基于IoU的损失函数,旨在解决目标检测中边界框回归损失函数在处理低质量训练数据时的问题

2.1 原理

  1. 动态非单调FM原理 — WIoU v3
    • 定义异常值程度$$\beta=\frac{L_{IoU}}{\overline{L_{IoU}}}$$其中$L{IoU}$是锚框目标框的IoU损失,$\overline{L{IoU}}$是$L_{IoU}$的指数移动平均值
    • 根据$\beta$构建非单调聚焦系数$$r=\frac{\beta}{\delta\alpha^{\beta-\delta}}$$(其中$\delta$使$r = 1$当$\beta=\delta$),并应用于WIoU v1得到WIoU v3,即$\mathcal{L}{WIoU v3}=r\mathcal{L}{WIoU v1}$。当锚框的异常值程度满足$\beta = C$($C$为常数)时,锚框将获得最高梯度增益。由于$\overline{L_{IoU}}$是动态的,锚框的质量划分标准也是动态的,使WIoU v3能够在每个时刻做出最符合当前情况的梯度增益分配策略。
  2. WIoU v1原理
    • 通过构造距离注意力机制,定义$$\mathcal{L}_{WIoU v1}=\mathcal{R}_{WIoU}\mathcal{L}_{IoU}$$其中$\mathcal{R}{WIoU}=exp(\frac{(x - x{gt})^2+(y - y{gt})^2}{(W{g}^2 + H{g}^2)^*})$($W{g}$,$H{g}$是最小包围框的大小,上标$$表示将其从计算图中分离以*防止产生阻碍收敛的梯度)。当锚框与目标框重合较好时,$\mathcal{R}{WIoU}\in[1,e)$会显著放大普通质量锚框的$L{IoU}$,而高质量锚框的$L{IoU}\in[0,1]$会显著降低$\mathcal{R}_{WIoU}$,使其聚焦于中心点之间的距离。
  3. WIoU v2原理
    • 学习Focal Loss的思想,为$\mathcal{L}{WIoU v1}$构造单调聚焦系数$\mathcal{L}{IoU}^{\gamma*}$,得到:$$\mathcal{L}_{WIoU v2}=\mathcal{L}_{IoU}^{\gamma*}\mathcal{L}_{WIoU v1}$$$$\gamma>0$$由于聚焦系数的加入,梯度也发生变化:$$\frac{\partial\mathcal{L}_{WIoU v2}}{\partial\mathcal{L}_{IoU}}=\mathcal{L}_{IoU}^{\gamma*}\frac{\partial\mathcal{L}_{WIoU v1}}{\partial\mathcal{L}_{IoU}}$$为解决训练后期收敛速度慢的问题,引入$L{IoU}$的均值作为归一化因子,即:$$\mathcal{L}_{WIoU v2}=(\frac{\mathcal{L}_{IoU}^*}{\overline{\mathcal{L}}_{IoU}})^{\gamma}\mathcal{L}_{WIoU v1}$$其中$\overline{L{IoU}}$是带有动量$m$的指数移动平均。动态更新归一化因子使梯度增益$r = (\frac{L{IoU}}{\overline{L{IoU}}})^{\gamma}$总体保持在较高水平。

2.2 优势

  1. 整体性能提升:动态非单调FM使模型具有更好的泛化性能。WIoU v1通过注意力机制对惩罚项的调整,与动态非单调FM相互作用,使模型性能显著提高。
  2. 有效处理低质量样本动态非单调FM能够减少高质量锚框的竞争力,降低低质量样本产生的有害梯度,从而屏蔽低质量样本的影响。
  3. 更好的梯度分配策略:通过动态调整锚框的质量划分标准,WIoU v3能够在训练过程中做出最符合当前情况的梯度增益分配策略,使模型在训练过程中精度提升更快。

论文链接:https://arxiv.org/pdf/2301.10051
源码链接:https://github.com/Instinct323/wiou


三、实现代码及YOLOv11修改步骤

模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址:

https://blog.csdn.net/qq_42591591/article/details/144401478

目录
相关文章
|
12小时前
|
计算机视觉
YOLOv11改进策略【损失函数篇】| 利用MPDIoU,加强边界框回归的准确性
YOLOv11改进策略【损失函数篇】| 利用MPDIoU,加强边界框回归的准确性
5 0
YOLOv11改进策略【损失函数篇】| 利用MPDIoU,加强边界框回归的准确性
|
12小时前
|
人工智能
YOLOv11改进策略【损失函数篇】| 2024 引进Focaler-IoU损失函数 加强边界框回归 (Focaler-DIoU、Focaler-GIoU、Focaler-CIoU)
YOLOv11改进策略【损失函数篇】| 2024 引进Focaler-IoU损失函数 加强边界框回归 (Focaler-DIoU、Focaler-GIoU、Focaler-CIoU)
12 4
|
12小时前
|
计算机视觉
YOLOv11改进策略【损失函数篇】| Shape-IoU:考虑边界框形状和尺度的更精确度量
YOLOv11改进策略【损失函数篇】| Shape-IoU:考虑边界框形状和尺度的更精确度量
11 4
|
12小时前
YOLOv11改进策略【损失函数篇】| 通过辅助边界框计算IoU提升检测效果(Inner_GIoU、Inner_DIoU、Inner_CIoU、Inner_EIoU、Inner_SIoU)
YOLOv11改进策略【损失函数篇】| 通过辅助边界框计算IoU提升检测效果(Inner_GIoU、Inner_DIoU、Inner_CIoU、Inner_EIoU、Inner_SIoU)
13 4
YOLOv11改进策略【损失函数篇】| 通过辅助边界框计算IoU提升检测效果(Inner_GIoU、Inner_DIoU、Inner_CIoU、Inner_EIoU、Inner_SIoU)
|
9月前
|
机器学习/深度学习
YOLOv8改进 | 损失函数篇 | 更加聚焦的边界框损失Focaler-IoU、InnerFocalerIoU(二次创新)
YOLOv8改进 | 损失函数篇 | 更加聚焦的边界框损失Focaler-IoU、InnerFocalerIoU(二次创新)
1039 0
|
9月前
|
机器学习/深度学习
YOLOv5改进 | 损失函数篇 | 更加聚焦的边界框损失Focaler-IoU | 二次创新Inner-FocalerIoU
YOLOv5改进 | 损失函数篇 | 更加聚焦的边界框损失Focaler-IoU | 二次创新Inner-FocalerIoU
677 2
|
算法 Python 机器学习/深度学习
常见回归和分类损失函数比较
代码 损失函数的一般表示为\(L(y,f(x))\),用以衡量真实值\(y\)和预测值\(f(x)\)之间不一致的程度,一般越小越好。为了便于不同损失函数的比较,常将其表示为单变量的函数,在回归问题中这个变量为\(y-f(x)\),在分类问题中则为\(yf(x)\)。
1382 0
|
11小时前
|
人工智能 计算机视觉
YOLOv11改进策略【损失函数篇】| NWD损失函数,提高小目标检测精度
YOLOv11改进策略【损失函数篇】| NWD损失函数,提高小目标检测精度
15 6
|
8月前
|
机器学习/深度学习 算法 计算机视觉
【YOLOv8改进-损失函数】SlideLoss损失函数,解决样本不平衡问题
YOLO-FaceV2是基于YOLOv5的实时人脸检测模型,采用RFE模块增强小人脸检测,NWD损失处理定位偏差,SEAM注意力模块应对遮挡,Slide Loss解决样本不平衡,提升对难样本的关注。在WiderFace数据集上超越YOLO系列。论文和代码已公开。Slide Loss通过IoU加权,优化边界样本,提高模型性能。
|
机器学习/深度学习 数据可视化 计算机视觉
图像分类_03分类器及损失:线性分类+ SVM损失+Softmax 分类+交叉熵损失
解释:w的每⼀⾏都是其中⼀个类的分类器。这些数字的⼏何解释是,当我们改变w的⼀行时,像素空间中相应的线将以不同的⽅向旋转。⽽其中的偏置是为了让我们避免所有的分类器都过原点。
181 0