一、本文介绍
本文记录的是改进YOLOv11的损失函数,将其替换成Shape-IoU
。现有边界框回归方法通常考虑真实GT(Ground Truth)框与预测框之间的几何关系,通过边界框的相对位置和形状计算损失,但忽略了边界框本身的形状和尺度等固有属性对边界框回归的影响。为了弥补现有研究的不足,Shape-IoU
提出了一种关注边界框本身形状和尺度的边界框回归方法。
专栏目录:YOLOv11改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
专栏地址:YOLOv11改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!
二、Shape-IoU设计原理
Shape-IoU
:考虑边界框形状和尺度的更精确度量
以下是关于Shape-IoU
的详细介绍:
2.1 原理
- 分析边界框回归特性:通过对边界框回归样本的分析,得出以下结论:
- 当回归样本的偏差和形状偏差相同且不全为0时,假设
GT
框不是正方形且有长短边,边界框形状和尺度的差异会导致其IoU值的差异。 - 对于相同尺度的边界框回归样本,当回归样本的偏差和形状偏差相同且不全为0时,边界框的形状会对回归样本的IoU值产生影响。沿着边界框短边方向的偏差和形状偏差对应的IoU值变化更为显著。
- 对于具有相同形状边界框的回归样本,当回归样本偏差和形状偏差相同且不全为0时,与较大尺度的回归样本相比,较小尺度边界框回归样本的
IoU
值受GT
框形状的影响更为显著。
- 当回归样本的偏差和形状偏差相同且不全为0时,假设
- Shape - IoU公式:
- $IoU = \frac{|B \cap B^{gt}|}{|B \cup B^{gt}|}$
- $ww = \frac{2 \times (w^{gt})^{scale}}{(w^{gt})^{scale} + (h^{gt})^{scale}}$
- $hh = \frac{2 \times (h^{gt})^{scale}}{(w^{gt})^{scale} + (h^{gt})^{scale}}$
- $distance^{shape} = hh \times (\frac{x_c - x_c^{gt}}{c})^{2} + ww \times (\frac{y_c - y_c^{gt}}{c})^{2}$
- $\Omega^{shape} = \sum_{t = w, h}(1 - e^{-\omegat})^{\theta}, \theta = 4$,其中$\left{\begin{array}{l} \omega{w} = hh \times \frac{|w - w^{gt}|}{max(w, w^{gt})} \ \omega_{h} = ww \times \frac{|h - h^{gt}|}{max(h, h^{gt})} \end{array}\right.$
- 对应的边界框回归损失:$L_{Shape - IoU} = 1 - IoU + distance^{shape} + 0.5 \times \Omega^{shape}$
2.2 优势
- 提高检测性能:论文中通过一系列对比实验,证明了
Shape-IoU
方法在不同检测任务中能够有效提高检测性能,优于现有方法,在不同检测任务中达到了最先进的性能。 - 关注边界框自身属性:考虑了边界框本身的形状和尺度对边界框回归的影响,弥补了现有研究忽略这一因素的不足。
- 在小目标检测任务中的应用:针对小目标检测任务,提出了
Shape-Dot Distance
和Shape-NWD
,将Shape-IoU
的思想融入其中,提高了在小目标检测方面的性能。
论文:https://arxiv.org/pdf/2312.17663
源码:https://github.com/malagoutou/Shape-IoU
三、实现代码及YOLOv11修改步骤
模块完整介绍、个人总结、实现代码、模块改进、二次创新以及各模型添加步骤参考如下地址: