非极大值抑制(non-maximum suppression)的理解

简介:

最近在学习RCNN时看到了非极大值抑制,一开始有点不明白,在网上学习了之后记录一下。
非极大值抑制就是一个寻找局部最大值的过程。
在进行目标检测时一般会采取窗口滑动的方式,在图像上生成很多的候选框,然后把这些候选框进行特征提取后送入分类器,一般会得出一个得分(score),比如人脸检测,会在很多框上都有得分,然后把这些得分全部排序。选取得分最高的那个框,接下来计算其他的框与当前框的重合程度(iou),如果重合程度大于一定阈值就删除,因为在同一个脸上可能会有好几个高得分的框,都是人脸但是不需要那么框我们只需要一个就够了。
那么肯定有人会好奇,如果图片中有好几个人脸,你这选取一个最大的,那第二个人脸怎么办呢
实际上这是一个迭代的过程,第一步的非极大值抑制就是选取了某一个最大的得分,然后删除了他周边的几个框,第二次迭代的时候在剩下的框里面选取一个最大的,然后再删除它周围iou区域大于一定阈值的,这样不停的迭代下去就会得到所有想要找到的目标物体的区域。
假设有ABCDEF这么多个得分框(已经按照得分从小到大排序)。
1、从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
2、假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。
3、从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。
4、一直重复这个过程,找到所有曾经被保留下来的矩形框。
第一步寻找得分框:

image


第一次迭代找到一个:

image


第二次迭代找到另外一个:
image

转自:https://blog.csdn.net/xiexu911/article/details/80609298

目录
相关文章
|
1月前
|
机器学习/深度学习 文字识别 算法
OCR -- 非极大值抑制(NMS)算法详解
OCR -- 非极大值抑制(NMS)算法详解
29 0
OCR -- 非极大值抑制(NMS)算法详解
|
1月前
小波阈值公式
小波阈值公式
12 1
|
4月前
|
数据可视化 数据挖掘
scRAN-seq|加权最近邻分析(1)
scRAN-seq|加权最近邻分析(1)
65 7
|
4月前
|
SQL 数据可视化 数据挖掘
scRAN-seq|加权最近邻分析(2)
scRAN-seq|加权最近邻分析(2)
38 1
|
算法 计算机视觉
非极大值抑制详细原理(NMS含代码及详细注释)
非极大值抑制(Non-Maximum Suppression,NMS)详细原理(含代码及详细注释)
1276 1
非极大值抑制详细原理(NMS含代码及详细注释)
|
4月前
Gamma校正
下面是自己所整理的一些gamma校正的东西如有侵权请联系删除。
42 0
|
算法 数据库 计算机视觉
舌象图片自适应调节——gamma校正算法(五)
舌象图片自适应调节——gamma校正算法(五)
235 0
|
计算机视觉
非极大值抑制(NMS)
目标检测任务中提高准确度的方法之一
|
数据采集 机器学习/深度学习 传感器
【信号去噪】基于小波软阈值+硬阈值+改进的阈值实现数字信号去噪(SNR、RMSE附Matlab代码
【信号去噪】基于小波软阈值+硬阈值+改进的阈值实现数字信号去噪(SNR、RMSE附Matlab代码