目标检测网络R-CNN 系列

简介: 图像实例分割完成的是像素级的实例目标分割任务,是人工智能与计算机视觉领域的重要发展方向,其被广泛应用到各个领域,如工业生产、监控安防和医疗卫生等。目前的图像实例分割模型主要存在两个问题,第一,传统的图像实例分割模型由于图像中实例对象尺寸差异跨度较大,导致目标检测阶段出现误检、漏检等问题,从而使生成的掩码精度较低。第二,传统的实例分割模型在掩码生成阶段,主要是通过汇聚到全连接层的特征信息对像素点进行分类和归属判定。池化操作会导致特征图尺寸下降,在语义分割阶段,使传递给全连接层的特征信息有所丢失,进而导致像素点的类别归属出现偏差,生成的掩码质量低,实例边缘的细节信息不够精细化。

 R-CNN 系列目标检测网络,是深度学习在目标检测领域的首个系列网络,作为典型的 Two-Stage 目标检测网络。该系列包括 R-CNN、Fast R-CNN、Faster R-CNN,就像它们的名字一样,一代比一代速度快,主要是因为 Two-Stage 网络的特点就是精度高,速度慢。到 Faster R-CNN 网络时,就已经做到了端到端的全卷积目标检测网络。其作者 Ross Girshick 成为了 Facebook 的人工智能实验室(FAIR)的一员,即 Detectron2 平台的团队,还在不断为 R-CNN 系列算法的优化而努力。

(1)R-CNN

     R-CNN 目标检测网络,字母 R 代表 Region,即区域的意思,中文全称为区域卷积神经网络,是 2014 年出现的,是第一个出现在目标检测领域的深度学习算法,也是它掀起了深度学习在目标检测领域的新篇章,包括后面的 YOLO 等系列也是在此基础上出现的。R-CNN 的网络的结构逻辑如下图所示。

`X03MOX`NH[2~]8]OGCMYUA.png

R-CNN 网络处理数据的流程如下:

1)输入图像。

2)使用 selective search 的方法生成多个候选框。

3)将每个候选框输入到卷积层进行特征提取,卷积层网络常用 AlextNet、VGG。

4)再将第三步提取的特征输入到一个又一个类别的 SVM 分类器中进行判断,预测类别信息。

5)最后将经过分类的候选框做回归和修正,预测位置信息。

R-CNN 将深度学习带入检测领域后,PASCAL VOC 上的检测率大幅度提升,从35.1%提升到 53.7%。具备以下优点:

1)采用 CNN 的方式来提取特征,为视觉工作提供思路,只能靠人来考虑提取哪些特征的时代一去不复返了。

2)引入迁移学习的概念,即在大样本上的预训练模型,然后小样本时 fine-tune。

(2)Fast R-CNN

    继 R-CNN 推出之后,作者于 2015 年推出了 Fast R-CNN,优化了原本网络结构,提升了检测速度,降低了网络训练对空间的要求。其网络结构逻辑如下图所示。

5C(GIS6X4R$P7$)T2T@LEB5.png

Fast R-CNN 处理数据的流程如下:

1)输入图像。

2)使用 selective search 的方法生成多个候选框。

3)将整张图片输入到卷积层进行特征提取。

4)在卷积后的特征图上找到对应卷积前的候选框区域。

5)将对应的候选框区域经过 ROI Pooling 转换成固定大小的特征图。

6)将特征图输入到全连接层生成特征向量,用于分类和回归,分别得到分类信息和位置信息。

    Fast R-CNN 模型相较于 R-CNN 提升很大,训练时间缩短到原来的九分之一,测试时间缩短到原来的百分之一,测试精度还稍有提升,让人看到了 R-CNN 系列网络实现实时检测的可能。具备以下优点:

1)分类用 Soft max 代替了 SVM,并且采用分类和回归一起进行的方式,降低了训练及测试时长。

2)优化了网络结构,首先采用将整张图先输入到卷积神经网络再提取特征的方式,然后添加 RoI pooling 层使得最终的特征图尺寸一致,这样使得整个过程只需要一个全连接层,而且分类和回归也通过深度网络的方式实现,节约了内存需要。

(3)Faster R-CNN

     2015 年,何凯明团队再次提出新算法 Faster R-CNN,将候选框的生成也通过神经网络的方法实现,是第一个实现了端到端的目标检测网络,大大提高了检测速度,在当年的各大视觉竞赛中夺魁。其网络结构逻辑如下图所示。

NUDQ5Q)_HR4WI97Q_)}{ZNK.png

Faster R-CNN 处理数据的流程如下:

1)输入图像。

2)将整张图片输入到卷积层进行特征提取。

3)RPN 生成候选框。

4)在卷积后的特征图上找到对应卷积前的候选框区域。

5)将对应的候选框区域经过 ROI Pooling 转换成固定大小的特征图。

6)将特征图输入到全连接层生成特征向量,用于分类和回归,分别得到分类信息和位置信息。

    Faster R-CNN 目标检测网络无论在速度还是精度上,都得到大幅度提升,于当年的多个赛事中摘得桂冠。具备以下优点:

1)提出 Region Proposal Network(RPN)方法,用卷积神经网络的方式实现了候选框的生成,使网络实现端到端。

2)产生建议窗口的 CNN 和目标检测的 CNN 共享。

相关文章
|
21天前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【Neck】| ASF-YOLO 注意力尺度序列融合模块改进颈部网络,提高小目标检测精度
RT-DETR改进策略【Neck】| ASF-YOLO 注意力尺度序列融合模块改进颈部网络,提高小目标检测精度
55 3
RT-DETR改进策略【Neck】| ASF-YOLO 注意力尺度序列融合模块改进颈部网络,提高小目标检测精度
|
12天前
|
机器学习/深度学习 数据采集 算法
基于WOA鲸鱼优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB 2022a实现时间序列预测,采用CNN-GRU-SAM网络结构,结合鲸鱼优化算法(WOA)优化网络参数。核心代码含操作视频,运行效果无水印。算法通过卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征,全连接层整合输出。数据预处理后,使用WOA迭代优化,最终输出最优预测结果。
|
23天前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【Neck】| ASF-YOLO 注意力尺度序列融合模块改进颈部网络,提高小目标检测精度
YOLOv11改进策略【Neck】| ASF-YOLO 注意力尺度序列融合模块改进颈部网络,提高小目标检测精度
63 9
YOLOv11改进策略【Neck】| ASF-YOLO 注意力尺度序列融合模块改进颈部网络,提高小目标检测精度
|
4天前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-LSTM-SAM网络时间序列回归预测算法matlab仿真
本项目使用MATLAB 2022a实现时间序列预测算法,完整程序无水印。核心代码包含详细中文注释和操作视频。算法基于CNN-LSTM-SAM网络,融合卷积层、LSTM层与自注意力机制,适用于金融市场、气象预报等领域。通过数据归一化、种群初始化、适应度计算及参数优化等步骤,有效处理非线性时间序列,输出精准预测结果。
|
17天前
|
机器学习/深度学习 数据采集 算法
基于GWO灰狼优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB2022a,展示了时间序列预测算法的运行效果(无水印)。核心程序包含详细中文注释和操作视频。算法采用CNN-GRU-SAM网络,结合灰狼优化(GWO),通过卷积层提取局部特征、GRU处理长期依赖、自注意力机制捕捉全局特征,最终实现复杂非线性时间序列的高效预测。
|
2月前
|
机器学习/深度学习 数据采集 算法
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目基于MATLAB2022a实现时间序列预测,采用CNN-GRU-SAM网络结构。卷积层提取局部特征,GRU层处理长期依赖,自注意力机制捕捉全局特征。完整代码含中文注释和操作视频,运行效果无水印展示。算法通过数据归一化、种群初始化、适应度计算、个体更新等步骤优化网络参数,最终输出预测结果。适用于金融市场、气象预报等领域。
基于GA遗传优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
|
2月前
|
机器学习/深度学习 算法 计算机视觉
基于CNN卷积神经网络的金融数据预测matlab仿真,对比BP,RBF,LSTM
本项目基于MATLAB2022A,利用CNN卷积神经网络对金融数据进行预测,并与BP、RBF和LSTM网络对比。核心程序通过处理历史价格数据,训练并测试各模型,展示预测结果及误差分析。CNN通过卷积层捕捉局部特征,BP网络学习非线性映射,RBF网络进行局部逼近,LSTM解决长序列预测中的梯度问题。实验结果表明各模型在金融数据预测中的表现差异。
162 10
|
3月前
|
机器学习/深度学习 数据采集 算法
基于PSO粒子群优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真
本项目展示了基于PSO优化的CNN-GRU-SAM网络在时间序列预测中的应用。算法通过卷积层、GRU层、自注意力机制层提取特征,结合粒子群优化提升预测准确性。完整程序运行效果无水印,提供Matlab2022a版本代码,含详细中文注释和操作视频。适用于金融市场、气象预报等领域,有效处理非线性数据,提高预测稳定性和效率。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解深度学习中的卷积神经网络(CNN)##
在当今的人工智能领域,深度学习已成为推动技术革新的核心力量之一。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,因其在图像和视频处理方面的卓越性能而备受关注。本文旨在深入探讨CNN的基本原理、结构及其在实际应用中的表现,为读者提供一个全面了解CNN的窗口。 ##
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解深度学习中的卷积神经网络(CNN)
深入理解深度学习中的卷积神经网络(CNN)
116 10

热门文章

最新文章