基于深度学习的口罩污染目标检测算法介绍

简介: 近年来,随着人工智能的快速发展,基于深度学习的目标检测算法有着越来越广泛的应用,由于深度学习算法在真实环境中的鲁棒性远超过传统视觉算法,更适合应对现实环境中的各种复杂情况.

1.  两阶段以及但阶段目标检测算法


    时下流行的目标检测算法主要包含两阶段(Two-stage)算法和单阶段(One-stage)算法两类。其中,两阶段算法主要以RCNN系列为代表,此类算法需要先在区域提议(region proposal)阶段通过选择搜索算法对输入图像生成大量的候选区域,然后再使用 CNN 模型对生成的候选区域加以分类和回归;而单阶段算法主要以SSD算法和YOLO系列为代表,顾名思义,此类算法没有候选区域生成阶段,而是直接使用 CNN模型提取特征信息,从而进行检测目标的分类与定位。两阶段算法的区域提议阶段往往会生成大量的(可能超过 2000个)候选区域,这些候选区域为后续的CNN模型处理带来了极大的计算量,大幅降低了算法的检测速度。而相比于两阶段算法,单阶段算法的检测策略显然更为直接,CNN模型仅需要进行一次前向推理就能获得待检测目标的相关信息,这为单阶段算法带来了数十倍、甚至是上百倍于两阶段算法的检测速度,使其在视频目标检测等主流应用领域中可以达到更高的每秒传输帧率(Frames  Per Second,FPS),所以相比两阶段算法,单阶段算法的应用场景要广泛得多。当下最流行的通用目标检测算法毫无疑问是 YOLOv4,它在主流目标检测数据集COCO上面以65 FPS(测试于Tesla V100 GPU)的实时检测速度达到了65.7%的平均精度均值(mean Average Precision,m AP),相比于前作YOLOv3有着7.8%的大幅提升。


2.  目标检测算法实时性


    因为作为通用目标检测算法,YOLOv3、YOLOv4 需要在多类别(比如 COCO 数据集的80个类别)的目标检测任务中具备很强的泛化能力,所以它们的网络结构被设计得非常复杂,这在一方面提高了网络的训练难度,另一方面也为它们带来了并不理想的模型推理速度。例如,YOLOv4算法在 AMD  3600x  CPU上检测单张608 × 608尺寸的图片需要耗时 21 秒左右,而在 Ge Force GTX 1050Ti GPU(普通性能的 GPU)上的实时检测速度也仅有 13 FPS 左右。YOLOv4 算法虽然具备非常优秀的检测精度,但是复杂的网络结构需要大规模的网络参数量进行支撑,这导致了它的检测速度并不“实时”。口罩检测任务的应用场景非常普遍,多数场景是机场、车站等在全国范围内随处可见的公共交通场所,鉴于这类场所的分布普遍性,是不可能具备超高性能的计算机来部署YOLOv3、YOLOv4 这种非轻量级的目标检测算法的。Wang等人通过对YOLOv4算法的网络结构进行大幅的尺度缩放,并引入跨阶段局部网络(Cross Stage Partial Network,CSPNet)对骨干网络的构造进行改进,提出了YOLOv4-tiny算法。YOLOv4-tiny算法是一种典型的轻量级通用目标检测算法,它的网络参数量仅有YOLOv4算法的10%左右,检测速度则是 YOLOv4算法的6~8倍。相比于YOLOv4算法(具有三个尺度的预测特征层),YOLOv4-tiny算法在骨干网络和特征增强网络上都做了大量的简化,并且只有两个尺度的预测特征层。不过需要注意的是,YOLOv4-tiny网络结构的大幅简化随之而来的就是检测精度的牺牲,例如,它在COCO数据集上的 m AP 指标为42.0%,相比YOLOv4算法确实降低了不少。不过,相比COCO数据集的80个检测类别,现实应用中的大多数目标检测任务的类别数一般在 10 个以下,比如口罩检测任务就只有口罩目标和人脸目标 2个类别,对这类低类别数的检测任务来说,YOLOv4-tiny算法对目标的解析能力尚可,并且具备极为优秀的检测速度。

WE5(BU8~U@%{DQ(_Q}NZ2`Y.png

UJ_)3PV{5`2LE9S{{RFD[P3.png

BJ0P%(I3A3TPB2RY~EAG0@8.png

相关文章
|
13天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
66 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
1月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
286 55
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
189 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
1月前
|
机器学习/深度学习 算法 信息无障碍
基于GoogleNet深度学习网络的手语识别算法matlab仿真
本项目展示了基于GoogleNet的深度学习手语识别算法,使用Matlab2022a实现。通过卷积神经网络(CNN)识别手语手势,如"How are you"、"I am fine"、"I love you"等。核心在于Inception模块,通过多尺度处理和1x1卷积减少计算量,提高效率。项目附带完整代码及操作视频。
|
1月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于深度学习网络的宝石类型识别算法matlab仿真
本项目利用GoogLeNet深度学习网络进行宝石类型识别,实验包括收集多类宝石图像数据集并按7:1:2比例划分。使用Matlab2022a实现算法,提供含中文注释的完整代码及操作视频。GoogLeNet通过其独特的Inception模块,结合数据增强、学习率调整和正则化等优化手段,有效提升了宝石识别的准确性和效率。
|
2月前
|
机器学习/深度学习 监控 算法
基于反光衣和检测算法的应用探索
本文探讨了利用机器学习和计算机视觉技术进行反光衣检测的方法,涵盖图像预处理、目标检测与分类、特征提取等关键技术。通过YOLOv5等模型的训练与优化,展示了实现高效反光衣识别的完整流程,旨在提升智能检测系统的性能,应用于交通安全、工地监控等领域。
|
2月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
107 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
132 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
135 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
3天前
|
算法 数据安全/隐私保护 计算机视觉
基于Retinex算法的图像去雾matlab仿真
本项目展示了基于Retinex算法的图像去雾技术。完整程序运行效果无水印,使用Matlab2022a开发。核心代码包含详细中文注释和操作步骤视频。Retinex理论由Edwin Land提出,旨在分离图像的光照和反射分量,增强图像对比度、颜色和细节,尤其在雾天条件下表现优异,有效解决图像去雾问题。