彩票开奖彩票开奖BCFPL:基于二元分类的低分辨率图像快速停车位识别

简介: 彩票开奖BCFPL:基于二元分类的低分辨率图像快速停车位识别

彩票开奖BCFPL:基于二元分类的低分辨率图像快速停车位识别

张亚,辛欣,梓轩王阿应用数学中心,天津大学,天津,300072,中国。*通讯作者: chen_xin@tju.edu.cn
汽车在人类的经济活动中起着重要的作用,特别是在大都市。在这种情况下,快速搜索可用停车位的需求已经成为汽车司机关注的一个主要问题。同时,公众的隐私意识也在觉醒,基于图像的停车位识别方法缺乏对隐私保护的重视。本文提出了一种具有轻量级设计结构的二值卷积神经网络BCFPL,该网络可用于低分辨率停车位图像的训练,并提供了合理的识别结果。停车位的图像采集于不同复杂的环境,包括不同的天气、遮挡条件和不同的相机角度。我们在不同的数据集和部分子集之间进行了训练和测试的进展。实验结果表明,与原始分辨率图像相比,BCFPL的精度没有直接下降,可以达到现有主流方法的平均水平。BCFPL的硬件要求较低,识别速度较快,同时满足了隐私要求

1.随着城市居民的快速增长,停车难度越来越严重。找到一个停车位将是一个常规的要求,这可能会浪费城市里所有的司机很多时间。非基于图像的停车位识别方法通常使用地磁传感器[1]来检测停车状态,但该方法安装程序复杂,后续维护困难,成本高。同时,还存在射频[2]、超声波[3]、雷达[4]等方法,但这些方法普遍存在成本高、普适性差的缺点。与这些方法相比,基于图像的方法通过视觉算法确定停车状态,不仅成本低,精度高,而且可以检测到广泛的停车状态,非常适合于开放停车场的场景。基于图像的停车位检测方法已成为一种通用的解决方案。提高算法的精度和效率,受到了越来越大的影响。2002年,Dan等人[5]使用支持向量机(SVM)分类器提取颜色向量特征

使用cnn。他们在各种环境光条件下训练这些网络,以有效地处理与光变化相关的挑战。2023年,萨蒂亚纳特获得了al[14]。提出了一种利用CNN检测雾霾天气下的停车位的方法,提高了在这种天气条件下进行停车位检测的精度。虽然停车位图像的识别达到了较高的精度,但这些方法没有考虑到隐私保护。同时,这些方法的检测效率并不高。近年来,大数据已经从单纯的数据发展成为一个关键的生产因素,深刻地影响了各种行业,重塑了社会活动。为了促进与数据相关的过程,如生成、收集、存储、传输和利用,它也引起了人们对公共隐私[15]日益增长的威胁的担忧。信息技术的广泛使用放大了隐私数据暴露的风险。在停车场安装摄像头以识别停车场,会造成信息泄露的重大风险。某些摄像头可以捕捉详细信息,包括许可证许可证
速度和图像传输,在智能城市、自动驾驶等领域具有很高的潜力

2.本文采用了三个停车位数据集。PKLot[8]和CNRPark -Ext[9]是公开访问的数据集,而第三个数据集由于其图像数量有限而命名为MiniPK,是专门为本研究编译的。PKLot数据集包含695,899张停车位图像,它们被分为三个子集: UFPR04、UFPR05和PUCPR。所有图片都是在UFPR、PUCPR室外停车场在阳光、雨、多云等不同天气条件下拍摄的。CNRPark-Ext数据集包含144965张停车位图像,由9台摄像机在不同的天气环境下获取。遮挡条件更严格,包括部分甚至完全遮挡,如路灯和树叶。CNRPark-Ext包含亮度较低的图像,这有助于模型应对在天空黑暗时相机捕捉图像不清晰的现实。该数据集还提供了CNRPark,这是12584个停车位图像的子集,区分了奇数和偶数停车位。MiniPK数据集包含100张停车位图像,从20多个o图像中分别获得

五张停车位的图片,避免了同一停车场的图片太相似的问题,所以丰富性很强。因此,该数据集是测试模型泛化的理想选择。 3.方法3.1降低图像分辨率,本工作的重点之一是探讨不同分辨率的图像与停车位识别精度之间的关系。实验需要在不同级别的低分辨率图像上进行,但现有数据集不满足低分辨率的条件,需要降低图像分辨率才能获得低分辨率停车图像数据集。鉴于必须降低停车位图像的分辨率,以加强隐私保护,目前在这方面缺乏普遍确立的指导方针。为了解决这个问题,我们对数据集的图像大小进行了全面的分析,发现原始图像一般超过50×50像素。因此,我们以50×50的分辨率开始了我们的实验。在接下来的每一步中,我们将图像的长度和宽度都减少了大约30%。同时,wi

图2.缩放图像中的一个点与原始图像的对应关系。作为和是对应的点,计算点处的像素值只是计算点处的像素值的问题。设x和y为通过将的坐标值四舍五入而得到的值。然后我们得到了四个点。对应的像素值分别为、、、、、、、、、、、、、。并且是在方向上的插值。我们使用公式(1)和(2)来计算z1和。()()()()()1 0 1,,,Zxxyxxxx=+−−+(1)()()()()()2 0 1,1,1Zxxxxxy=++−+−+ + (2) Z是y方向的像素插值。我们使用公式(3)来计算。() 2 1 0 1

将所得到的像素值Z视为点P的像素值,该像素值对应于缩放图像中的点Q的像素值。由于Q是一个任意的点,通过双线性插值算法,可以计算出缩放图像中每个点的像素值。3.2为了提高检测效率,我们设计了一个具有两个卷积层和两层全连接层的CNN模型。利用已建立的数据集,利用该模型对停车位图像进行二值分类。关于该模型的体系结构的详细信息如图3所示。模型中的两个卷积层采用7个×7个卷积核来提取局部特征。在第一卷积层中,使用8个卷积核进行特征提取,卷积核采用的滑动步长为3。在第二个卷积层中,采用16个卷积核进行特征提取,滑动步长设置为2。在每个卷积层之后,应用非线性激活函数ReLU,然后通过批处理归一化操作对其分布进行平滑处理。福洛

图3。图像处理流程和CNN结构:特征图的参数描述为“长度×宽×通道num”。对于卷积层,参数被指定为“大小/步幅数”。模型的输入大小配置为50×50。为了确保与二值分类网络的输入尺寸兼容,我们在降低分辨率后,精心调整了不同分辨率的图像的尺寸。在整个过程中,我们始终一致地采用双线性插值。必须强调的是,在降低后提高图像分辨率是一个不可逆的过程。在初始分辨率降低过程中丢失的特征在分辨率增强过程中不能完全恢复。因此,分辨率降低的图像可以提供在真实场景中低分辨率相机所捕获的内容的近似表示。 4.实验所有实验均基于PyTorch框架,采用Intel (R)核心(TM)i5-1135G7@2.40 GHz的CPU和NVIDIA GeForce MX450 GPU。OpenCV库被用于制作停车位口罩和调整i

在探索4.2中的过拟合问题时,除了学习率较小、训练时期较多外,其余都都使用了上述参数。4.1我们采用了我们提出的卷积模型来进行训练和测试。在CNRPark -Ext数据集中,随机分配2000张图像进行训练,另外保留10000张图像用于测试。同样,对于PKLot数据集,我们随机选择了10,000张图像进行模型泛化测试,为了同样的目的,我们从MiniPK数据集中选择了100张图像。随后,我们用PKLot替换训练数据集,并重复实验过程,以观察不同分辨率的数据集之间的精度变化。详细的结果如图4所示。

图4。通过对CNRPark和PKLot的训练,研究了不同数据集的精度与图像分辨率之间的关系。(水平坐标是图像的长度或宽度)。当实验中图像分辨率降低时,模型的测试精度在一定的分辨率范围内没有下降,在图像尺寸减小到7×7之前,测试结果仍在90%左右。此外,在一些实验数据集中,低分辨率图像的测试精度甚至更高。当分辨率降至5×5以下时,模型的测试精度显著降低,说明像素过少的停车位图像没有足够的显著特征供模型提取。因此,在一定范围内降低图像分辨率是可行的。4.2探讨过拟合问题:模型的过拟合是测试结果精度较低的一个重要原因,特别是在分辨率较高的情况下。虽然我们在数据处理和模型设计中采用了一些程序来减少过拟合,但过拟合的现象仍然存在。为了探索过拟合

训练回合。低分辨率的图像在训练过程中更稳定,增加训练轮数不会显著降低精度。因此,在一定范围内使用低分辨率的图像,在满足任务要求的同时,对训练过程更加友好。

图5。用不同分辨率的图像进行训练时,测试精度随训练周期数的变化而变化。4.3利用我们模型的最佳参数,在CNRPark的子集之间进行了进一步的泛化检验。CNRPark被分为偶数和奇数停车位(CNRPark偶数和CNRPark奇数)。对其中一个子集进行训练,对另一个子集进行测试,数据集中的所有图像都用于训练和测试。在训练和测试阶段,我们都使用了分辨率为7×7的停车位图像。我们将我们的方法与朱塞佩·Amato[10],De阿尔梅达等人的方法进行了比较。朱塞佩·阿马to提出的mAlexNet是一种深度学习模型,它具有具有三个卷积层和两个全连接层的卷积神经网络结构。mAlexNet的输入大小为224×224。德·阿尔梅达采用了一种基于RBF核支持向量机纹理特征直方图训练的停车占用率检测方法,这是一种相对先进的非深度学习方法。我们比较的指标是准确率和AUC(曲线下面积)。ROC(受试者操作Cha细菌)曲线显示了真实的变化

从实验结果来看,深度学习方法明显优于非深度学习方法。与mAlexNet相比,BCFPL的准确率提高了1%至1.5%。表1。对CNRPark的一个子集进行训练,并测试另一个子集的准确性。

为了进一步证明BCFPL的优越性,我们用mAlexNet进行了训练时间和测试时间的比较。实验均在相同的设备和相同的参数配置下进行。所花费的时间如表2所示。表2。比较BCFPL和mAlexNet在使用不同数量的图像进行训练和测试时所花费的时间。

在最小参数和低分辨率图像下,BCFPL在训练和测试时间上比mAlexNet的速度提高了三倍。这种效率归因于更小的输入图像和一个模拟器模型结构。在实际场景中,停车位图像被传输到服务器进行识别,我们的低分辨率方法不仅擅长速度,而且擅长数据存储和传输效率。值得注意的是,与原始图像的分辨率为50×50相比,使用7×7分辨率的图像可以将数据量减少到1/50以下。 5.结论将停车位图像的分辨率降低到7×7~9×9的范围内,显著提高了模型的实用性,使测试准确率保持在90%以上。这个分辨率范围有效地减轻了过拟合问题,允许在不影响模型泛化的情况下增加训练轮。所提出的BCFPL模型具有两个卷积层和两个全连通层,简化了停车位的识别,以最小参数(30,000)表现出强泛化。我们的方法满足了对隐私的需要,同时,也需要

[4]李J,陈H,杨Q,等。基于LiDAR的高精度停车位搜索、检测和跟踪[R]。SAE技术论文,2020. [5] DAN N.停车管理系统和方法[P]。US,20030144890,2003. [6] Wu,Q.,黄, C., 王,年代。邱,W。-C.,和陈,T.(2007)。考虑空间间相关性的稳健停车位检测。在多媒体和博览会上,2007年国际国际会议(第659-662页)。IEEE. [7] Huang, C.-C。(2013)。基于基于平面的贝叶斯层次框架的空置停车位检测。视频技术的电路和系统,IEEE交易,23,1598-1610.[8]杰姆苏拉旺,J.,阿山,U.,海达尔, A., 海威, D., & Mavridis,N.(2014)。利用单摄像头空置率检测进行为期一天的停车需求统计分析。《运输系统工程和信息技术杂志》,14,33-44.[9]de阿尔梅达,公关,奥利维拉,L. S.,布里托, A.S.,席尔瓦,E. J.,和科里希, A.L.(2015)。Pklot-一个用于停车场分类的稳健数据集。专家系统与应用程序,42,4937-4949。[10]Amato G,Carrara F,Falchi F,等人。去中心的深度学习

目录
相关文章
|
机器学习/深度学习
基于PaddleGAN精准唇形合成模型实现美女表白视频
基于PaddleGAN精准唇形合成模型实现美女表白视频
682 0
基于PaddleGAN精准唇形合成模型实现美女表白视频
|
6月前
|
机器学习/深度学习 算法
应用规则学习算法识别有毒的蘑菇
应用规则学习算法识别有毒的蘑菇
|
6月前
|
数据可视化
数据分享|R语言逐步回归模型对电影票房、放映场数、观影人数预测可视化1
数据分享|R语言逐步回归模型对电影票房、放映场数、观影人数预测可视化
|
6月前
|
数据可视化
数据分享|R语言逐步回归模型对电影票房、放映场数、观影人数预测可视化2
数据分享|R语言逐步回归模型对电影票房、放映场数、观影人数预测可视化
|
6月前
|
算法 数据挖掘
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
R语言面板数据回归:含时间固定效应混合模型分析交通死亡率、酒驾法和啤酒税
|
C++ 计算机视觉 Python
C++/Yolov8人体特征识别 广场室内 人数统计
这篇博客针对<<C++/Yolov8人体特征识别 广场室内 人数统计>>编写代码,代码整洁,规则,易读。 学习与应用推荐首选。
385 0
|
机器学习/深度学习 决策智能 计算机视觉
对硬币、销钉、大米进行图像分割(附代码)
对硬币、销钉、大米进行图像分割(附代码)
109 0
|
存储 算法 开发工具
【每周一坑】图像的指纹:数字水印 + 【解答】鸡兔同笼
有人可能好奇,仅凭截图就能知道是谁干的吗?这里就是用到了“数字水印”技术。
|
人工智能 算法 数据处理
英雄联盟胜负预测--简易肯德基上校
英雄联盟胜负预测--简易肯德基上校
英雄联盟胜负预测--简易肯德基上校