1761360321912488_社区达人页

个人头像照片
1761360321912488
已加入开发者社区2048

勋章 更多

个人头像照片
星级博主
星级博主
个人头像照片
技术博主
技术博主
个人头像照片
江湖新秀
江湖新秀

成就

已发布31篇文章
8条评论
已回答0个问题
0条评论
已发布0个视频
github地址

我关注的人 更多

技术能力

兴趣领域
擅长领域
技术认证

暂时未有相关云产品技术能力~

暂无个人介绍

暂无精选文章
暂无更多信息

2024年09月

  • 09.08 10:07:33
    发表了文章 2024-09-08 10:07:33

    AI计算机视觉笔记三十二:LPRNet车牌识别

    LPRNet是一种基于Pytorch的高性能、轻量级车牌识别框架,适用于中国及其他国家的车牌识别。该网络无需对字符进行预分割,采用端到端的轻量化设计,结合了squeezenet和inception的思想。其创新点在于去除了RNN,仅使用CNN与CTC Loss,并通过特定的卷积模块提取上下文信息。环境配置包括使用CPU开发板和Autodl训练环境。训练和测试过程需搭建虚拟环境并安装相关依赖,执行训练和测试脚本时可能遇到若干错误,需相应调整代码以确保正确运行。使用官方模型可获得较高的识别准确率,自行训练时建议增加训练轮数以提升效果。
  • 09.08 10:01:17
    发表了文章 2024-09-08 10:01:17

    AI计算机视觉笔记三十一:基于UNetMultiLane的多车道线等识别

    该项目基于开源数据集 VIL100 实现了 UNetMultiLane,用于多车道线及车道线类型的识别。数据集中标注了六个车道的车道线及其类型。项目详细记录了从环境搭建到模型训练与测试的全过程,并提供了在 CPU 上进行训练和 ONNX 转换的代码示例。训练过程约需 4 小时完成 50 个 epoch。此外,还实现了视频检测功能,可在视频中实时识别车道线及其类型。
  • 09.08 09:57:42
    发表了文章 2024-09-08 09:57:42

    AI计算机视觉笔记三十:yolov8_obb旋转框训练

    本文介绍了如何使用AUTODL环境搭建YOLOv8-obb的训练流程。首先创建虚拟环境并激活,然后通过指定清华源安装ultralytics库。接着下载YOLOv8源码,并使用指定命令开始训练,过程中可能会下载yolov8n.pt文件。训练完成后,可使用相应命令进行预测测试。
  • 09.08 09:53:32
    发表了文章 2024-09-08 09:53:32

    AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签

    本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
  • 09.08 09:47:25
    发表了文章 2024-09-08 09:47:25

    AI计算机视觉笔记二十 八:基于YOLOv8实例分割的DeepSORT多目标跟踪

    本文介绍了YOLOv8实例分割与DeepSORT视觉跟踪算法的结合应用,通过YOLOv8进行目标检测分割,并利用DeepSORT实现特征跟踪,在复杂环境中保持目标跟踪的准确性与稳定性。该技术广泛应用于安全监控、无人驾驶等领域。文章提供了环境搭建、代码下载及测试步骤,并附有详细代码示例。
  • 09.08 09:43:33
    发表了文章 2024-09-08 09:43:33

    AI计算机视觉笔记二十七:YOLOV8实现目标追踪

    本文介绍了使用YOLOv8实现人员检测与追踪的方法。通过为每个人员分配唯一ID,实现持续追踪,并可统计人数,适用于小区或办公楼出入管理。首先解释了目标检测与追踪的区别,接着详细描述了使用匈牙利算法和卡尔曼滤波实现目标关联的过程。文章提供了基于IOU实现追踪的具体步骤,包括环境搭建、模型加载及追踪逻辑实现。通过示例代码展示了如何使用YOLOv8进行实时视频处理,并实现人员追踪功能。测试结果显示,该方法在实际场景中具有较好的应用潜力。
  • 09.08 09:39:10
    发表了文章 2024-09-08 09:39:10

    AI计算机视觉笔记二十六:YOLOV8自训练关键点检测

    本文档详细记录了使用YOLOv8训练关键点检测模型的过程。首先通过清华源安装YOLOv8,并验证安装。接着通过示例权重文件与测试图片`bus.jpg`演示预测流程。为准备训练数据,文档介绍了如何使用`labelme`标注工具进行关键点标注,并提供了一个Python脚本`labelme2yolo.py`将标注结果从JSON格式转换为YOLO所需的TXT格式。随后,通过Jupyter Notebook可视化标注结果确保准确性。最后,文档展示了如何组织数据集目录结构,并提供了训练与测试代码示例,包括配置文件`smoke.yaml`及训练脚本`train.py`,帮助读者完成自定义模型的训练与评估。
  • 09.08 09:30:14
    发表了文章 2024-09-08 09:30:14

    AI计算机视觉笔记二十五:ResNet50训练部署教程

    该项目旨在训练ResNet50模型并将其部署到RK3568开发板上。首先介绍了ResNet50网络,该网络由何恺明等人于2015年提出,解决了传统卷积神经网络中的退化问题。项目使用车辆分类数据集进行训练,并提供了数据集下载链接。环境搭建部分详细描述了虚拟环境的创建和所需库的安装。训练过程中,通过`train.py`脚本进行了15轮训练,并可视化了训练和测试结果。最后,项目提供了将模型转换为ONNX和PT格式的方法,以便在RK3568上部署。
  • 09.08 09:24:20
    发表了文章 2024-09-08 09:24:20

    AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估

    本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。
  • 09.08 09:17:52
    发表了文章 2024-09-08 09:17:52

    AI计算机视觉笔记二十三:PP-Humanseg训练及onnxruntime部署

    本文介绍了如何训练并使用PaddleSeg的人像分割模型PP-HumanSeg,将其导出为ONNX格式,并使用onnxruntime进行部署。首先在AutoDL服务器上搭建环境并安装所需库,接着下载数据与模型,完成模型训练、评估和预测。最后,通过paddle2onnx工具将模型转换为ONNX格式,并编写预测脚本验证转换后的模型效果。此过程适用于希望在不同平台上部署人像分割应用的开发者。
  • 09.08 09:07:05
    发表了文章 2024-09-08 09:07:05

    AI计算机视觉笔记二十二:基于 LeNet5 的手写数字识别及训练

    本文介绍了使用PyTorch复现LeNet5模型并检测手写数字的过程。通过搭建PyTorch环境、安装相关库和下载MNIST数据集,实现了模型训练与测试。训练过程涉及创建虚拟环境、安装PyTorch及依赖库、准备数据集,并编写训练代码。最终模型在测试集上的准确率达到0.986,满足预期要求。此项目为后续在RK3568平台上部署模型奠定了基础。
  • 09.08 08:56:45
    发表了文章 2024-09-08 08:56:45

    AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集

    在完成PaddleOCR环境搭建与测试后,本文档详细介绍如何训练自定义的车牌检测模型。首先,在`PaddleOCR`目录下创建`train_data`文件夹存放数据集,并下载并解压缩车牌数据集。接着,复制并修改配置文件`ch_det_mv3_db_v2.0.yml`以适应训练需求,包括设置模型存储目录、训练可视化选项及数据集路径。随后,下载预训练权重文件并放置于`pretrain_models`目录下,以便进行预测与训练。最后,通过指定命令行参数执行训练、断点续训、测试及导出推理模型等操作。
  • 09.08 08:47:19
    发表了文章 2024-09-08 08:47:19

    AI计算机视觉笔记二十:PaddleOCR环境搭建及测试

    OCR技术广泛应用于日常生活中,与人脸识别一样常见。PaddleOCR是一个基于飞桨的OCR工具库,具有超轻量级中文OCR模型,支持中英文数字组合、竖排及长文本识别。本文档详细介绍了PaddleOCR的学习过程,包括环境搭建、安装、样本标注及测试步骤。使用AutoDL云平台进行环境创建,并提供了详细的命令行操作指南,帮助用户顺利完成PaddleOCR的部署与测试。
  • 09.08 08:43:52
    发表了文章 2024-09-08 08:43:52

    AI计算机视觉笔记十九:Swin Transformer训练

    本文介绍了使用自定义数据集训练和测试目标检测模型的步骤。首先,通过安装并使用标注工具labelme准备数据集;接着修改配置文件以适应自定义类别,并调整预训练模型;然后解决训练过程中遇到的依赖冲突问题并完成模型训练;最后利用测试命令验证模型效果。文中提供了具体命令及文件修改指导。
  • 09.08 08:38:56
    发表了文章 2024-09-08 08:38:56

    AI计算机视觉笔记十八:Swin Transformer目标检测环境搭建

    本文详细记录了Swin Transformer在AutoDL平台上的环境搭建与训练过程。作者从租用GPU实例开始,逐步介绍了虚拟环境的创建、PyTorch安装、mmcv及mmdetection的配置,并解决了安装过程中遇到的各种问题,如cython版本冲突等。最后,通过修改代码实现目标检测结果的保存。如需了解更多细节或获取完整代码,请联系作者。原文链接:[原文链接](请在此处插入原文链接)。
  • 09.08 08:33:23
    发表了文章 2024-09-08 08:33:23

    AI计算机视觉笔记十七:实例分割

    本文介绍了计算机视觉中的实例分割技术,通过结合目标检测和语义分割的方法,实现对图像中不同实例的精确区分与标记。以识别多只猫为例,详细描述了使用Mask R-CNN模型进行实例分割的过程,并提供了相关代码及环境搭建指南。通过实例演示,展示了如何利用该技术成功识别并分割出图像中的各个对象。
  • 09.08 08:28:46
    发表了文章 2024-09-08 08:28:46

    AI计算机视觉笔记十六:yolov5训练自己的数据集

    本文介绍了一种利用云服务器AutoDL训练疲劳驾驶行为检测模型的方法。由于使用本地CPU训练效率低下,作者选择了性价比高的AutoDL云服务器。首先,从网络获取了2000多张疲劳驾驶行为图片并使用labelimg软件进行标注。接着,详细介绍了在云服务器上创建实例、上传数据集和YOLOv5模型、修改配置文件以及开始训练的具体步骤。整个训练过程耗时约3小时,最终生成了可用于检测的模型文件。
  • 09.08 08:23:04
    发表了文章 2024-09-08 08:23:04

    AI计算机视觉笔记十五:编写检测的yolov5测试代码

    该文为原创文章,如需转载,请注明出处。本文作者在成功运行 `detect.py` 后,因代码难以理解而编写了一个简易测试程序,用于加载YOLOv5模型并检测图像中的对象,特别是“人”类目标。代码实现了从摄像头或图片读取帧、进行颜色转换,并利用YOLOv5进行推理,最后将检测框和置信度绘制在输出图像上,并保存为 `result.jpg`。如果缺少某些模块,可使用 `pip install` 安装。如涉及版权问题或需获取完整代码,请联系作者。
  • 09.01 22:17:22
    发表了文章 2024-09-01 22:17:22

    AI计算机视觉笔记十四:YOLOV5环境搭建及测试全过程

    本文详细记录了在Windows 10环境下从零开始搭建yolov5环境并进行测试的全过程,涵盖环境配置、依赖安装及模型测试等关键步骤。文章首先介绍了所需环境(Python 3.8、yolov5-5.0),接着详细说明了如何使用Miniconda3创建与激活虚拟环境,并通过具体命令演示了如何下载安装yolov5及相关依赖库。最后,通过一系列命令展示了如何下载预训练模型并对示例图像进行目标检测,同时解决了一些常见错误。适合初学者跟随实践。如需转载,请注明原文出处。
  • 09.01 22:11:36
    发表了文章 2024-09-01 22:11:36

    AI计算机视觉笔记十三:危险区域识别系统

    本文介绍了如何在 IPC 监控视频中实现区域入侵检测,通过 YOLOv5 和 ByteTrack 实现人物检测与多目标跟踪。系统能在检测到人员进入预设的危险区域时发出警报,保障安全。主要步骤包括:1)使用 YOLOv5 识别人物;2)使用 ByteTrack 进行多目标跟踪;3)利用射线法判断物体是否进入禁区内。项目基于 Python 开发,使用海思、君正、RK 等摄像头模组,代码已在 RV1126 上验证,计划移植至 RK3568 平台。项目结构清晰,包含模型训练、跟踪算法及图形化界面展示等功能。
  • 09.01 22:05:40
    发表了文章 2024-09-01 22:05:40

    AI计算机视觉笔记十二:基于 LeNet5 的手写数字识别及训练

    本文档介绍了如何使用PyTorch框架复现经典的LeNet5模型,并通过MNIST数据集进行训练与测试。首先,创建虚拟环境并安装所需库,接着下载MNIST数据集。训练部分涉及四个主要文件:`LeNet5.py`、`myDatast.py`、`readMnist.py` 和 `train.py`。通过这些文件搭建模型并完成训练过程。最后,通过测试脚本验证模型准确性,结果显示准确率达到0.986,满足预期需求。文档还提供了详细的环境配置和代码实现细节。
  • 09.01 21:59:41
    发表了文章 2024-09-01 21:59:41

    AI计算机视觉笔记十一:yolo5+Deepsort实现目标检测与跟踪(CPU版)

    DeepSORT是一种基于深度学习的计算机视觉跟踪算法,扩展了SORT算法,通过添加外观描述符减少身份切换,提高跟踪效率。本文档提供了DeepSORT环境搭建步骤,包括创建虚拟环境、安装依赖及解决常见错误等,最终实现人员和车辆的跟踪计数功能。适合无GPU设备的学习者参考。
  • 09.01 09:42:20
    发表了文章 2024-09-01 09:42:20

    AI计算机视觉笔记十:结印动作识别

    该项目基于恩培大佬的《火影结印识别》小项目,使用yolov5实现手势识别功能。项目包含数据集准备、模型训练和代码实现,可在无GPU环境下运行。代码利用状态机检测手势序列,完成特定结印后触发音效播放。[GitHub地址](https://github.com/enpeizhao/CVprojects)提供了详细步骤和示例代码。
  • 09.01 09:39:17
    发表了文章 2024-09-01 09:39:17

    AI计算机视觉笔记九:基于mediapipe的钢铁侠操作(虚拟拖拽)

    这段代码演示了如何使用OpenCV和MediaPipe库在视频流中实现虚拟物体的拖放功能,模拟了类似钢铁侠电影中的高科技操作界面。具体步骤包括读取视频流、获取手指关键点坐标、计算手指间距离,并判断食指是否位于虚拟方块内。如果手指位于方块内,则更新方块的位置,实现拖放效果。代码提供了详细的实现过程,包括关键点识别、坐标计算及方块绘制等。此外,还提供了半透明效果处理,使视觉效果更加逼真。整个项目基于Mediapipe环境搭建,适合初学者学习计算机视觉应用开发。
  • 09.01 09:36:11
    发表了文章 2024-09-01 09:36:11

    AI计算机视觉笔记八:基于mediapipe的虚拟绘画

    该项目利用MediaPipe手部关键点识别技术,实现了隔空绘画功能。用户可以通过手势控制绘画工具,选择颜色或橡皮擦。环境配置基于`mediapipe_env`,在PyCharm中运行。项目包括两个文件:`AiVirtualPainter.py`负责绘画逻辑,`HandTrackingModule.py`用于手部关键点检测。此项目展示了AI技术在互动应用中的潜力,适合初学者实践与学习。
  • 09.01 09:32:54
    发表了文章 2024-09-01 09:32:54

    AI计算机视觉笔记七:基于mediapipe的虚拟鼠标控制

    该项目旨在通过摄像头识别手指动作以实现鼠标控制。利用mediapipe检测手指关键点,并通过食指移动鼠标,当食指与中指距离小于阈值时触发点击事件。环境基于miniconda3,需创建虚拟环境并安装mediapipe、numpy、autopy和opencv等依赖。代码分为`AiVirtualMouse.py`和`HandTrackingModule.py`两个部分,前者用于实现鼠标控制逻辑,后者提供手势检测功能。运行时可能出现`PacketInvoked`错误,需修改`solution_base.py`文件第595行以解决。
  • 09.01 09:29:10
    发表了文章 2024-09-01 09:29:10

    AI计算机视觉笔记六:mediapipe测试

    MediaPipe是由Google Research开发并开源的多媒体机器学习框架,已被集成到YouTube、Google Lens等重要产品中。该框架支持多种功能,如物体检测、自拍分割、头发分割、人脸检测、手部检测及运动追踪等。本文档将指导你通过Python环境搭建与测试MediaPipe,包括创建虚拟环境、安装依赖库,并进行手指骨骼识别测试。具体步骤涵盖环境配置、摄像头数据处理及结果显示。
  • 09.01 09:17:24
    发表了文章 2024-09-01 09:17:24

    AI计算机视觉笔记四:行人属性识别

    本文分享了一个行人属性分析系统,能够识别并标注行人的多种属性。该项目代码源自公众号“渡码”的项目,作者在Win10环境下成功复现了整个项目,并详细记录了过程。系统通过YOLOv5识别行人,用ByteTrack跟踪同一行人,并训练一个多标签图像分类网络来识别行人的26种属性。文中详细介绍了环境搭建和测试步骤,包括安装Anaconda、创建虚拟环境、安装所需库以及测试代码等。如需完整代码或有任何问题,请联系博主。源码已上传至GitHub。

2024年08月

  • 08.24 17:23:52
    发表了文章 2024-08-24 17:23:52

    AI计算机视觉笔记三:WEB端部署YOLOv5

    本文档介绍了如何将YOLOv5目标检测模型部署到Web端的方法,包括基于Flask和Streamlit两种实现方案。首先创建Python虚拟环境并安装必要的依赖库。接着详细展示了Flask方案下的前端HTML页面与后端Python逻辑代码,该方案利用Flask框架搭建服务器,处理实时视频流,并显示检测结果。随后介绍了Streamlit方案,该方案更简洁直观,适合快速开发交互式的机器学习应用。通过`streamlit run`命令即可启动应用,支持图像、视频及实时摄像头的目标检测演示。两种部署方式各有优势,Flask灵活性高,适用于复杂项目;而Streamlit则易于上手,便于快速原型设计。
  • 08.24 17:14:31
    发表了文章 2024-08-24 17:14:31

    AI计算机视觉笔记二:基于YOLOV5的CPU版本部署openvino

    本文档详细记录了YOLOv5模型在CPU环境下的部署流程及性能优化方法。首先,通过设置Python虚拟环境并安装PyTorch等依赖库,在CPU环境下成功运行YOLOv5模型的示例程序。随后,介绍了如何将PyTorch模型转换为ONNX格式,并进一步利用OpenVINO工具包进行优化,最终实现模型在CPU上的高效运行。通过OpenVINO的加速,即使是在没有GPU支持的情况下,模型的推理速度也从约20帧每秒提高到了50多帧每秒,显著提升了性能。此文档对希望在资源受限设备上部署高性能计算机视觉模型的研究人员和工程师具有较高的参考价值。
  • 08.21 12:56:27
    发表了文章 2024-08-21 12:56:27

    AI计算机视觉笔记一:YOLOV5疲劳驾驶行为检测

    如何使用云服务器AutoDL进行深度学习模型的训练,特别是针对YOLOV5疲劳驾驶行为训练检测
  • 发表了文章 2024-09-08

    AI计算机视觉笔记十五:编写检测的yolov5测试代码

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签

  • 发表了文章 2024-09-08

    AI计算机视觉笔记十八:Swin Transformer目标检测环境搭建

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十二:基于 LeNet5 的手写数字识别及训练

  • 发表了文章 2024-09-08

    AI计算机视觉笔记三十一:基于UNetMultiLane的多车道线等识别

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十五:ResNet50训练部署教程

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十一:PaddleOCR训练自定义数据集

  • 发表了文章 2024-09-08

    AI计算机视觉笔记十七:实例分割

  • 发表了文章 2024-09-08

    AI计算机视觉笔记十九:Swin Transformer训练

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十六:YOLOV8自训练关键点检测

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估

  • 发表了文章 2024-09-08

    AI计算机视觉笔记三十二:LPRNet车牌识别

  • 发表了文章 2024-09-08

    AI计算机视觉笔记三十:yolov8_obb旋转框训练

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十七:YOLOV8实现目标追踪

  • 发表了文章 2024-09-08

    AI计算机视觉笔记十六:yolov5训练自己的数据集

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十:PaddleOCR环境搭建及测试

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十 八:基于YOLOv8实例分割的DeepSORT多目标跟踪

  • 发表了文章 2024-09-08

    AI计算机视觉笔记二十三:PP-Humanseg训练及onnxruntime部署

  • 发表了文章 2024-09-01

    AI计算机视觉笔记十四:YOLOV5环境搭建及测试全过程

  • 发表了文章 2024-09-01

    AI计算机视觉笔记十三:危险区域识别系统

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息