pytorch_YOLOX剪枝【附代码】

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 笔记

环境


pytorch 1.7


loguru 0.5.3


NVIDIA 1650 4G


intel i5-9th


torch-pruning 0.2.7


安装包


pip install torch_pruning


Note:本项目是在b站up主Bubbliiiing和原YOLOX官方代码进行了整合。


1.添加了feature可视化功能


2.训练中可开启EMA功能


3.网络剪枝(支持s,m,l,x)


3.1支持单个卷积剪枝


3.2支持网络层剪枝


4.剪枝后微调训练


5.Conv与BN层的融合推理加速


6.保存log信息


数据集格式:采用voc数据集格式


feature视化


在tools/Net_Vision.py为可视化代码实现。可以通过在网络层导入NV函数,实现通道可视化。


eg:

features = [out_features[f] for f in self.in_features]
[x2, x1, x0] = features  # shape is (batch_size,channels,w,h)
NV(x2)

5.jpeg6.jpeg


网络剪枝


参考论文:Pruning Filters for Efficient ConvNets


导入剪枝工具


import torch_pruning as tp

采用通道剪枝,而不是权重剪枝。


在剪枝之前需要通过tools/prunmodel.py save_whole_model(weights_path, num_classes) 函数将模型的权重和结构都保存下来。


weights_path:权重路径


num_classes:自己类别数量


model = YOLOX(num_classes, 's')  # 这里需要根据自己的类数量修改  s指yolox-s

支持对某个卷积的剪枝:调用Conv_pruning(whole_model_weights):


pruning_idxs = strategy(v, amount=0.4)  # 0.4是剪枝率 根据需要自己修改,数越大剪的越多

对于单独一个卷积的剪枝,需要修改两个地方值,这里的卷积层需要打印模型获得,不要自己盲目瞎猜:


if k == 'backbone.backbone.dark2.0.conv.weight'
pruning_plan = DG.get_pruning_plan((model.backbone.backbone.dark2)[0].conv, tp.prune_conv, idxs=pruning_idxs)

支持网络层的剪枝:调用layer_pruning(whole_model_weights):


included_layers = list((model.backbone.backbone.dark2.modules()))  # 针对某层剪枝

Note:剪枝成功以后,会打印模型的参数变化量!如果没有打印,说明你剪的不对,好好检查一下!


剪枝以后的log日志文件会保存在logs文件下


剪枝后的微调训练


将train.py中的pruned_train设置为True.


False为正常训练,然后自己修改batch_size。


注意修改model_path和classes_path,不然会报错!


剪枝前的网络输入大小和微调训练以及推理时的大小必须一致!


训练自己的数据集


如果你有用过Bubbliiiing up主的代码,你将很快就能上手。数据集采用的是VOC的形式


VOCdevkit/
`-- VOC2007
    |-- Annotations  (存放xml标签文件)
    |-- ImageSets
    |   `-- Main
    `-- JPEGImages (存放图像)

在model_data中新建一个new_classes.txt,里面写入自己的类。运行voc_annotation.py,会在当前目录生成2007_train.txt文件和2007_val.txt文件。(可以检查一下里面有没有生成成功)


在train.py中,将classes_path修改为model_data/new_classes.txt【等预测的时候,也是需要在yolo.py中修改这里】


然后根据需要修改其他超参即可训练,训练权重会保存在logs文件中(默认保存权值,不含网络结构)


预测



image.png

参数说明:下面终端的输入都是可选的


--predict:预测模式


--pruned:开启剪枝预测或训练


--image:图像检测


--video:开始视频检测


--video_path:视频路径


--camid:摄像头id 默认0


--fps:FPS测试


--dir_predict:对一个文件夹下图像进行预测


--phi:可以选择s,m,l,x等


--input_shape:网络输入大小,默认640


--confidence:置信度阈值


--nms_iou:iou阈值


--num_classes:类别数量,默认80


--fuse:是否开启卷积层和BN层融合加速,默认False


终端输入:


# 图像预测
python demo.py --predict --image
# 视频预测
python demo.py --predict --video --camdi 0
# fps测试
python demo.py --predict --fps

默认预测都为yolox_s,如果要指定其他网络,输入:(需要注意的是在yolo.py修改权重路径,如果是自己数据集,还需要修改classes_path)


# 使用yolox_l预测
python demo.py --predict --image --phi l

Conv与BN层的融合推理加速


其他命令可以搭配使用,比如采用conv和bn融合的方式进行推理


python demo.py --predict --image --fuse

通过测试发现FPS提升了3帧/s左右(我的GPU是1650)


日志文件的保存


本项目采用loguru工具捕获日志,检测和训练中的一些日志记录会自动记录,保存在logs文件下,一个log文件的大小我设置的上限大小为1 MB,如果超过该范围,会自动生成一个新的.log文件,可以自己修改这个值,或者修改日志保存时间(以免保存了太多的日志)。如果不想要这个功能,可以找到相应的位置注释掉即可。


这里只是帮助大家造轮子,用尽可能简单的代码实现一些功能,不用大家再去看复杂的工程代码,最终的效果需要自己耐心调试,慢慢“炼丹”!



相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
8月前
|
机器学习/深度学习 PyTorch 算法框架/工具
pytorch中的模型剪枝
pytorch中的模型剪枝
|
3月前
|
算法 PyTorch 算法框架/工具
Pytorch学习笔记(九):Pytorch模型的FLOPs、模型参数量等信息输出(torchstat、thop、ptflops、torchsummary)
本文介绍了如何使用torchstat、thop、ptflops和torchsummary等工具来计算Pytorch模型的FLOPs、模型参数量等信息。
436 2
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。
51 3
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
|
3月前
|
机器学习/深度学习 自然语言处理 监控
利用 PyTorch Lightning 搭建一个文本分类模型
利用 PyTorch Lightning 搭建一个文本分类模型
89 7
利用 PyTorch Lightning 搭建一个文本分类模型
|
3月前
|
机器学习/深度学习 自然语言处理 数据建模
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
本文深入探讨了Transformer模型中的三种关键注意力机制:自注意力、交叉注意力和因果自注意力,这些机制是GPT-4、Llama等大型语言模型的核心。文章不仅讲解了理论概念,还通过Python和PyTorch从零开始实现这些机制,帮助读者深入理解其内部工作原理。自注意力机制通过整合上下文信息增强了输入嵌入,多头注意力则通过多个并行的注意力头捕捉不同类型的依赖关系。交叉注意力则允许模型在两个不同输入序列间传递信息,适用于机器翻译和图像描述等任务。因果自注意力确保模型在生成文本时仅考虑先前的上下文,适用于解码器风格的模型。通过本文的详细解析和代码实现,读者可以全面掌握这些机制的应用潜力。
174 3
三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
|
4月前
|
机器学习/深度学习 PyTorch 调度
在Pytorch中为不同层设置不同学习率来提升性能,优化深度学习模型
在深度学习中,学习率作为关键超参数对模型收敛速度和性能至关重要。传统方法采用统一学习率,但研究表明为不同层设置差异化学习率能显著提升性能。本文探讨了这一策略的理论基础及PyTorch实现方法,包括模型定义、参数分组、优化器配置及训练流程。通过示例展示了如何为ResNet18设置不同层的学习率,并介绍了渐进式解冻和层适应学习率等高级技巧,帮助研究者更好地优化模型训练。
256 4
在Pytorch中为不同层设置不同学习率来提升性能,优化深度学习模型
|
4月前
|
机器学习/深度学习 监控 PyTorch
PyTorch 模型调试与故障排除指南
在深度学习领域,PyTorch 成为开发和训练神经网络的主要框架之一。本文为 PyTorch 开发者提供全面的调试指南,涵盖从基础概念到高级技术的内容。目标读者包括初学者、中级开发者和高级工程师。本文探讨常见问题及解决方案,帮助读者理解 PyTorch 的核心概念、掌握调试策略、识别性能瓶颈,并通过实际案例获得实践经验。无论是在构建简单神经网络还是复杂模型,本文都将提供宝贵的洞察和实用技巧,帮助开发者更高效地开发和优化 PyTorch 模型。
60 3
PyTorch 模型调试与故障排除指南
|
3月前
|
存储 并行计算 PyTorch
探索PyTorch:模型的定义和保存方法
探索PyTorch:模型的定义和保存方法
|
5月前
|
机器学习/深度学习 PyTorch 编译器
PyTorch 与 TorchScript:模型的序列化与加速
【8月更文第27天】PyTorch 是一个非常流行的深度学习框架,它以其灵活性和易用性而著称。然而,当涉及到模型的部署和性能优化时,PyTorch 的动态计算图可能会带来一些挑战。为了解决这些问题,PyTorch 引入了 TorchScript,这是一个用于序列化和优化 PyTorch 模型的工具。本文将详细介绍如何使用 TorchScript 来序列化 PyTorch 模型以及如何加速模型的执行。
203 4
|
5月前
|
机器学习/深度学习 边缘计算 PyTorch
PyTorch 与边缘计算:将深度学习模型部署到嵌入式设备
【8月更文第29天】随着物联网技术的发展,越来越多的数据处理任务开始在边缘设备上执行,以减少网络延迟、降低带宽成本并提高隐私保护水平。PyTorch 是一个广泛使用的深度学习框架,它不仅支持高效的模型训练,还提供了多种工具帮助开发者将模型部署到边缘设备。本文将探讨如何将PyTorch模型高效地部署到嵌入式设备上,并通过一个具体的示例来展示整个流程。
889 1