图片、视频超分模型RealBasicVSR安装使用 | 机器学习

简介: 图片、视频超分模型RealBasicVSR安装使用 | 机器学习

前言

很久没更新这个专栏了,最近比较忙。前段时间看到了这个模型觉着很有意思,弄下来自己玩了玩,但是没时间写文章,一直搁置到现在。


废话不多说,先上Github地址: RealBasicVSR地址


image.png


从给出的效果来看,还是很不错的,左侧是超分后的画面,右边是原画质,得到明显提升。下面我说一下我的安装过程,还有一些使用中的踩坑,让大家去测试项目的时候可以提前规避。


安装

项目拉下来之后,我们先打开README,看看说明。


image.png


安装的步骤不多,但是还是有一些坑的,下面是我的安装步骤,如果你们自己安装的有问题的话,可以参考一下我的步骤。


1、虚拟环境创建

作者没有给出需要的python版本,这里我用的python3.8


conda create -n real python=3.8


conda activate real


2、安装pytorch

这里本来我以为我现在的最新版本可以跑的,后面发现不行,所以老老实实的按照作者的版本安装。


conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.1 -c pytorch


3、安装openmim

这里没什么好说的,装就完了。


pip install openmim -i https://pypi.douban.com/simple


4、安装mmcv-full

同上


mim install mmcv-full


5、安装mmedit

同上


pip install mmedit -i https://pypi.douban.com/simple


6、安装scipy

这个作者没写,但是要装。


pip install scipy -i https://pypi.douban.com/simple


7、模型下载


image.png

嗯,在外网比较难下,我下好了,放到我的百度云盘。


链接:https://pan.baidu.com/s/1EFCk5SUsE9BTPR5rlVnKtw

提取码:TUAN


在项目中创建文件夹checkpoints,把下载的文件放进去。如下图


image.png



使用

ok,环境装好了,我们看看怎么使用。


image.png


作者提供了图片文件夹处理方式和视频处理方式,我们挨个测一下。


图片超分

我就不准备用作者提供的demo图了,我自己找了一张,如下图。

image.png



图片尺寸


image.png

放置目录如下

image.png



执行命令如下


python inference_realbasicvsr.py configs/realbasicvsr_x4.py checkpoints/RealBasicVSR_x4.pth data/demo_001 results/demo_001


执行结果


2022-05-08 10:57:06,303 - mmedit - INFO - load checkpoint from torchvision path: torchvision://vgg19

load checkpoint from local path: checkpoints/RealBasicVSR_x4.pth

/home/zhangmaolin/.local/lib/python3.7/site-packages/torch/functional.py:445: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at  ../aten/src/ATen/native/TensorShape.cpp:2157.)

 return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]


结果图如下



可以看出明显的清楚了很多。


结果图尺寸


image.png


视频超分

然后我们看看视频超分的情况,这部分是有一些坑的,后面会说到。


首先我准备了一个视频,视频分别率如下。


image.png


可以看到视频分辨率540p。


执行命令如下,里面有作者给出样例没有的参数,我后面注意里面会解释。


python inference_realbasicvsr.py configs/realbasicvsr_x4.py checkpoints/RealBasicVSR_x4.pth data/12345.mp4 results/demo_123.mp4 --fps=25 --max_seq_len=2


执行结果


2022-05-08 11:02:01,023 - mmedit - INFO - load checkpoint from torchvision path: torchvision://vgg19

load checkpoint from local path: checkpoints/RealBasicVSR_x4.pth

/home/zhangmaolin/.local/lib/python3.7/site-packages/torch/functional.py:445: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at  ../aten/src/ATen/native/TensorShape.cpp:2157.)

 return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]


最终视频分辨率情况


image.png


注意


1、首先,视频原长度是2分钟的,我截取到5s的视频进行超分处理的。不然会显存溢出。


2、--max_seq_len=2参数也是为了避免显存溢出,总的来看,这个模型不太适合直接跑视频,最好的方式还是跑图片序列,然后最后压缩图片为视频比较好。


压缩图片为对比视频样例

作者给了一个demo程序可以将输出的图片压缩为前后对比视频,如下图说明。

image.png



我测试了一下,代码这里需要改动一下,代码框出的部分需要把注释取消。


image.png


对比视频如下图,左边为超分后效果,右边为原图效果。


image.png


总结

总的来说,该模型处理图片还是效果很好的,可以稍微改造一下,我看有没有空。


分享:


       人类之所以会去照顾其他生物,是因为他感到空虚。之所以会想保护环境,是因为他不想被环境毁灭。——《寄生兽》


相关文章
|
20天前
|
机器人
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领精美计时器
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领精美计时器
72 3
|
8天前
|
机器学习/深度学习 数据采集 Python
从零到一:手把手教你完成机器学习项目,从数据预处理到模型部署全攻略
【10月更文挑战第25天】本文通过一个预测房价的案例,详细介绍了从数据预处理到模型部署的完整机器学习项目流程。涵盖数据清洗、特征选择与工程、模型训练与调优、以及使用Flask进行模型部署的步骤,帮助读者掌握机器学习的最佳实践。
31 1
|
12天前
|
机器学习/深度学习 数据采集 监控
如何使用机器学习模型来自动化评估数据质量?
如何使用机器学习模型来自动化评估数据质量?
|
17天前
|
机器人
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领 200个 精美计时器等你领
1024 云上见 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建 “文旅领域知识问答机器人” 领 200个 精美计时器等你领
61 2
|
25天前
|
机器学习/深度学习 前端开发 网络架构
Django如何调用机器学习模型进行预测
Django如何调用机器学习模型进行预测
49 5
|
23天前
|
机器学习/深度学习 算法 Python
深度解析机器学习中过拟合与欠拟合现象:理解模型偏差背后的原因及其解决方案,附带Python示例代码助你轻松掌握平衡技巧
【10月更文挑战第10天】机器学习模型旨在从数据中学习规律并预测新数据。训练过程中常遇过拟合和欠拟合问题。过拟合指模型在训练集上表现优异但泛化能力差,欠拟合则指模型未能充分学习数据规律,两者均影响模型效果。解决方法包括正则化、增加训练数据和特征选择等。示例代码展示了如何使用Python和Scikit-learn进行线性回归建模,并观察不同情况下的表现。
197 3
|
23天前
|
人工智能 算法 测试技术
PAI 大语言模型评测平台现已支持裁判员模型评测
本文将为您介绍如何在 PAI 大语言模型评测平台,基于裁判员模型,评价开源模型或者微调后模型的性能。该功能限时免费,欢迎使用。
|
23天前
|
机器学习/深度学习 数据挖掘 Serverless
手把手教你全面评估机器学习模型性能:从选择正确评价指标到使用Python与Scikit-learn进行实战演练的详细指南
【10月更文挑战第10天】评估机器学习模型性能是开发流程的关键,涉及准确性、可解释性、运行速度等多方面考量。不同任务(如分类、回归)采用不同评价指标,如准确率、F1分数、MSE等。示例代码展示了使用Scikit-learn库评估逻辑回归模型的过程,包括数据准备、模型训练、性能评估及交叉验证。
44 1
|
25天前
|
机器学习/深度学习 计算机视觉 Python
模型预测笔记(三):通过交叉验证网格搜索机器学习的最优参数
本文介绍了网格搜索(Grid Search)在机器学习中用于优化模型超参数的方法,包括定义超参数范围、创建参数网格、选择评估指标、构建模型和交叉验证策略、执行网格搜索、选择最佳超参数组合,并使用这些参数重新训练模型。文中还讨论了GridSearchCV的参数和不同机器学习问题适用的评分指标。最后提供了使用决策树分类器进行网格搜索的Python代码示例。
39 1
|
5天前
|
机器学习/深度学习 算法
探索机器学习模型的可解释性
【10月更文挑战第29天】在机器学习领域,一个关键议题是模型的可解释性。本文将通过简单易懂的语言和实例,探讨如何理解和评估机器学习模型的决策过程。我们将从基础概念入手,逐步深入到更复杂的技术手段,旨在为非专业人士提供一扇洞悉机器学习黑箱的窗口。