一款通过字幕来剪切视频的神器 AutoCut

简介: 只需要编辑文本文件即可完成剪切。

AutoCut 对视频自动生成字幕。然后选择需要保留的句子,AutoCut 将对视频中对应的片段裁切并保存。无需使用视频编辑软件,只需要编辑文本文件即可完成剪切。

640.jpg

使用例子

假如录制的视频放在 2022-11-04/ 这个文件夹里。那么运行

autocut -d 2022-11-04

提示:如果你使用 OBS 录屏,可以在 设置->高级->录像->文件名格式 中将空格改成 /,即 %CCYY-%MM-%DD/%hh-%mm-%ss。那么视频文件将放在日期命名的文件夹里。

AutoCut 将持续对这个文件夹里视频进行字幕抽取和剪切。例如,刚完成一个视频录制,保存在 11-28-18.mp4。AutoCut 将生成 11-28-18.md。在里面选择需要保留的句子后,AutoCut 将剪切出 11-28-18_cut.mp4,并生成 11-28-18_cut.md 来预览结果。

可以使用任何的 Markdown 编辑器。例如常用 VS Code 和 Typora。下图是通过 Typora 来对 11-28-18.md 编辑。

640.png

全部完成后在 autocut.md 里选择需要拼接的视频后,AutoCut 将输出 autocut_merged.mp4 和对应的字幕文件。

安装

首先安装 Python 包

pip install git+https://github.com/mli/autocut.git

本地安装测试

git clone https://github.com/mli/autocut
cd autocut
pip install .

上面将安装 pytorch。如果需要 GPU 运行,且默认安装的版本不匹配的话,可以先安装 Pytorch。

另外需要安装 ffmpeg

# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg

# on Arch Linux
sudo pacman -S ffmpeg

# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg

# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg

Docker 安装
首先将项目克隆到本地。

git clone https://github.com/mli/autocut.git

安装 CPU 版本
进入项目根目录,然后构建 docker 映像。

docker build -t autocut .

运行下面的命令创建 docker 容器,就可以直接使用了。

docker run -it --rm -v E:\autocut:/autocut/video autocut /bin/bash

其中 -v 是将主机存放视频的文件夹 E:\autocut 映射到虚拟机的 /autocut/video 目录。E:\autocut 是主机存放视频的目录,需修改为自己主机存放视频的目录。

安装 GPU 版本
使用 GPU 加速需要主机有 Nvidia 的显卡并安装好相应驱动。然后在项目根目录,执行下面的命令构建 docker 映像。

docker build -f ./Dockerfile.cuda -t autocut-gpu .

使用 GPU 加速时,运行 docker 容器需添加参数 --gpus all。

docker run --gpus all -it --rm -v E:\autocut:/autocut/video autocut-gpu

提示
1、讲得流利的视频的转录质量会高一些,这因为是 Whisper 训练数据分布的缘故。对一个视频,可以先粗选一下句子,然后在剪出来的视频上再剪一次。
2、最终视频生成的字幕通常还需要做一些小编辑。可以直接编辑 md 文件(比 srt 文件更紧凑,且嵌入了视频)。然后使用 autocut -s 22-52-00.md 22-52-00.srt 来生成更新的字幕 22-52-00_edited.srt。注意这里会无视句子是不是被选中,而是全部转换成 srt。
3、最终视频生成的字幕通常还需要做一些小编辑。但 srt 里面空行太多。可以使用 autocut -s 22-52-00.srt 来生成一个紧凑些的版本 22-52-00_compact.srt 方便编辑(这个格式不合法,但编辑器,例如 VS Code,还是会进行语法高亮)。编辑完成后,autocut -s 22-52-00_compact.srt 转回正常格式。
4、用 Typora 和 VS Code 编辑 Markdown 都很方便。他们都有对应的快捷键 mark 一行或者多行。但 VS Code 视频预览似乎有点问题。
5、视频是通过 ffmpeg 导出。在 Apple M1 芯片上它用不了 GPU,导致导出速度不如专业视频软件。

传送门
开源协议:Apache2.0

开源地址:https://github.com/mli/autocut

关注微信公众号「开源技术专栏」了解更多!


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
8月前
|
人工智能 自然语言处理 数据可视化
比Sora更王炸,LTX Studio文本生成超25秒,视频自带背景音乐、转场等效果!
【2月更文挑战第13天】比Sora更王炸,LTX Studio文本生成超25秒,视频自带背景音乐、转场等效果!
161 3
比Sora更王炸,LTX Studio文本生成超25秒,视频自带背景音乐、转场等效果!
|
5月前
PPT 快速生成图片墙
PPT 快速生成图片墙
30 2
|
5月前
Typora 一行显示多图
Typora 一行显示多图
34 0
|
5月前
PPT 配色方法
PPT 配色方法
95 0
|
6月前
|
语音技术
word文档生成视频,自动配音、背景音乐、自动字幕,另类创作工具
这是一个Markdown格式的摘要: --- 这款工具独特之处在于它允许用户通过在Word文档中添加文字和图片来创作视频,包括配音、字幕和背景音乐。软件界面虽显复杂,但生成视频只需四步:选择Word文档、添加音乐、设置保存路径、点击开始生成。最新版1.15b改进了字幕自动换行功能,支持手动调整,修复了网络错误、文件路径问题和图片缩放等错误。软件提供永久免费使用,支持离线生成(需自建TTS),并鼓励用户自定义TTS和特效插件。下载链接可在官方页面找到。 --- 请注意,实际字符数可能会根据Markdown格式的要求略有变动,但主要内容已经压缩在这个范围内。
|
7月前
技术经验分享:AVFoundation播放视频时显示字幕,切换音轨
技术经验分享:AVFoundation播放视频时显示字幕,切换音轨
57 0
|
8月前
|
Web App开发 前端开发 JavaScript
折腾Chrome插件,简单地让文本上色~
折腾Chrome插件,简单地让文本上色~
83 0
|
人工智能
【必备工具】兔哥视频助手,一键配音、字幕、配图,让你的视频秒变高大上!
通过输入文字,自动生成视频,让你的视频制作更加高效。
1465 0
|
数据安全/隐私保护
五、用PhotoShop去图片的水印 | 微课系列教程
图片,是我们PPT、微课必不可少的素材。在之前的课程中,给大家讲过如何找大图、高清图等,但从网站上找到的一些图片,总是多多少少有一些水印之类的杂物,严重影响我们的使用,今天这一课,就跟着我来一起用Ps去掉图片中你不想要的部分吧!
128 0
Photoshop使用路径排版美化文字创作图案
Photoshop使用路径排版美化文字创作图案
117 0