ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

功能:将多种电子书格式转换为有声书格式,支持高质量文本到语音转换。
多语言支持:支持 16 种语言,适应不同用户的需要。
易用性:提供命令行、Web 界面和 Docker 容器等多种使用方式。

正文(附运行示例)

ebook2audiobookXTTS 是什么

公众号: 蚝油菜花 - ebook2audiobookXTTS

ebook2audiobookXTTS 是一款开源的 AI 工具,旨在将电子书转换为有声书。该工具支持多种电子书格式,如 EPUB、PDF、MOBI 等,并利用 Coqui XTTS 技术实现高质量的文本到语音转换。

ebook2audiobookXTTS 不仅支持 16 种语言,还提供了命令行、Web 界面和 Docker 容器等多种使用方式,使得用户可以方便地进行操作。转换后的有声书格式为 .m4b,包含章节和元数据,便于在各种设备上收听。

ebook2audiobookXTTS 的主要功能

  • 格式转换:将多种电子书格式(如 EPUB、PDF、MOBI 等)转换为有声书格式(.m4b)。
  • 高质量 TTS:利用 Coqui XTTS 技术,实现接近真人发音的高质量文本到语音转换。
  • 多语言支持:支持包括英语、中文在内的 16 种语言,适应不同用户的需要。
  • 章节识别:自动识别电子书中的章节,并在有声书中创建相应的章节标记。
  • 元数据保留:保留电子书的元数据,如标题、作者、封面等,便于管理和识别。
  • 易用性:提供命令行界面、Web 界面和 Docker 容器等多种使用方式,方便用户操作。

ebook2audiobookXTTS 的技术原理

  • Calibre:Calibre 是一个强大的电子书管理和转换工具,能够处理多种电子书格式,包括 EPUB、MOBI、PDF 等。在 ebook2audiobookXTTS 中,Calibre 将电子书转换为文本格式,这是后续文本到语音(TTS)转换的前提。
  • Coqui XTTS:Coqui XTTS 是 Mozilla 的 Coqui 团队推出的一个文本到语音(TTS)系统。它利用深度学习技术生成自然听起来的语音,特点是能够创建具有特定声音特征的合成语音,在声音克隆和多语言支持方面表现出色。

如何运行 ebook2audiobookXTTS

安装依赖

  1. 安装 Python 3.x:从 Python.org 下载并安装。
  2. 安装 Calibre
  • Ubuntusudo apt-get install -y calibre
  • macOSbrew install calibre
  • Windows:在管理员 PowerShell 中运行 choco install calibre
  1. 安装 FFmpeg
  • Ubuntusudo apt-get install -y ffmpeg
  • macOSbrew install ffmpeg
  • Windows:在管理员 PowerShell 中运行 choco install ffmpeg
  1. 安装 Python 包
    pip install coqui-tts==0.24.2 pydub nltk beautifulsoup4 ebooklib tqdm gradio==4.44.0
    python -m nltk.downloader punkt
    python -m nltk.downloader punkt_tab
    

运行示例

启动 Gradio Web 界面

  1. 运行脚本
    python app.py
    
  2. 打开 Web 应用:点击终端中提供的 URL 访问 Web 应用并转换电子书。

基本无头模式使用

python app.py --headless True --ebook <path_to_ebook_file> --voice [path_to_voice_file] --language [language_code]

使用 Docker

运行 Docker 容器

  • 仅使用 CPU
    docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
    
  • 使用 GPU 加速
    docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobookxtts:huggingface python app.py
    

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
7月前
|
自然语言处理 开发者 异构计算
社区供稿 | Llama3-8B中文版!OpenBuddy发布新一代开源中文跨语言模型
此次发布的是在3天时间内,我们对Llama3-8B模型进行首次中文跨语言训练尝试的结果:OpenBuddy-Llama3-8B-v21.1-8k。
|
7月前
|
人工智能 达摩院 自然语言处理
超好用的开源模型平台,ModelScope阿里达摩院
超好用的开源模型平台,ModelScope阿里达摩院
492 1
|
7月前
|
人工智能 测试技术 编译器
Python潮流周刊#9:如何在本地部署开源大语言模型?
Python潮流周刊#9:如何在本地部署开源大语言模型?
129 2
|
机器学习/深度学习 人工智能
一键生成PPT的AI工具介绍
一键生成PPT的AI工具介绍
1158 0
|
机器学习/深度学习 人工智能 API
LabVIEW AI开发者福音:LabVIEW OpenVINO AI加速工具包,不来看看?
LabVIEW AI开发者福音:LabVIEW OpenVINO AI加速工具包,不来看看?
326 1
LabVIEW AI开发者福音:LabVIEW OpenVINO AI加速工具包,不来看看?
|
Web App开发 人工智能 API
工具推荐:一款强大的AI翻译插件
工具推荐:一款强大的AI翻译插件
1102 0
工具推荐:一款强大的AI翻译插件
|
6月前
|
Web App开发 机器学习/深度学习 人工智能
详细解读AI测试之Applitools入门教程
详细解读AI测试之Applitools入门教程
107 0
|
7月前
|
人工智能 搜索推荐
有道云笔记ai工具使用
尝试体验AI助手的多个功能,包括头脑风暴、撰写文章、构建大纲、列举优缺点、解释说明和创建待办事项。在头脑风暴中输入关键词如“AI写作”,AI会生成相关内容,并提供继续写作、内容润色等选项。在中断后,AI能接续写作,展现了一定的连续性和实用性。此外,还展示了创建待办事项列表的功能。
117 0
|
7月前
|
JavaScript 前端开发 API
如何翻译 Markdown 文件?-2- 几种商业及开源解决方案介绍
如何翻译 Markdown 文件?-2- 几种商业及开源解决方案介绍
|
人工智能 语音技术 开发者
6.0特色功能:AI部署工具简介|学习笔记
快速学习6.0特色功能:AI部署工具简介
6.0特色功能:AI部署工具简介|学习笔记

热门文章

最新文章