ModelScope小助手-渡渡航_个人页

ModelScope小助手-渡渡航

文章

问答

视频

个人介绍

暂无个人介绍

擅长的技术

Java

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

Clouder
- Apsara Clouder云计算专项技能认证：云服务器ECS入门
  获得于2023-02-01 16:43:14

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

暂无更多信息

正在加载, 请稍后...

暂无更多信息

回答了问题 2023-09-19

linux下，ttsfrd和kwsbp包安装失败

你的python版本是多少？

赞0 踩0 评论0
回答了问题 2023-05-10

运行语音合成模型的官网代码示例报错

请更新modelscope版本到最新，并使用https://modelscope.cn/models/damo/speech_sambert-hifigan_tts_zhiyan_emo_zh-cn_16k/summary下最新sample code进行尝试

赞0 踩0 评论0
回答了问题 2023-05-10

根据文字合成语音，有时候一个句子没录完就突然结束了，这是为什么?

是指创空间上面么？可能是服务内部问题，请稍后再试

赞0 踩0 评论0
回答了问题 2023-05-10

模型训练完后，拿到model_id了，后面怎么直接调用这个model_id去合成语音？

请参考https://modelscope.cn/models/damo/speech_personal_sambert-hifigan_nsf_tts_zh-cn_pretrain_16k/summary中关于“体验模型合成效果”这一节的代码

赞0 踩0 评论0
回答了问题 2023-05-10

KAN-TTS 在 conda 环境下无法安装 ttsfrd

请描述下conda环境的python版本？以及贴一下完整的命令及报错信息。

赞0 踩0 评论1
回答了问题 2023-05-10

在使用text_to_wav.py进行推理时，使用--lang Sichuan 参数出现以下错误：

kantts相关问题，建议直接在kantts github中提issue给开发者

赞0 踩0 评论0
回答了问题 2023-05-10

请问该四川方言模型是从头开始训练的吗？能否直接在个性化语音合成模型上进行微调？

直接基于四川话这个模型finetune即可，不能在个性化语音合成模型上进行微调

赞0 踩0 评论0
回答了问题 2023-05-10

安装ttsfrd库提示找不到版本

ttsfrd还在，请检查你的机器是否是x86 linux，以及python为3.7-3.10中的版本

赞0 踩0 评论1
回答了问题 2023-05-10

可以支持多人的音频同时FineTune训练吗？

支持，建议钉钉加群：20015016512 询问群主相关方法

赞0 踩0 评论0
回答了问题 2023-05-10

运行官网示例报错！！

请pip卸载当前kantts，然后通过下述url下载kantts，modelscope的kantts和github上打包的略有区别。 https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/TTS/requirements/kantts-0.0.1-py3-none-any.whl

赞0 踩0 评论0
回答了问题 2023-05-10

PTTS-basemodel微调报错

ptts finetune依赖gpu，请在gpu环境下使用

赞0 踩0 评论0
回答了问题 2023-05-10

录音时使用的 20个句子的选取有什么特殊的地方吗？还是任意选择20个橘子都可以呢？

任意中文语句长度和展示的那20句差不多即可，现在中英混还有点问题，暂时不支持

赞0 踩0 评论0
回答了问题 2023-04-03

在NoteBook中训练个性化语音合成模型报错

PTTS微调训练需要GPU

赞0 踩0 评论1
回答了问题 2023-04-03

No such file or directory: wav_pre/temp.wav'

输入音频确认是16k16bit的么？这个看上去是走了resample流程，然后没有装sox导致resample失败了，你可以在ubuntu上apt-get install sox然后再试试看？

赞1 踩0 评论1
回答了问题 2023-04-03

流程里少了一步，把config.yaml里的speaker_list:后面改成数据集的speaker

谢谢提醒，我们后续修改下。

赞0 踩0 评论0
回答了问题 2023-04-03

请问这一块的扩充epoch是在哪部分代码里

stage0=training_stage voice=test_male_ptts_feats cat $stage0/$voice/am_valid.lst >> $stage0/$voice/am_train.lst lines=0 while [ $lines -lt 3200 ] do shuf $stage0/$voice/am_train.lst >> $stage0/$voice/am_train.lst.tmp lines=$(wc -l

赞0 踩0 评论0
回答了问题 2023-04-03

按官网的例子在Notebook上运行的，trainer.train() 报了这个错

训练需要GPU，看上去是因为torch.cuda.is_available()为false导致

赞0 踩0 评论0
回答了问题 2023-03-15

Sambert-Hifigan模型如何使用实时流式合成

我们提供的python推理代码目前没有支持流式输出，但是开启causal训练的hifigan模型本身是支持流式推理的在runtime上需要做相应的改动即可支持流式输出

赞0 踩0 评论0
回答了问题 2023-03-15

pip install ttsfrd 报错

目前ttsfrd包仅linux x86_64环节下的py36到py310版本，其他平台或python版本暂不支持。

赞0 踩1 评论1
回答了问题 2022-11-28

GPU相比CPU并没有明显提高uniasr语音识别和语音合成的推理速度

是的，gpu对训练有较好的提升效果，对目前代码的推理来说加速有限，目前代码的推理纯粹实现在pytorch或tf上，建议使用其他推理框架（比如tensorrt）来针对一些模型进行加速。

赞1 踩0 评论1

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

ModelScope小助手-渡渡航_个人页

个人介绍

擅长的技术

linux下，ttsfrd和kwsbp包安装失败

运行语音合成模型的官网代码示例报错

根据文字合成语音，有时候一个句子没录完就突然结束了，这是为什么?

模型训练完后，拿到model_id了，后面怎么直接调用这个model_id去合成语音？

KAN-TTS 在 conda 环境下无法安装 ttsfrd

在使用text_to_wav.py进行推理时，使用--lang Sichuan 参数出现以下错误：

请问该四川方言模型是从头开始训练的吗？能否直接在个性化语音合成模型上进行微调？

安装ttsfrd库提示找不到版本

可以支持多人的音频同时FineTune训练吗？

运行官网示例报错！！

PTTS-basemodel微调报错

录音时使用的 20个 句子的选取有什么特殊的地方吗？还是任意选择20个橘子都可以呢？

在NoteBook中训练个性化语音合成模型报错

No such file or directory: wav_pre/temp.wav'

流程里少了一步，把config.yaml里的speaker_list:后面改成数据集的speaker

请问这一块的扩充epoch是在哪部分代码里

按官网的例子在Notebook上运行的，trainer.train() 报了这个错

Sambert-Hifigan模型 如何使用实时流式合成

pip install ttsfrd 报错

GPU相比CPU并没有明显提高uniasr语音识别和语音合成的推理速度

录音时使用的 20个句子的选取有什么特殊的地方吗？还是任意选择20个橘子都可以呢？

Sambert-Hifigan模型如何使用实时流式合成