开发者社区 > ModelScope模型即服务 > 语音 > 正文

模型:语音合成-中文-多情感领域-16k-多发音人 语速调节

语音合成模型:语音合成-中文-多情感领域-16k-多发音人speech_sambert-hifigan_tts_zh-cn_16k,是否支持ssml标记语言中的语速、音高、音量、停顿的调节?目前测试中的voice属性可以调节,但rate、pitch、volume,还有也测试不起作用?这个模型支持调节语速等参数吗?
相关代码:
ssml_text = fssml_text = f'''
欢迎使用达摩院推出的语音模型'''
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=ssml_text, voice='zhibei_emo')
wav = output[OutputKeys.OUTPUT_WAV]

展开
收起
游客sjgoxolfnpuvo 2024-12-04 11:20:34 46 0
0 条回答
写回答
取消 提交回答

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载