模型:语音合成-中文-多情感领域-16k-多发音人 语速调节

语音合成模型:语音合成-中文-多情感领域-16k-多发音人speech_sambert-hifigan_tts_zh-cn_16k,是否支持ssml标记语言中的语速、音高、音量、停顿的调节?目前测试中的voice属性可以调节,但rate、pitch、volume,还有也测试不起作用?这个模型支持调节语速等参数吗?
相关代码:
ssml_text = fssml_text = f'''
欢迎使用达摩院推出的语音模型'''
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=ssml_text, voice='zhibei_emo')
wav = output[OutputKeys.OUTPUT_WAV]

展开
收起
游客sjgoxolfnpuvo 2024-12-04 11:20:34 67 分享 版权
1 条回答
写回答
取消 提交回答
  • 您可以调整语音合成模型中的语速参数来实现语速调节。具体操作和参数设置可参考阿里云语音合成文档:语音合成文档。如果对您有帮助的话,可以帮忙采纳一下。谢谢。

    2025-02-10 13:32:36
    赞同 62 展开评论

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理