开发者社区 > ModelScope模型即服务 > 语音 > 正文

TTS 训练模型的文本标注中的 汉字之间#1,#3,#4 是什么意思呢?或者是采用什么标注工具吗?

SambertHifigan语音合成-中文-多人预训练-16k 训练模型的数据集中文本标注的部分,汉字之间的 #1,#3,#4 是什么意思? 这部分是必须有的吗? 或者是可以使用什么数据标注工具直接标注数据呢? 另外,每段音频的长度限制不超过多少呢? 感谢!!!

展开
收起
游客yh6trrr7vogci 2022-12-26 15:15:52 1139 0
1 条回答
写回答
取消 提交回答
  • "#1" "#3" 这些是停顿标记,"#1"表示短暂停顿 “#3”表示较长停顿 “#4”一般用作句末标记。 相关的韵律标注对训练来说是必要的,会影响模型的合成效果,您可以咨询数据供应商获得专业意见。 训练用音频建议控制在10秒以内,以最大化训练效率。

    2022-12-26 16:50:48
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载