SambertHifigan语音合成-中文-多人预训练-16k 训练模型的数据集中文本标注的部分,汉字之间的 #1,#3,#4 是什么意思? 这部分是必须有的吗? 或者是可以使用什么数据标注工具直接标注数据呢? 另外,每段音频的长度限制不超过多少呢? 感谢!!!
"#1" "#3" 这些是停顿标记,"#1"表示短暂停顿 “#3”表示较长停顿 “#4”一般用作句末标记。 相关的韵律标注对训练来说是必要的,会影响模型的合成效果,您可以咨询数据供应商获得专业意见。 训练用音频建议控制在10秒以内,以最大化训练效率。