请教一下,语音合成的问题
举例,哈
'-' 这个 斜杠 在不同句子里面读不同的音调。但是sambert模型大部分都读错了
附:德荷大赛对决一览2012年欧洲杯小组赛德国2-1荷兰2004年欧洲杯小组赛(2-1 读成 zhi 应该读bi)
隶属于VX-23测试中队的F-35C“闪电II”舰载隐身战机与DDG-1000隐身战舰合影。(- 读成 gang 应该不读)
堪萨斯州的彩票玩家密苏里曾于2009年9月9日投注了号码“9-9-9”, (- 读成 gang 应该不读)
2001年8月-2002年:协助宾利欧陆GT轿跑车的设计工作,(- 读成 fu 应该读dao)
类似于这种读错的符号,或者其他字母符号
这个通过sambert模型,训练新的定向数据,能解决吗?
将以上的参数变成正确的输出
还是说,语音合成模型只能训练音色,不能改变语义
请教一下,语音合成的问题
举例,哈
'-' 这个 斜杠 在不同句子里面读不同的音调。但是sambert模型大部分都读错了
附:德荷大赛对决一览2012年欧洲杯小组赛德国2-1荷兰2004年欧洲杯小组赛(2-1 读成 zhi 应该读bi)
隶属于VX-23测试中队的F-35C“闪电II”舰载隐身战机与DDG-1000隐身战舰合影。(- 读成 gang 应该不读)
堪萨斯州的彩票玩家密苏里曾于2009年9月9日投注了号码“9-9-9”, (- 读成 gang 应该不读)
2001年8月-2002年:协助宾利欧陆GT轿跑车的设计工作,(- 读成 fu 应该读dao)
类似于这种读错的符号,或者其他字母符号
这个通过sambert模型,训练新的定向数据,能解决吗?
将以上的参数变成正确的输出
还是说,语音合成模型只能训练音色,不能改变语义