语音AI离线语音合成,支持时间戳吗?有支持C++SDK的计划吗?
语音合成服务在输出音频流的同时,可输出每个汉字/英文单词在音频中的时间位置,即时间戳,时间戳功能又叫字级别音素边界接口。该时间信息可用于驱动虚拟人口型、做视频配音字幕等。 - 只有支持字级别音素边界接口的发音人才有此功能。
由于HTTP协议传输方式的限制,短文本语音合成RESTful API不支持返回时间戳信息。
TTS服务返回的字幕是基于发音的,所以不能直接用于上屏,需要使用您的原始文本。
如果用于上屏,可以基于返回的结果,定位每个句子的句首和句尾时间戳。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。