阿里云语音AI中请问长文本语音实时合成，开启时间戳功能怎么让返回是一段一段的句子，而不是一个时间位置

阿里云语音AI中请问长文本的语音实时合成，开启了时间戳功能怎么能让返回的是一段一段的句子，而不是一个一个的字的时间位置呀？

展开

收起

十一0204 2023-07-23 19:42:47 309 版权

3 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

可以通过对返回的文本进行切割和处理来实现。

具体操作步骤如下：

在调用语音实时合成API时，设置“返回格式”参数为“json”，并开启时间戳功能。

获取API返回的JSON格式结果，其中包含了每个字的文本内容和时间戳信息。

对返回的文本内容进行切割和处理，将其转换为一段一段的句子。可以根据标点符号、停顿等因素来进行切割和处理。

将分割后的文本内容传入语音合成API，进行语音合成。

需要注意的是，对返回的文本内容进行切割和处理需要一定的技术能力和知识储备。

2023-07-27 20:13:31

赞同展开评论
意中人jswy

意中人就是我呀！

时间戳是字级别的可以不开时间戳。

此回答整理至钉群“阿里语音AI【5群】”"

2023-07-26 10:34:31

赞同展开评论
Star时光

问题1：如果你在阿里云语音AI的长文本语音实时合成服务中开启了时间戳功能，返回的时间戳默认是以字为单位的。这是因为语音合成是基于单个字进行处理和生成音频的。

问题2：如果你需要一句一句的时间戳，而不是单个字的时间位置，可以考虑进行后处理。你可以将返回的时间戳根据句子的分隔符进行划分，将每个句子的时间位置整合到一起。例如，你可以使用句子分隔符（如句号、问号等）来识别句子边界，并将相应的时间位置关联到每个句子。

问题3：阿里云语音AI的长文本语音实时合成服务目前没有提供同步的方式来直接返回一句一句的时间戳。如前所述，你可能需要进行后处理来实现句子级别的时间戳。

2023-07-23 20:55:21

赞同展开评论

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

阿里云语音AI中请问长文本语音实时合成，开启时间戳功能怎么让返回是一段一段的句子，而不是一个时间位置

相关文章