开发者社区> 问答> 正文

阿里云语音AI中请问长文本语音实时合成,开启时间戳功能怎么让返回是一段一段的句子,而不是一个时间位置

阿里云语音AI中请问长文本的语音实时合成,开启了时间戳功能怎么能让返回的是一段一段的句子,而不是一个一个的字的时间位置呀?

展开
收起
十一0204 2023-07-23 19:42:47 158 0
3 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    可以通过对返回的文本进行切割和处理来实现。

    具体操作步骤如下:

    在调用语音实时合成API时,设置“返回格式”参数为“json”,并开启时间戳功能。

    获取API返回的JSON格式结果,其中包含了每个字的文本内容和时间戳信息。

    对返回的文本内容进行切割和处理,将其转换为一段一段的句子。可以根据标点符号、停顿等因素来进行切割和处理。

    将分割后的文本内容传入语音合成API,进行语音合成。

    需要注意的是,对返回的文本内容进行切割和处理需要一定的技术能力和知识储备。

    2023-07-27 20:13:31
    赞同 展开评论 打赏
  • 意中人就是我呀!

    时间戳是字级别的 可以不开时间戳。
    8bb8ca7c8fe12470aa6da79d7e35f1df.png
    1f21e52b26f51f43bad2fb84fedaa91c.png
    此回答整理至钉群“阿里语音AI【5群】”"

    2023-07-26 10:34:31
    赞同 展开评论 打赏
  • 问题1:如果你在阿里云语音AI的长文本语音实时合成服务中开启了时间戳功能,返回的时间戳默认是以字为单位的。这是因为语音合成是基于单个字进行处理和生成音频的。

    问题2:如果你需要一句一句的时间戳,而不是单个字的时间位置,可以考虑进行后处理。你可以将返回的时间戳根据句子的分隔符进行划分,将每个句子的时间位置整合到一起。例如,你可以使用句子分隔符(如句号、问号等)来识别句子边界,并将相应的时间位置关联到每个句子。

    问题3:阿里云语音AI的长文本语音实时合成服务目前没有提供同步的方式来直接返回一句一句的时间戳。如前所述,你可能需要进行后处理来实现句子级别的时间戳。

    2023-07-23 20:55:21
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载
释放算力潜能加速应用构建Serverless为AI创新提速 立即下载
智算时代,基于 Kubernetes 落地云原生 AI 立即下载