开发者社区> 问答> 正文

在阿里语音AI长文本设置enable_subtitle后,返回的每个句子是怎么拆分的?

在阿里语音AI长文本设置enable_subtitle后,返回的每个句子是怎么拆分的?以标点符号?长文本转语音,异步长文本。

展开
收起
三分钟热度的鱼 2023-05-23 11:26:17 163 0
3 条回答
写回答
取消 提交回答
  • lQLPJwUYEDr0t7bNA5nNB0ewbglQnKrEHCoEWjbaCkAMAA_1863_921.png异步是句级别,实时是字级别,没有别的标点符号。
    此回答整理自钉群“阿里语音AI【6群】”

    2023-07-10 16:44:17
    赞同 展开评论 打赏
  • 随心分享,欢迎友善交流讨论:)

    作为AI语音识别系统,阿里语音AI长文本在设置enable_subtitle后,会根据句号、问号、感叹号等常见标点符号来拆分句子。除此之外,也会考虑一些特殊情况,例如省略号、引号、括号等等。因此,在使用阿里语音AI长文本时,需要注意不同标点符号的使用,以确保返回的分段正确。

    2023-05-23 11:29:18
    赞同 展开评论 打赏
  • 在阿里语音AI的长文本转语音API中,如果将enable_subtitle参数设置为true,则返回结果中会将长文本按照“。”、“?”、“!”等标点符号自动分割为多个句子,每个句子会对应一个对应的音频文件和字幕文件。但是,需要注意的是,这种自动分割是基于文本中的标点符号进行的,因此只有在文本中包含标点符号的情况下才能进行正确的自动分割。

    对于问题2,目前阿里语音AI的长文本分割句子的标准主要基于“。”、“?”、“!”这三个标点符号进行分割,没有别的标点符号。但是,如果文本中包含其他自定义的标点符号,建议可以进行测试,以便确定是否能够正确分割句子。

    对于问题3,确实,阿里语音AI长文本转语音API在进行句子分割的时候,会将包含“?”等问号符号的句子也进行分割。此外,因为阿里语音AI支持一些自定义的符号,您可能还需要注意其他一些不常见的符号是否会导致自动分割出现错误。如果您需要更加精确的句子划分,可以考虑在使用API前预处理文本,将句子分割的逻辑自己实现,并将分割出的句子单独传入API中进行处理。

    2023-05-23 11:29:19
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
基于OCT医学影像的AI辅助诊断应用实践 立即下载
AI医健中台技术进展及生态发展 立即下载
阿里视觉AI开放之路:从公共云走向端云协同 立即下载