开发者社区> 问答> 正文

在阿里语音AI我们对接的实时音转文,分段逻辑是否能够调整?现在分段太密集了

在阿里语音AI我们对接的实时音转文,分段逻辑是否能够调整?现在分段太密集了。我的需求是分段可以再宽松一下,因为我们是客服场景,需要质检文本内容,被拆开的话会检测不到部分内容。taskId=247aebafc14b48e884a5f36030ae5fab 客户侧 taskId=9b743e9d8d6b4125b405e344ca321886 座席侧

展开
收起
三分钟热度的鱼 2023-05-29 14:50:46 90 0
2 条回答
写回答
取消 提交回答
  • 我看你这边调整了这个参数:,当时为啥要调整这个参数呢。lQLPJwTQNrUVbEJrzQUdsAXFjfjU7BJwBGr6enNAzQA_1309_107.png建议先使用默认的参数。此回答整理自钉群“阿里语音AI【6群】”

    2023-06-06 09:53:21
    赞同 展开评论 打赏
  • 随心分享,欢迎友善交流讨论:)

    在阿里语音AI中,实时音频转写服务提供了音频分段的参数配置,可以通过调整该参数实现分段逻辑的调整,从而控制分段的密集程度。

    具体的参数配置有两个,分别是:

    maxSentenceSilence:表示两个连续的音频段之间的最大静音时间,超过该时间则会自动分段。默认值为 6000 毫秒。 maxSentenceDuration:表示一个音频段的最大时长,超过该时长则会自动分段。默认值为 60000 毫秒。 您可以根据实际情况调整这两个参数的值,以控制分段的密集程度。如果分段过于密集,可以适当调高 maxSentenceSilence 的值;如果分段太长,可以适当调低 maxSentenceDuration 的值。

    同时,阿里语音AI还提供了停止转写的接口,您可以在分段过程中主动调用该接口停止转写,然后再重新开始转写,从而实现更加精细的分段控制。

    2023-05-29 17:52:44
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
释放算力潜能加速应用构建Serverless为AI创新提速 立即下载
智算时代,基于 Kubernetes 落地云原生 AI 立即下载
AI让数据库的路走的“更快更远” 立即下载