在阿里语音AI我们对接的实时音转文，分段逻辑是否能够调整？现在分段太密集了

在阿里语音AI我们对接的实时音转文，分段逻辑是否能够调整？现在分段太密集了。我的需求是分段可以再宽松一下，因为我们是客服场景，需要质检文本内容，被拆开的话会检测不到部分内容。taskId=247aebafc14b48e884a5f36030ae5fab 客户侧 taskId=9b743e9d8d6b4125b405e344ca321886 座席侧

展开

收起

三分钟热度的鱼 2023-05-29 14:50:46 183 版权

2 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

我看你这边调整了这个参数：，当时为啥要调整这个参数呢。建议先使用默认的参数。此回答整理自钉群“阿里语音AI【6群】”

2023-06-06 09:53:21

赞同展开评论
LittlePenguin

随心分享，欢迎友善交流讨论：）

在阿里语音AI中，实时音频转写服务提供了音频分段的参数配置，可以通过调整该参数实现分段逻辑的调整，从而控制分段的密集程度。

具体的参数配置有两个，分别是：

maxSentenceSilence：表示两个连续的音频段之间的最大静音时间，超过该时间则会自动分段。默认值为 6000 毫秒。 maxSentenceDuration：表示一个音频段的最大时长，超过该时长则会自动分段。默认值为 60000 毫秒。您可以根据实际情况调整这两个参数的值，以控制分段的密集程度。如果分段过于密集，可以适当调高 maxSentenceSilence 的值；如果分段太长，可以适当调低 maxSentenceDuration 的值。

同时，阿里语音AI还提供了停止转写的接口，您可以在分段过程中主动调用该接口停止转写，然后再重新开始转写，从而实现更加精细的分段控制。

2023-05-29 17:52:44

赞同展开评论

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

在阿里语音AI我们对接的实时音转文，分段逻辑是否能够调整？现在分段太密集了

相关文章