开发者社区> 问答> 正文

请问智能语音交互、语音AI中录音识别服务到底能不能返回每个字的时间戳?词信息里面是这个词的开始时间和

问题1:请问智能语音交互、语音AI中录音识别服务到底能不能返回每个字的时间戳?词信息里面是这个词的开始时间和结束时间吧,就是说是没办法精确到字的吧,没有啊,我昨天试过不是的,比如一段录音里面有个词,很多很多,确认下我们这边录音分析返回的时间戳是否可以精确到字,之前您同事说是去words里面取,words里面最多两个字,但是我测试的不是最多两个字,我的例子里面有四个字的,eg:“很多很多” 问题2:第一个疑问:我们这是否支持精确到字的时间戳,如果支持,需要设置什么参数,第二个疑问:是否是您同事说的words里面最多只有两个字,是的话,为什么我的列子不是,是否有参数设置错误,开启了,返回了words列表、哪位可以先确认下我的这个问题吗?就是任何版本的都没有这个功能是吧,是的,但是分词也不是很准确。

展开
收起
真的很搞笑 2023-05-24 17:41:24 82 0
1 条回答
写回答
取消 提交回答
  • 回答1:可以的,查看词信息里的时间戳,是的,词信息最多两个字 回答2:看下这个参数开启了吗image.png 我看你这个是按照词信息返回的,这个还不支持按照字的时间戳返回,此回答整理自钉群“阿里语音AI【4群】”

    2023-05-24 18:02:24
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载