开发者社区 > ModelScope模型即服务 > 语音 > 正文

UniASR如何进行流式语音识别?

如何使用 UniASR语音识别-中文-通用-16k-实时 这个模型进行流式的语音识别呢?api调用范例是进行一句话识别的吧。

展开
收起
游客jfij4tsw2hn4m 2023-01-11 16:17:56 1278 0
1 条回答
写回答
取消 提交回答
  • UniASR模型是一种2遍刷新模型(Two pass)端到端语音识别模型。在流式业务场景中,为了更好的折中实时性与准确率,往往采用多个不同时延的模型系统。为了满足差异化业务场景对计算复杂度、实时性和准确率的要求,常用的做法是维护多种语音识别系统,例如,CTC系统、E2E离线系统、SCAMA流式系统等。 image.png

    2023-01-12 23:27:45
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关产品

  • 智能语音交互
  • 相关电子书

    更多
    阿里云总监课第二期——IoT时代的语音交互智能 立即下载
    阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
    智能语音交互:阿里巴巴的研究与实践 立即下载