开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

ModelScope中UniASR语音识别-中文方言-通用-16k-离线 这个有人用过吗?

ModelScope中UniASR语音识别-中文方言-通用-16k-离线 这个有人用过吗?

展开
收起
真的很搞笑 2024-01-02 20:17:48 137 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    UniASR语音识别-中文方言-通用-16k-离线是达摩院推出的一款语音识别模型,该模型通过2遍刷新(Two pass)的端到端架构设计,能够有效处理不同业务场景的需求。具体来说,这个模型具有高计算效率和优秀的识别效果,是一种非自回归的端到端语音识别模型。

    此外,UniASR长音频版本模型支持输出字级别时间戳,可以对时长为数小时的音频进行识别,并输出带标点文字与时间戳。与此同时,此模型还集成了VAD(Voice Activity Detection,语音活动检测)功能,能够有效检查长语音片段中有效语音的起止时间点。这种优化使得该模型在日益丰富的业务需求下,不仅能够保持高的识别精度,而且能够实时地进行语音识别。

    因此,对于需要进行大规模、高精度且实时的语音识别处理的业务场景,UniASR语音识别-中文方言-通用-16k-离线无疑是一个值得尝试的选择。

    2024-01-03 13:35:26
    赞同 展开评论 打赏
  • 有用过的,另外funasr群您也可以关注下。
    语音识别相关问题,请进ModelScope-FunASR答疑群,每天下午3点到5点,有人值班答疑:

    https://qr.dingtalk.com/action/joingroup?code=v1,k1,HvfUn46BPlI4YY96NXjQtI3lTjsgC6R8oCxB+kbE5RI=&_dt_no_comment=1&origin=11? 游雁邀请你加入钉钉群聊modelscope-funasr社区交流,点击进入查看详情 ,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-01-02 23:07:23
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载