开发者社区 > ModelScope模型即服务 > 语音 > 正文

模型能够输出语音识别过程中,分离出的语音文件或信息吗

现在模型的语音识别准确率还不足,不能够区分说话人角色

展开
收起
游客tlzsclyybypdu 2023-05-09 14:35:46 277 0
1 条回答
写回答
取消 提交回答
  • MFCCA为多说话人语音识别,输出为语音识别文字,如果需要区分说话人角色,可以使用说话人日志模型,FunASR目前提供了一个说话人日志学术模型,可以用来测试: https://alibaba-damo-academy.github.io/FunASR/en/model_zoo/modelscope_models.html#speaker-diarization-models

    欢迎加入钉钉用户群,及时沟通您遇到的问题: https://github.com/alibaba-damo-academy/FunASR#contact

    2023-05-09 17:16:17
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关产品

  • 智能语音交互
  • 相关电子书

    更多
    阿里云总监课第二期——Neural Network Language Model在语音识别中的应用 立即下载
    阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
    智能语音交互:阿里巴巴的研究与实践 立即下载