开发者社区 > ModelScope模型即服务 > 语音 > 正文

Paraformer长音频版-识别过程中报错killed

已解决

使用的Modelscope的模型是 Paraformer语音识别-中文-通用-16k-离线-large-长音频版

正常比较短的音频,可以正常识别。

使用一个较长的音频,时长10小时,大小1.3GB,结果在执行过程中报错,显示killed,不知道有解决的办法吗? 音频格式,采样率等,都是符合要求的。

日志输出如下:

2023-02-15 15:33:34,371 - modelscope - INFO - Decoding with wav files ... 2023-02-15 15:33:34,371 (asr_inference_pipeline:387) INFO: Decoding with wav files ... Killed

展开
收起
1697799569231821 2023-02-15 17:36:57 941 0
3 条回答
写回答
取消 提交回答
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术
    采纳回答

    初看到你提出的问题时,1.3GB的音频文件,个人觉得应该是音频文件太大,modelscope解析超时进程自动结束了,然后去modelscope你说的这个训练模型:https://modelscope.cn/models/damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch/summary 看到训练模型的整个说明文档并没有限制音频大小或者是时长,如果你的音频解析失败的话,可以现在模型的在线体验地方上传一下试试,不行的话再问一下在线技术支持当前模型支持的最大音频文件大小。

    2023-02-15 22:43:33
    赞同 1 展开评论 打赏
  • 您好,感谢反馈,我们已经修复,可以更新modelscope-1.3.0 funasr-0.2.0:

    pip install "modelscope[audio_asr]" --upgrade -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html

    git clone https://github.com/alibaba/FunASR.git && cd FunASR pip install --editable ./

    也可以加我们钉钉群反馈您遇到的问题:dingding.jpg

    2023-02-21 10:07:37
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    是不是这个音频大小太大了?时长太长了。

    2023-02-15 22:12:18
    赞同 1 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载