使用的Modelscope的模型是 Paraformer语音识别-中文-通用-16k-离线-large-长音频版
正常比较短的音频,可以正常识别。
使用一个较长的音频,时长10小时,大小1.3GB,结果在执行过程中报错,显示killed,不知道有解决的办法吗? 音频格式,采样率等,都是符合要求的。
日志输出如下:
2023-02-15 15:33:34,371 - modelscope - INFO - Decoding with wav files ... 2023-02-15 15:33:34,371 (asr_inference_pipeline:387) INFO: Decoding with wav files ... Killed
初看到你提出的问题时,1.3GB的音频文件,个人觉得应该是音频文件太大,modelscope解析超时进程自动结束了,然后去modelscope你说的这个训练模型:https://modelscope.cn/models/damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch/summary 看到训练模型的整个说明文档并没有限制音频大小或者是时长,如果你的音频解析失败的话,可以现在模型的在线体验地方上传一下试试,不行的话再问一下在线技术支持当前模型支持的最大音频文件大小。
您好,感谢反馈,我们已经修复,可以更新modelscope-1.3.0 funasr-0.2.0:
pip install "modelscope[audio_asr]" --upgrade -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
git clone https://github.com/alibaba/FunASR.git && cd FunASR pip install --editable ./
也可以加我们钉钉群反馈您遇到的问题:
是不是这个音频大小太大了?时长太长了。