ModelScope语音识别模型可以传入二进制数据传入返回数据不对应,怎么偶尔也有单个字的返回?
https://modelscope.cn/models/damo/speech_UniASR_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-online/comment!
您好,ModelScope 的语音识别模型能够对音频文件进行识别,并将其转换为文本。如果您在输入二进制数据时遇到问题,请尝试以下方法:
确保您使用的是正确的二进制格式。语音识别模型只支持 wav 格式的数据。
确保您使用的是正确的音频采样率。语音识别模型只支持 16KHz 的音频采样率。
确保您使用的是正确的音频编码。语音识别模型只支持 16 位线性 PCM 编码。
尝试使用其他语音识别模型。如果您仍然遇到问题,请尝试使用其他语音识别模型。
如果您还有其他问题,请随时联系我们。