请问一下pipeline推理语音识别时候支持最大语音是多少kb的?
您好,damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch模型推荐输入语音时长在20s以下,若想解码长音频,可以使用damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch模型,该模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳。欢迎加入我们的钉钉交流群(27215013275)进行讨论~
赞0
踩0