modelscope-funasr中,如何控制vad切出的子句粒度,现在感觉太短了,很多应该连在一起的也断开了?
vad的原理是检测连续出现的静音片断长度是否超过阈值(默认800ms,在vad模型的config.yaml配置),另外,我们也提供了vad后处理,对vad切割后的slice进行合并,总的来说,思路要打开,需要什么功能,可以自己开发,可以看这里:
https://github.com/alibaba-damo-academy/FunASR/issues/1622 。此回答整理自钉群“modelscope-funasr社区交流”