开发者社区> 问答> 正文

智能语音交互ASR是否可以识别48KHZ或者44.1HKZ采样率

已解决

智能语音交互ASR是否可以识别48KHZ或者44.1HKZ采样率

展开
收起
提个问题 2024-06-15 13:11:59 65 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答
    首先需要核实使用的是哪种识别,【一句话识别】和【实时语音识别】接口目前只支持8K/16K采样率音频,需要自行对音频处理,转成接口要求的格式后再进行识别,常见音频格式转换方法可参考文档
    【录音文件识别】接口支持大于16 kHz采样率的音频,需要设置自动降采样参数enable_sample_rate_adaptive ( 该参数可将大于16 kHz采样率的音频进行降采样至16 kHz,默认为false,开启时需要设置version为“4.0”; 参数设置示例见下图) ,详细说明可参考文档
    2024-06-15 13:12:00
    赞同 2 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载