开发者社区> 问答> 正文

在rtc 这个路上做了哪些优化? 还有对语音识别,人声模拟方面有什么技术经验?

在rtc 这个路上做了哪些优化? 还有对语音识别,人声模拟方面有什么技术经验?

展开
收起
OSC开源社区 2024-05-11 17:29:04 50 0
1 条回答
写回答
取消 提交回答
    1. rtc整个音频引擎音频链路都针对娱乐场景做了优化,如自研回声消除,保证回声消除效果。添加音乐检测,通过检测链路中的音乐,动态根据场景调整相应的优化算法。音乐场景降噪算法保证音乐不受损伤,语音AI降噪消除环境噪音和突发噪音。根据语音与音乐,调整相应的编解码格式和参数,以及jitterbuffer大小,plc算法等。
    2. 另外还添加了实时变声、音效等效果。变声主要是依靠pitch shift、调制、失真、tremolo、混响、eq等手段实现,不过这方面没有统一的标准,按照我们定义,实现了小黄人、恶魔、机器人、金属音等之类的变声音效,并能够在rtc场景实时变声
    2024-05-11 18:49:51
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载