文档备案控制台

开发者社区问答正文

在rtc 这个路上做了哪些优化？还有对语音识别，人声模拟方面有什么技术经验？

在rtc 这个路上做了哪些优化？还有对语音识别，人声模拟方面有什么技术经验？

展开

收起

OSC开源社区 2024-05-11 17:29:04 186 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

OSC小助手
1. rtc整个音频引擎音频链路都针对娱乐场景做了优化，如自研回声消除，保证回声消除效果。添加音乐检测，通过检测链路中的音乐，动态根据场景调整相应的优化算法。音乐场景降噪算法保证音乐不受损伤，语音AI降噪消除环境噪音和突发噪音。根据语音与音乐，调整相应的编解码格式和参数，以及jitterbuffer大小，plc算法等。
2. 另外还添加了实时变声、音效等效果。变声主要是依靠pitch shift、调制、失真、tremolo、混响、eq等手段实现，不过这方面没有统一的标准，按照我们定义，实现了小黄人、恶魔、机器人、金属音等之类的变声音效，并能够在rtc场景实时变声
2024-05-11 18:49:51

赞同 1 展开评论

问答分类：

语音技术智能语音交互智能语音交互

问答标签：

智能语音交互技术

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

阿里语音AI的语音识别、语音合成，有没有优化方案？行业专业术语识别和合成效果都不太好

359

3

0

端到端语音识别技术在单语种任务上取得了哪些成果，但在多语种混说场景下存在什么问题？

256

1

0

端到端语音识别技术在单语种任务上取得了哪些成果，但在多语种混说场景下存在什么问题？

179

1

0

智能语音交互识别不准如何优化

257

1

0

modelscope-funasr0.4.4版本进行语音识别，识别的文本有不少断句的错误，怎么优化？

565

0

0

阿里语音AI ASR优化的比如热词：火鸡，设置这个热词，这种优化语音识别可以实现吗?"

266

1

0

智能语音交互，识别效果如何优化

581

4

0

VOD-视频点播有阿里云智能语音交互的技术群吗？

174

2

0

智能语音交互、语音AI中只能看到结果，我想听听录入的原声效果如何，看看哪里可以优化下？

133

1

0

【技术揭秘】可控时延语音识别文本后处理技术

1136

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

阿里云百炼Token Plan深度解析：Credits规则、AI模型矩阵及免费Tokens获取攻略

一线城市呼叫中心系统架构设计与集成实践：从延迟优化到混合云落地

AI智能体的开发流程

AI 技术在英语教育中的应用

AI英语教育产品的开发与上线

还有其他疑问?