文档备案控制台

开发者社区问答正文

阿里语音AI实时语音识别的接口，通过浏览器获取到的语言流，传过去无法正常的识别到文字。怎么处理？

阿里语音AI实时语音识别的WebSocket接口，用react开发，通过浏览器获取到的语言流，传过去无法正常的识别到文字。怎么处理？

展开

收起

三分钟热度的鱼 2023-05-29 14:43:31 375 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

https://help.aliyun.com/document_detail/324262.html?spm=a2c4g.84424.0.0.4adb5398XGX8sE 可以看下协议里的音频流 WebSocket协议对外提供实时语音流语音转写功能，支持长语音。其中指令、事件皆为WebSocket协议Text类型的DataFrame，音频流需要以Binary Frame的形式上传至服务端，调用时序需要符合协议要求的交互流程。发送语音数据使用Websocket的二进制帧BinaryFrame，具体可参见Data Frames。此回答整理自钉群“阿里语音AI【6群】”

2023-05-29 14:50:49

赞同展开评论

问答分类：

人工智能前端开发语音技术智能语音交互智能语音交互

问答标签：

AI浏览器 AI阿里 AI语言阿里AI AI语音

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

在阿里语音AI中，osyvoice声音克隆1000个，后期可以增加吗？

216

0

0

在阿里语音AI中，调用cosyvoice合成语音的时候设置音色不生效是什么问题？

337

1

0

在阿里语音AI中，在智能媒体服务可以直接调用选择么，如果不行就得分两个步骤？

146

1

0

在哪可以了解阿里云语音AI智能标注iTAG产品的情况？

237

1

0

如图，阿里语音AI怎么测试实时语音识别呢？这几个对应的在哪里找呢？

569

3

0

在阿里语音AI调用的Android的实时语音识别生成出来的语音噪音特别大，一开始还会有滴的声音怎么办

594

4

0

阿里语音AI智能语音交互2.0，实时语音识别C++ SDK出core怎么办？

251

2

0

在阿里语音AI，公网实时语音识别服务有做过升级么？

213

4

0

如图，阿里语音AI的C#实时语音识别的dome有问题？

369

3

0

阿里语音AI能否提供一个使用c#进行实时语音识别的用例？

410

3

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云邮箱个人版登录入口链接在哪？

开阿里云服务器多少钱一个？带你了解不同类型的服务器价格

在 IDEA 中使用通义灵码自动修改代码时，IDEA 报错

通义灵码的 idea 插件，版本2.11.3，在idea 2026.1下，点击代码应用按钮报错

太糟糕了 Lingma

相关文章

学习AI Agent编程－第二天－LangGraph ReAct模式实现

AI Fluency 驱动 MSP 网络安全竞争力提升机制与实践

面向 40 岁以上人群的社交平台定向钓鱼攻击机理与防御研究

AI 伪造图像在电信诈骗攻防中的应用与治理研究 —— 以韩国诱捕诈骗快递员案为例

人体姿态检测数据集分享（适用于YOLO系列深度学习检测任务）

相关解决方案

更多

AI 视频翻译：打破语言壁垒，连接全球观众

阿里云百炼专属版 AI Stack 一体机

在 App 上搭建开箱即用的 AI 助手

在网站上增加一个 AI 助手

在聊天系统中增加一个 AI 助手

还有其他疑问?