想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？

想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？语音识别服务，实时的

展开

收起

乐天香橙派 2023-07-25 21:17:17 164 版权

3 条回答

写回答

取消提交回答

一颗橙子11111

极速版是吧您也可以自己实现这个的我们支持识别音频文件
我们的sdk是把服务都封装在一起的
—此回答来自钉群“阿里语音AI【6群】”

2023-07-26 10:50:29

赞同展开评论
算精通

北京阿里云ACE会长

初始化SDK,设置好您的AppKey和AccessToken。

打开麦克风,开始录音获取音频数据。

按照音频帧的大小(sdk默认是80ms一帧),每来一帧音频数据就调用一次RecognitionService对象的sendAudio接口来发送这一帧音频。

sendAudio接口的回调函数中,会返回识别结果。

发送识别结果后,继续获取下一帧音频,再次调用sendAudio接口。

上述步骤实际实现了实时语音流识别。您需要做的就是:

打开麦克风,并定期获取音频数据(80ms一帧)
每一帧音频调用sendAudio接口,发送给识别服务
获取sendAudio接口的回调,即获取到实时语音识别结果
循环1~3,实现持续的语音识别
具体API使用如下:

json
Copy
// 初始化配置参数
RSConfig *rsConfig = [[RSConfig alloc] init];
rsConfig.appId = @"你的AppId";
rsConfig.token = @"你的Token";

// 初始化识别服务
RecognitionService *rs = [[RecognitionService alloc] init:rsConfig];

// 当有音频帧时,调用识别服务的sendAudio接口发送
[rs sendAudio:pcmLen pcmBuffer:pcmBuffer pcmSampleRate:sampleRate finish:^(RSResponse _Nullable result, NSError _Nullable error) {
// 获取识别结果
}];

2023-07-26 08:39:26

赞同展开评论
Star时光

问题一：在阿里语音AI的iOS SDK中，可以使用实时音频流进行语音识别服务。您可以将自己的音频流传递给SDK，并通过相应的接口实时进行语音识别。这使您能够实时地将音频数据发送到阿里语音AI服务，以获得实时的语音识别结果。

问题二：是的，在iOS SDK中，您可以直接传递音频流进行语音识别，而无需使用录音接口。通过将音频流传递给相应的接口，您可以实现实时的语音识别功能。这样，您可以根据您的需求和场景，灵活地处理音频数据并获取语音识别的结果。

2023-07-25 21:55:48

赞同展开评论

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

想咨询下 iOS sdk里面 我在阿里语音AI能传自己的音频流么？

相关文章

想咨询下 iOS sdk里面我在阿里语音AI能传自己的音频流么？