开发者社区> 问答> 正文

想咨询下 iOS sdk里面 我在阿里语音AI能传自己的音频流么?

想咨询下 iOS sdk里面 我在阿里语音AI能传自己的音频流么?语音识别服务,实时的

展开
收起
乐天香橙派 2023-07-25 21:17:17 69 0
3 条回答
写回答
取消 提交回答
  • 极速版是吧 您也可以自己实现这个的 我们支持识别音频文件
    我们的sdk是把服务都封装在一起的
    c531f4e6c8954ee58fc66ef3759b6722.png—此回答来自钉群“阿里语音AI【6群】”

    2023-07-26 10:50:29
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    初始化SDK,设置好您的AppKey和AccessToken。

    打开麦克风,开始录音获取音频数据。

    按照音频帧的大小(sdk默认是80ms一帧),每来一帧音频数据就调用一次RecognitionService对象的sendAudio接口来发送这一帧音频。

    sendAudio接口的回调函数中,会返回识别结果。

    发送识别结果后,继续获取下一帧音频,再次调用sendAudio接口。

    上述步骤实际实现了实时语音流识别。您需要做的就是:

    打开麦克风,并定期获取音频数据(80ms一帧)
    每一帧音频调用sendAudio接口,发送给识别服务
    获取sendAudio接口的回调,即获取到实时语音识别结果
    循环1~3,实现持续的语音识别
    具体API使用如下:

    json
    Copy
    // 初始化配置参数
    RSConfig *rsConfig = [[RSConfig alloc] init];
    rsConfig.appId = @"你的AppId";
    rsConfig.token = @"你的Token";

    // 初始化识别服务
    RecognitionService *rs = [[RecognitionService alloc] init:rsConfig];

    // 当有音频帧时,调用识别服务的sendAudio接口发送
    [rs sendAudio:pcmLen pcmBuffer:pcmBuffer pcmSampleRate:sampleRate finish:^(RSResponse _Nullable result, NSError _Nullable error) {
    // 获取识别结果
    }];

    2023-07-26 08:39:26
    赞同 展开评论 打赏
  • 问题一:在阿里语音AI的iOS SDK中,可以使用实时音频流进行语音识别服务。您可以将自己的音频流传递给SDK,并通过相应的接口实时进行语音识别。这使您能够实时地将音频数据发送到阿里语音AI服务,以获得实时的语音识别结果。

    问题二:是的,在iOS SDK中,您可以直接传递音频流进行语音识别,而无需使用录音接口。通过将音频流传递给相应的接口,您可以实现实时的语音识别功能。这样,您可以根据您的需求和场景,灵活地处理音频数据并获取语音识别的结果。

    2023-07-25 21:55:48
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
智算时代,基于 Kubernetes 落地云原生 AI 立即下载
AI让数据库的路走的“更快更远” 立即下载
Data+AI时代大数据平台应该如何建设 立即下载