开发者社区> 问答> 正文

阿里语音AI长时间通话做实时识别这种可以对接api么?

阿里语音AI长时间通话做实时识别这种可以对接api么?

展开
收起
你鞋带开了~ 2024-03-04 21:00:18 73 0
2 条回答
写回答
取消 提交回答
  • 目前实时识别不支持api,都是通过sdk对接
    --此回答整理自钉群“阿里语音AI【6群】”

    2024-03-06 10:55:50
    赞同 1 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    是的,阿里语音AI支持长时间通话做实时识别,并且可以对接API

    阿里云智能语音交互提供了多种接入方式,包括RESTful API、移动端、服务端、微信小程序以及WebSocket等,这些接入方式都可以用来实现长时间的语音数据流识别。这种实时语音识别功能适用于会议演讲、视频直播等需要长时间不间断识别的场景。具体来说:

    • 支持的音频格式:阿里云语音AI支持多种音频格式,包括PCM(无压缩的PCM或WAV文件)、OPUS、AMR、SPEEX、MP3、AAC格式,以及16 bit采样位数、单声道(mono)。同时,支持的音频采样率有8000 Hz和16000 Hz。
    • 返回结果设置:用户可以设置是否返回中间识别结果,是否在后处理中添加标点,以及是否将中文数字转为阿拉伯数字输出。
    • 多语言识别:阿里云语音AI还支持设置多语言识别,用户可以根据需要在控制台编辑项目中进行模型选择。
    • SDK支持:阿里云提供的Java SDK可以帮助开发者方便地集成语音识别功能,包括SDK的安装方法和代码示例都有详细的文档说明。
    2024-03-04 21:22:23
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
2023云栖大会:PolarDB for AI 立即下载
2023云栖大会:Lindorm一站式AI数据平台实战 立即下载
释放算力潜能加速应用构建Serverless为AI创新提速 立即下载