备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr中，funasr把语音识别结果返回给Java后端Java要传哪些？

modelscope-funasr中，非实时语音识别，前端传来了文件给Java后端springboot处理，接着springboot传文件给funasr，funasr把语音识别结果返回给Java后端Java需要传哪些参数？

展开

收起

提问的橘子 2024-04-19 13:59:38 249 版权

阿里云 AI 助理回答

在使用ModelScope FunASR进行非实时语音识别时，Java后端（Spring Boot）需要从前端接收文件，并将文件传递给FunASR服务以获取语音识别结果。以下是Java后端需要传递的关键参数及其说明：

1. API Key

描述：用于身份验证的密钥，确保请求的合法性。
设置方式：
- 建议将API Key配置到环境变量中，避免硬编码在代码中。
- 如果未配置环境变量，则需要在代码中显式指定API Key。
示例：
```
.apiKey("your-api-key")
```

2. 模型名称

描述：指定使用的语音识别模型。
要求：必须通过model参数指定，固定为sensevoice-v1。
示例：
```
.model("sensevoice-v1")
```

3. 待识别音频的URL

描述：FunASR不支持直接上传本地文件，需提供可通过公网访问的音频文件URL。
要求：
- URL需支持HTTP/HTTPS协议。
- 单次请求最多支持100个URL。

示例：

.fileUrls(Arrays.asList("https://your-domain.com/file.mp3"))

4. 音频格式与采样率

描述：确保音频文件符合FunASR的要求，否则可能导致识别失败。
要求：
- 支持的格式包括WAV、MP3等。
- 推荐的采样率为8KHz或16KHz，单声道，16位采样位数。
检查方法：
- 使用工具（如file命令、Sox或FFmpeg）检查音频格式并转换为标准格式。

5. 任务提交方式

描述：FunASR支持异步提交任务和同步等待结果的方式。
流程：
1. 创建Transcription实例。
2. 调用asyncCall方法提交任务，传入TranscriptionParam实例。
3. 使用wait方法阻塞等待任务完成，或通过fetch方法轮询任务状态。

示例：

Transcription transcription = new Transcription();
TranscriptionParam param = TranscriptionParam.builder()
    .apiKey("your-api-key")
    .model("sensevoice-v1")
    .fileUrls(Arrays.asList("https://your-domain.com/file.mp3"))
    .build();
TranscriptionResult result = transcription.asyncCall(param);
result.wait(); // 阻塞等待任务完成

6. 其他可选参数

描述：根据需求，可以设置额外的参数以优化识别效果。
常见参数：
- language：指定音频的语言（如中文、英文）。
- format：明确音频文件的格式（如WAV、MP3）。
- sampleRate：指定音频的采样率（如8000、16000）。

重要提醒

文件URL的有效性：确保提供的音频文件URL可以通过公网访问，且文件未过期或被删除。
任务结果有效期：识别结果和下载链接仅在24小时内有效，请及时处理。
错误排查：
- 如果识别失败，请检查音频格式是否符合要求。
- 确保API Key和模型名称正确无误。

通过以上步骤，Java后端可以成功将前端传递的文件发送至FunASR，并获取语音识别结果。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

相关问答

modelscope-funasr的Java客户端是怎么使用的啊，这个命令要在哪里执行呢？

184

0

0

modelscope-funasr的实时语音识别支持的并发数在哪里可以看？

168

1

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

166

0

0

modelscope-funasr的多说话人语音识别模型支持实时听写吗？

97

0

0

在modelscope-funasr中有没有用做实时语音转文字的demo？

71

1

0

在modelscope-funasr中java的底层怎么接受数据的,我想自己编写wss客户端?

61

0

0

modelscope-funasr模型下载下来后调用咋提示未注册呀？

161

0

0

ModelScope中，下载meta-llama-3.1-8b 模型包报错，怎么解决？

99

0

0

请问ModelScope的swift部署本地模型有文章推荐吗？

46

0

0

ModelScope模型经常会出现突然中断，输出不完整的情况，这是为什么？

109

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

Dataphin功能Tips系列（39）-API的非必填参数(2)-未传参时指定默认值

Dataphin功能Tips系列（41）-Hadoop集群管理

Dataphin功能Tips系列（47）-支持通过Spark本地客户端提交Spark Batch任务

2025年Postman的五大替代工具

【原理】【Java并发】【synchronized】适合中学者体质的synchronized原理

热门讨论

热门文章

modelscope-funasr==1.0.5依赖的torch版本是多少？

modelscope-funasr的 sense voice和funasr的底层asr能力是一样吗？

modelscope-funasr在AutoModel里设置了关闭了，结果还是会打日志，为什么？

modelscope-funasr的python websocket怎么实现多用户并发啊？

open webui的RAG功能根本用不起来

modelscope-funasr在安卓平台可以集成sense voice吗？

微调大模型的tokenize_function编写求教

练的pth模型文件，怎么转成bin文件？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr热词怎么设置才有效？

展开全部

还在蹲Manus的邀请码？别等了！开源版Manus为你快速创建AI工位，给AI一台电脑，然后你就玩去吧！

OWL：告别繁琐任务！开源多智能体系统实现自动化协作，效率提升10倍

阿里通义开源推理模型新王者！QwQ-32B：性能直逼671B的DeepSeek-R1

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

无需邀请码！MetaGPT 开源AI助手 OpenManus，实时反馈+模块化设计，开发者福音

Browser Use：40.7K Star！一句话让AI完全接管浏览器！自动规划完成任务，多标签页同时管理

ChatMCP：基于 MCP 协议开发的 AI 聊天客户端，支持多语言和自动化安装 MCP 服务器

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

中文法律AI大模型！LaWGPT 一键生成法律文书，司法考试通过率提升50%

autoMate：无需视觉模型！用DeepSeek-V3/R1就能实现自动化操作电脑，支持任何可视化界面

展开全部

还有其他疑问?