备案控制台

开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr哪个模型可以识别成这样的呢？

modelscope-funasr哪个模型可以识别成这样的呢？

展开

收起

三分钟热度的鱼 2024-03-27 17:13:24 72 0

1 条回答

写回答

取消提交回答

mrq4nk6ni2neg
MFCCA模型能够识别会议场景下的多说话人语音。

ModelScope-FunASR中的MFCCA模型是专门为解决会议场景下多说话人语音识别问题而设计的。这个模型基于ICASSP2022 M2MeT竞赛中使用的真实会议场景语料库AliMeeting进行训练，并且在该数据集上实现了最新的SOTA（State of the Art，顶尖水平）性能。具体来说，以下是关于MFCCA模型的一些详细信息：
- 训练数据：MFCCA模型的训练数据包括AliMeeting、AISHELL-4和约700小时模拟的说话人重叠音频，合计约917小时的数据。这些数据涵盖了多种会议场景，使得模型能够更好地适应复杂的多说话人环境。
- 技术背景：多说话人语音识别（Multi-talker ASR）的目标是在存在多个说话人且可能发生说话人重叠的情况下，准确地识别出语音内容。随着深度学习技术的发展，多种端到端的多说话人ASR方法被提出，并在如LibriCSS这样的多说话人模拟数据集上取得了显著成效。
- 应用前景：开发者可以利用ModelScope提供的微调和推理功能，或者使用FunASR的Github代码仓库来进行模型的领域定制化，以适应特定的应用场景或提高模型的性能。
综上所述，如果您需要识别包含两个或以上说话人的语音，MFCCA模型是一个值得考虑的选择。您可以利用ModelScope平台提供的资源和工具，对模型进行进一步的调整和优化，以满足您的具体需求。
2024-03-28 22:02:34

赞同展开评论打赏

相关问答

在modelscope-funasr中为什么下面没有punc_ct标点预测模型的实现啊？

28

0

0

按照Q5操作了，然后运行本地模型报错，请问ModelScope是少了什么步骤吗？

29

1

0

ModelScope中，以本地模型为原型训练模型怎么实现，能用.gguf格式的模型训练吗？

34

1

0

modelscope有训练过知识产权和品牌logo的模型吗？

25

0

0

ModelScope微调qwen2不同参数的模型，分别需要的最低硬件要求是多少？

57

1

0

modelscope-funasr的MFCCA这个模型能流式处理语音吗？

28

1

0

ModelScope模型文件全部才5.8G，是不是打包为zip包就可以？

41

0

0

在本地训练好了，保存的ModelScope模型是哪个，怎么用？

28

1

0

ModelScope社区里自己创建上传的数据集，如何用于模型的训练？

33

1

0

部署ModelScope中，模型 swift deploy时报了错误怎么解决？

40

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

热门讨论

热门文章

modelscope-funasr的FunClip怎么安装的？

小白求助，跟着大模型微调教程做不太明白

modelscope-funasr的 sense voice和funasr的底层asr能力是一样吗？

如何下载llama模型到本地？

报错AssertionError: choose a window size 400 that is

在modelscope-funasr中找不到有效的 OpenPGP 数据，如何解决？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr这个模型默认下载的路径是什么呢？可以改下载路径吗？

modelscope-funasr在安卓平台可以集成sense voice吗？

modelscope-funasr有没有开源的语音唤醒，自定义唤醒？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

2024年6月118篇代码大模型论文最全整理

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

【AI 技术分享】大模型与数据检索的探索实践

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手（检索增强生成(RAG)大模型）

如何使用自然语言处理库`nltk`进行文本的基本处理

ModelScope X 昇腾910快速上手

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统

展开全部

相关课程

更多

个性化语音合成模型微调

252

1

去学习

ModelScope社区Library技术架构介绍

227

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载