备案控制台

开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr如果想让模型同时具备中文、英文能力是不是不能用这个预训练模型？

iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 这个模型使用的tokenizer 是CharTokenizer
那比如如果我想微调同时具备英文和中文能力时，这个地方英文也变成了一个字母一个字母的token话了。所以在modelscope-funasr 如果想让模型同时具备中文、英文能力是不是不能用这个预训练模型？或者说可不可以换 tokenizer？

展开

收起

三分钟热度的鱼 2024-03-27 17:00:27 88 0

2 条回答

写回答

取消提交回答

mrq4nk6ni2neg

可以使用modelsce-funasr预训练模型进行中英文的语音识别，并且可以更换tokenizer。

modelscope-funasr是阿里巴巴提供的一个端到端的语音识别工具包，旨在为研究人员和开发人员在学术研究和工业应用之间架设桥梁。它支持多种语言，包括中文和英文，因此具备同时处理这两种语言的能力。ModelScope平台上也提供了多种不同大小、不同语种的模型供用户选择和使用。

关于iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch这个模型使用的tokenizer，它是以字符为单位进行分词的CharTokenizer。这种分词方式对于中文来说十分合适，因为中文写作不像英文那样由空格分隔单词。但是对于英文来说，这可能会导致将每个字母作为一个独立的token，这并非最佳做法。

在modelscope-funasr中，如果想要支持新的语言或者修改现有的语言处理能力，可以通过修改tokenizer来实现。比如拓展到维吾尔语，就可以使用相应的bpe模型生成新的tokenizer，并替换掉原来的tokenizer。同样地，如果需要支持中英文混合识别，理论上也是可以更换一个适合中英文的tokenizer，或者对现有tokenizer进行适当修改来达到目的。

综上所述，虽然modelscope-funasr提供的预训练模型默认使用的是CharTokenizer，但用户可以根据自己的需求更换或定制tokenizer，从而实现想要的中英文混合语音识别功能。

2024-03-31 09:25:12

赞同展开评论打赏
圆不溜秋的小猫猫

这个搞错了，正常走上面。
此回答整理自钉群“modelscope-funasr社区交流”

2024-03-27 17:17:46

赞同 1 展开评论打赏

相关问答

ModelScope中使用开源的千问1_8预训练模型微调后测试模型的时候报错，怎么解决？

58

0

0

导出ONNX类型模型后，modelscope-funasr能运行这个导出的模型吗？

53

0

0

modelscope-funasr部署的离线语音服务不支持 cam这种模型么？

43

0

0

ModelScope模型访问不了,怎么解决？

61

1

0

跑model_type 是可以的，跑通一个后再跑其他ModelScope模型会有问题吗？

31

1

0

tts的模型，10个字，在4090显存拉满的情况下，ModelScope的rps并发能到多少？

50

0

0

modelscope-funasr的paraformer模型的训练数据建议多少样本吗？

38

0

0

modelscope的 StructBERT的中文Base预训练模型有关系吗？

26

0

0

ModelScope模型如果下载到本地了，用pipeline还需要联网吗？

96

1

0

ModelScope模型已经初始化了，放在init函数中了，然后再进行一次推理，单纯推理就时间很长？

25

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

热门讨论

热门文章

modelscope-funasr的FunClip怎么安装的？

小白求助，跟着大模型微调教程做不太明白

如何下载llama模型到本地？

modelscope-funasr的 sense voice和funasr的底层asr能力是一样吗？

在modelscope-funasr中找不到有效的 OpenPGP 数据，如何解决？

报错AssertionError: choose a window size 400 that is

modelscope-funasr在安卓平台可以集成sense voice吗？

modelscope-funasr有没有开源的语音唤醒，自定义唤醒？

modelscope-funasr这个模型默认下载的路径是什么呢？可以改下载路径吗？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

2024年6月118篇代码大模型论文最全整理

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

【AI 技术分享】大模型与数据检索的探索实践

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手（检索增强生成(RAG)大模型）

如何使用自然语言处理库`nltk`进行文本的基本处理

ModelScope X 昇腾910快速上手

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统

展开全部

相关课程

更多

个性化语音合成模型微调

252

1

去学习

ModelScope社区Library技术架构介绍

227

1

去学习

相关电子书

更多

视觉AI能力的开放现状及ModelScope实战 立即下载

ModelScope助力语音AI模型创新与应用 立即下载

低代码开发师（初级）实战教程 立即下载