文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr的paraformer流式解码有没有原理图片啊？

modelscope-funasr的paraformer流式解码有没有原理图片啊？或者相关论文也行。
最新版本代码chunk_size是设成[0,10,5]还是[5,10,5]

展开

收起

三分钟热度的鱼 2024-03-27 17:07:17 564 版权

2 条回答

写回答

取消提交回答

mrq4nk6ni2neg
[^6] 2024年3月15日 · 在modelscope-funasr中，chunk_size的默认值是[0,10,5]。这个参数用于控制模型输入的音频块大小，其中第一个数字代表输入特征的帧移（frame shift），第二个数字代表编码器内部的块大小（encoder chunk size），第三个数字代表解码器内部的块大小（decoder chunk size）

根据可用信息，关于modelscope-funasr的Paraformer流式解码的原理图片或相关论文，目前没有直接提供原理图片。但有介绍基于Paraformer的端到端语音识别理论的资料，以及一些分享对语音识别Non-autoregressive（NAR）模型Paraformer理解的文章。它们可能包含您所求的理论解析和架构细节，建议查阅这些资料以获得更深入的理解。至于最新版本代码中chunk_size的设置，modelscope-funasr中chunk_size的默认值是[0,10,5]，这组参数分别代表着不同的功能和意义。具体而言：
- 帧移：chunk_size中的第一个数字通常表示输入特征的帧移（frame shift），即在处理连续音频数据时，每次移动的帧长。
- 编码器块大小：chunk_size中的第二个数字则代表编码器内部的块大小（encoder chunk size）。
- 解码器块大小：chunk_size中的第三个数字代表解码器内部的块大小（decoder chunk size）。
综上所述，对于chunk_size的设定，除非有特定的理由进行调整，否则使用默认值[0,10,5]即可。如果有特殊需求或在进行特定优化时，可以根据实际需要调整这些参数。
2024-03-28 22:19:40

赞同展开评论
圆不溜秋的小猫猫

按照默认给的就好
此回答整理自钉群“modelscope-funasr社区交流”

2024-03-27 17:21:35

赞同展开评论

相关问答

请教大家，modelscope有能让图片中模糊文字变清晰的模型吗？

371

1

0

modelscope-funasr的paraformer-streaming微调代码是咋实现流式？

494

0

0

modelscope 现在已知的json结构化数据，可以用模型推理出其他图片的json结构么？

241

1

0

modelscope-funasr的online流式实时听写，没有标点符号，需要如何设置？

484

0

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

502

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

609

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

433

1

0

请问modelscope上的语音合成模型可以流式输出吗？

279

1

0

modelscope里用vllm调用千问1.5-7b流式输出，没输出完就结束了，有限制输出多少字吗?

341

1

0

ModelScope生成的图片可以商用吗？

232

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

热门讨论

热门文章

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

运行官方示例在win环节下conda中报错

modelscope-funasr 热词如何设置？

为啥都不能很好的处理文本鉴黄

如何下载llama模型到本地？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr如何释放显存呢？

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

通古大模型：古籍研究者狂喜！华南理工开源文言文GPT：AI自动断句+写诗翻译，24亿语料喂出来的学术神器

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

展开全部

还有其他疑问?