文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr的sensevoice支持识别长音频文件输出分句级别的起始时间吗？

modelscope-funasr的sensevoice支持识别长音频文件（1分钟以上），输出分句级别的起始时间、结束时间、句子内容吗？
像这样的效果：“Start: 5.42s, End: 8.28s, Text: 当然这对普通民众来说有认知偏差”，而不是这样的“Start: 40.12s, End: 48.12s, Text: 虽然我们说他们是依照消耗品生产的,但机械化程度高的产品永远比电子程度高的产品拥有更长的生命周期。”

展开

收起

三分钟热度的鱼 2024-07-17 23:07:48 468 版权

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

如果只是中文识别需求，可以先用paraformer-zh，sensevocie主要是支持多语言，中文效果没有paraformer好此回答整理自钉群“modelscope-funasr社区交流”

2024-07-18 08:53:15

赞同 6 展开评论

相关问答

modelscope-funasr微调sensevoice时，best acc 一直为0是为什么？

733

1

0

在modelscope-funasr为什么识别的内容和音频不一致呀？

256

1

0

modelscope-funasr的Sensevoice可以商用吗？

454

0

0

modelscope-funasr的Sensevoice的数据准备特别慢是什么原因呢？

262

0

0

在modelscope-funasr需要增加录音文件的存储功能具体是修改哪个文件啊？

232

0

0

modelscope-funasr用funasr测sensevoice为什么每次都提示下载？

545

1

0

modelscope-funasr 可以输入音频吗而不是文件？

312

1

0

在modelscope-funasr该怎么更新token.json与seg_dic等文件呢？

237

0

0

modelscope-funasr的sensevoice我看写的支持50中语言，具体在哪可以看到？

369

0

0

modelscope-funasr的音频情感识别，用sensevoice好还是emotion2ve？

445

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

热门讨论

热门文章

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

如何修改通义千问的system prompt，以修改自定义名字

运行官方示例在win环节下conda中报错

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr 热词如何设置？

为啥都不能很好的处理文本鉴黄

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr中命令行用法如何生成带时间戳的结果？

modelscope-funasr现阶段支持华为的npu吗？

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

通古大模型：古籍研究者狂喜！华南理工开源文言文GPT：AI自动断句+写诗翻译，24亿语料喂出来的学术神器

MCP 工具生态升温后，企业 AI 中台要解决什么问题？

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

展开全部

还有其他疑问?