备案控制台

开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr热词激励的模型训练阶段的任务会不会导致语音字数预测受到影响？

modelscope-funasr热词激励的模型训练阶段的任务会不会导致语音字数预测受到影响？ def calc_predictor(self, encoder_out, encoder_out_lens):
encoder_out_mask = (
~make_pad_mask(encoder_out_lens, maxlen=encoder_out.size(1))[:, None, :]
).to(encoder_out.device)
predictor_outs = self.predictor(
encoder_out, None, encoder_out_mask, ignore_id=self.ignore_id
)
return predictor_outs[:4]

def _calc_seaco_loss(
    self,
    encoder_out: torch.Tensor,
    encoder_out_lens: torch.Tensor,
    ys_pad: torch.Tensor,
    ys_lengths: torch.Tensor,
    hotword_pad: torch.Tensor,
    hotword_lengths: torch.Tensor,
    seaco_label_pad: torch.Tensor,
):
    # predictor forward
    encoder_out_mask = (
        ~make_pad_mask(encoder_out_lens, maxlen=encoder_out.size(1))[:, None, :]
    ).to(encoder_out.device)
    pre_acoustic_embeds = self.predictor(
        encoder_out, ys_pad, encoder_out_mask, ignore_id=self.ignore_id
    )[0]
    # decoder forward
    decoder_out, _ = self.decoder(
        encoder_out, encoder_out_lens, pre_acoustic_embeds, ys_lengths, return_hidden=True
    )
    selected = self._hotword_representation(hotword_pad, hotword_lengths)
    contextual_info = (
        selected.squeeze(0).repeat(encoder_out.shape[0], 1, 1).to(encoder_out.device)
    )
    num_hot_word = contextual_info.shape[1]
    _contextual_length = (
        torch.Tensor([num_hot_word]).int().repeat(encoder_out.shape[0]).to(encoder_out.device)
    )
    # dha core
    cif_attended, _ = self.seaco_decoder(
        contextual_info, _contextual_length, pre_acoustic_embeds, ys_lengths
    )
    dec_attended, _ = self.seaco_decoder(
        contextual_info, _contextual_length, decoder_out, ys_lengths
    )
    merged = self._merge(cif_attended, dec_attended)
    dha_output = self.hotword_output_layer(
        merged[:, :-1]
    )  # remove the last token in loss

展开

收起

三分钟热度的鱼 2024-07-31 21:37:41 46 0

0 条回答

写回答

取消提交回答

相关问答

modelscope PAI-DSW ipynb无法保存，一保存ipynb就清空了

42

2

0

modelscope-funasr的热词方案对热词的数量有要求吗，如果有上万个热词，这个方案还行吗？

108

1

0

modelscope-funasr的时间戳与热词能同时用吗？

85

0

0

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

108

0

0

modelscope-funasr有语音对话分离demo吗？

74

0

0

modelscope-funasr微调的时候。热词如何添加呢？

120

1

0

modelscope 现在已知的json结构化数据，可以用模型推理出其他图片的json结构么？

40

1

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

126

0

0

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求？

77

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

79

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

热门讨论

热门文章

modelscope-funasr的FunClip怎么安装的？

练的pth模型文件，怎么转成bin文件？

modelscope-funasr实时ASR的微调该怎么操作？

modelscope-funasr在安卓平台可以集成sense voice吗？

llamaindex整合modelscope本地模型，启动报错

modelscope-funasr在AutoModel里设置了关闭了，结果还是会打日志，为什么？

魔搭平台FastChat搭建Qwen-1_8B模型报错求怎么解决？

如何下载llama模型到本地？

pipeline如何设置temperature、top_p参数？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

DeepSeek Artifacts：在线实时预览的前端 AI 编程工具，基于DeepSeek V3快速生成React App

DeepSeek-V2.5-1210 在线开放使用！支持联网搜索，在各大领域的表现得到全面提升

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

MiniRAG：迷你 RAG 系统加成小型语言模型，爆发出与大型语言模型相当的性能

GLM-Zero：智谱AI推出与 OpenAI-o1-Preview 旗鼓相当的深度推理模型，开放在线免费使用和API调用

PsycoLLM：开源的中文心理大模型，免费 AI 心理医生，支持心理健康评估与多轮对话

DeepSeek V3：DeepSeek 开源的最新多模态 AI 模型，编程能力超越Claude，生成速度提升至 60 TPS

Search-o1：人大清华联合推出动态检索推理框架，使模型能够在推理过程中动态检索外部知识

Perplexica：开源 AI 搜索引擎，Perplexity AI 的开源替代品，支持多种搜索模式、实时信息更新

展开全部

相关课程

更多

PAI平台学习路线：机器学习入门到应用

2608

52

去学习

场景实践 - 机器学习PAI实现精细化营销

222

7

去学习

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

179

8

去学习

场景实践 - 基于机器学习进行收入预测分析

108

6

去学习

机器学习概览及常见算法

32970

13

去学习

机器学习入门-概念原理及常用算法

13600

8

去学习

相关电子书

更多

阿里云机器学习平台——PAI 平台 立即下载

机器学习在恶意样本检测方面的实践之路 立即下载

大规模机器学习在蚂蚁+阿里的应用 立即下载

相关实验场景

更多