备案控制台

开发者社区云计算文章正文

paraforme支持speech_noise_threshold吗？

2023-10-11 66

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 请问：speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch这个模型支持设置 speech_noise_threshold 这个参数吗？vad 本身是支持的，但对这个集成的模型好像不起作用？如果支持，应该如何正确地设置呢？如果不支持，那该模型有没有什么方法可以过滤掉背景噪声？经常会有背景噪声被识别出文字

请问：speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch
这个模型支持设置 speech_noise_threshold 这个参数吗？
vad 本身是支持的，但对这个集成的模型好像不起作用？
如果支持，应该如何正确地设置呢？
如果不支持，那该模型有没有什么方法可以过滤掉背景噪声？
经常会有背景噪声被识别出文字

sp2d5xzxc5z3o

目录

相关文章

Bigcrab__

|

7月前

|

算法 BI 计算机视觉

[Initial Image Segmentation Generator]论文实现：Efficient Graph-Based Image Segmentation

[Initial Image Segmentation Generator]论文实现：Efficient Graph-Based Image Segmentation

Bigcrab__

64 1 1

LeapMay

|

算法 PyTorch 算法框架/工具

论文解读：LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions

论文解读：LaMa:Resolution-robust Large Mask Inpainting with Fourier Convolutions

LeapMay

712 0 0

sp2d5xzxc5z3o

paraformer支持设置 speech_noise_threshold 这个参数吗？

请问：speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 这个模型支持设置 speech_noise_threshold 这个参数吗？ vad 本身是支持的，但对这个集成的模型好像不起作用？如果支持，应该如何正确地设置呢？如果不支持，那该模型有没有什么方法可以过滤掉背景噪声？经常会有背景噪声被识别出文字

sp2d5xzxc5z3o

64 0 0

南山小雨

|

存储编解码语音技术

swr_get_out_samples和swr_convert，比特率重采样

swr_get_out_samples和swr_convert，比特率重采样

南山小雨

200 0 0

swr_get_out_samples和swr_convert，比特率重采样

旅途中的宽~

|

机器学习/深度学习人工智能自然语言处理

【计算机视觉】CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching

CORA 在目标检测任务中提出了一种新的 CLIP 预训练模型适配方法，主要包括 Region Prompting 和 Anchor Pre-Matching 两部分。这种方法能够让 CLIP 模型适应目标检测的任务，能够识别出图像中的对象，并提供准确的分类和定位信息。

旅途中的宽~

885 0 0

宋wz

PointNet++:Deep Hierarchical Feature Learning on Points Sets in a Metrci Space 学习笔记

PointNet++:Deep Hierarchical Feature Learning on Points Sets in a Metrci Space 学习笔记

宋wz

83 0 0

LiBiGo

|

机器学习/深度学习算法图形学

Deep learning based multi-scale channel compression feature surface defect detection system

简述：首先应用背景分割和模板匹配技术来定义覆盖目标工件的ROI区域。提取的感兴趣区域被均匀地裁剪成若干个图像块，每个块被送到基于CNN的模型，以分类杂乱背景中不同大小的表面缺陷。最后，对空间上相邻且具有相同类别标签的图像块进行合并，以生成各种表面缺陷的识别图。

LiBiGo

152 0 0

auqbllxiu

《Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation》电子版地址

Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation

auqbllxiu

83 0 0

《Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation》电子版地址

诸神缄默不语

|

数据挖掘

Re15：读论文 LEVEN: A Large-Scale Chinese Legal Event Detection Dataset

Re15：读论文 LEVEN: A Large-Scale Chinese Legal Event Detection Dataset

诸神缄默不语

312 0 0

Re15：读论文 LEVEN: A Large-Scale Chinese Legal Event Detection Dataset

二进制人工智能

IPDAE: Improved Patch-Based Deep Autoencoder for Lossy Point Cloud Geometry Compression

二进制人工智能

101 0 0

热门文章

最新文章

天猫精灵开放平台-之小百科测评

语义检索系统：基于Milvus 搭建召回系统抽取向量进行检索，加速索引

3D立方体图片切换动画

模态对话框和非模态对话框

Windows XP客户端加域操作手册上

微信 6.5.1 for iOS发布可以在朋友圈分享相册中的视频

Chapter 1: Creating the GUI Form and Adding Widgets

【Mockplus教程】帐号和购买

「Mac畅玩鸿蒙与硬件42」UI互动应用篇19 - 数字键盘应用

赋能加速AI应用交付，F5 BIG-IP Next for Kubernetes方案解读

RAG分块策略：主流方法（递归、jina-seg）+前沿推荐（Meta-chunking、Late chunking、SLM-SFT）

Python学习的自我理解和想法（2）

Transformer图解

API安全专题：如何有效应对新型Bot攻击？

Selenium IDE：Web自动化测试的得力助手

《docker高级篇（大厂进阶）：5.Docker-compose容器编排》包括是什么能干嘛去哪下、Compose核心概念、Compose使用三个步骤、Compose常用命令、Compose编排微服务

24/7全时守护：AI视频监控技术的深度实现与应用分享

《docker高级篇（大厂进阶）：6.Docker轻量级可视化工具Portainer》

相关电子书

更多

Audio Tagging with Compact Feedforward Sequential Memory Network and Audio-to-Audio Ratio Based Data Augmentation

Hail: Scaling Genetic Data Ana

Smart Scalable Feature Reduction with Random Forests

下一篇

阿里云无影云电脑免费试用，最长可试用3个月