大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
语音
>
正文
Paraformer语音识别-中文-通用-16k-离线-large-pytorch有对应数据集吗
Paraformer语音识别-中文-通用-16k-离线-large-pytorch有对应数据集吗
展开
收起
Paraformer语音识别-中文-通用-16k-离线-large-pytorch
游客epyicmb4unyj2
2023-03-01 15:32:08
991
0
0
条回答
写回答
取消
提交回答
相关问答
语音
在modelscope-funasr用的paraformer的一个语音识别模型,怎么加上热词?
126
0
0
Paraformer语音识别,实时识别是否支持方言?
29
0
0
Paraformer 语音识别,API 识别出结果,从哪里知道用户说的是什么语言?
46
0
0
modelscope-funasr有没有专门的数字语音识别,最好是离线的模型?
42
1
0
ModelScope在线都正常,离线就废了,可以制作一个基于pytorch模型的镜像吗?
42
1
0
UniASR语音识别-粤语简体-通用-16k-离线modelscope-funasr版本应该用什么?
68
1
0
Paraformer语音识别声学模型包含哪些主要组成部分?
116
1
0
请问机器学习PAI的Alink可以加载预训练好的pytorch模型嘛?
113
4
0
modelscope-funasr中文离线转写服务GPU版本,如何指定pytorch模型和版本呢?
30
1
0
我现在在pytorch上训练了一个bert模型,请问用什么方法可以尽快在函数计算上部署并引出接口捏?
49
0
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关产品
智能语音交互
文档详情
产品详情
热门讨论
热门文章
modelscope上跑报错,提示要pip install ttsfrd,搞不定
8165
关于 Windows平台上 ttsfrd 库的问题。
1989
No module named 'ttsfrd'
1490
KeyError: 'asr-inference is not in the pipelines r
2162
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
707
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
1087
pip安装语音领域模型依赖报错。
513
modelscope 更新指定版本
481
ttsfrd 是不开源的吗
3963
语音合成speech_sambert-hifigan_tts_zh-cn_16k模型没有使用gpu
356
展开全部
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
1140
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
320
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
228
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
229
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
48
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
37
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
167
KAN-TTS 在 conda 环境下无法安装 ttsfrd
1365
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
64
ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本
108
展开全部
相关课程
更多
达摩院智能语音交互 - 人机对话技术浅析
156
4
去学习
达摩院智能语音交互 - 声纹识别技术
2878
4
去学习
阿里巴巴智能语音交互技术与应用
7255
7
去学习
达摩院智能语音交互 - 语音识别技术
316
4
去学习
达摩院智能语音交互 - 语音合成技术
589
4
去学习
相关文章
这是我设想的智慧审讯室的系统解决方案
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
《鸿蒙Next:让人工智能语音交互听懂每一种方言和口音》
《鸿蒙Next中的新兴人工智能算法:适应性与性能的双重提升》
昇腾AI行业案例(七):基于 Conformer 和 Transformer 模型的中文语音识别
相关电子书
更多
阿里云总监课第二期——IoT时代的语音交互智能
立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用
立即下载
智能语音交互:阿里巴巴的研究与实践
立即下载
相关镜像
pytorch-wheels
blender
python-release