大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 "" 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
语音
正文
这个模型的代码对CUDA的要求是什么?
另外pytorch的版本是哪个?
展开
收起
Paraformer语音识别-中文-通用-16k-离线-large-pytorch
653fzul3xijgw
2023-03-01 10:58:55
776
分享
版权
1
条回答
写回答
取消
提交回答
通义小二
您好,麻烦您留下对应的模型信息哈~ 感谢~
2023-03-02 17:51:42
赞同
展开评论
相关问答
语音
购买阿里国外的云服务器是否可以访问谷歌?
90924
49
0
this xml file does not appear to have any style in
59435
11
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
279567
11
0
访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁,您的访问被阻断”,这是什么原因?
140157
16
0
#支付宝 授权提示请在支付宝客户端打开链接
22014
19
0
配置https后网页打开出现ERR_SSL_VERSION_OR_CIPHER_MISMATCH错误
46347
2
0
yyyy-MM-dd'T'HH:mm:ss.SSSZZ和yyyy-MM-dd'T'HH:mm:ss.
46747
9
0
#支付宝 周期扣款无线端唤起签约页面提示“免密支付安全验证”?
6889
2
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
63218
32
0
sql server的用户名和密码怎么查啊?
40449
21
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关文章
TraceML:用三行代码为训练循环加入 step 级诊断
万字详解:普通开发者如何用Ollama、llama.cpp把大模型无缝跑在本地消费级显卡上?
零基础转型人工智能,最该先搞懂的5个核心概念
基于SIFT特征提取与匹配的MATLAB图像拼接
如何在单张 RTX 3090 上让 Qwen3.5-27B token 生成速度提升 6 倍
相关解决方案
更多
零代码微调,打造领域专属大模型
基于 Spark 和 PyTorch 的模型训练方案
OpenAI 重磅开源,快速部署GPT-OSS模型
零代码搭建 DeepSeek 版个人知识库
模型蒸馏:让0.6B模型媲美235B模型
热门讨论
热门文章
语音识别端到端模型解读:FSMN及其变体模型
iic/speech_sambert-hifigan_tts_zh-cn_16k模型实时合成
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
七大模型最新开源,推理速度升级,几行代码可实现微调
modelscope报错
Paraformer语音识别-中文-通用-16k-离线-large-pytorch如何训练
SamberHifigan搞了一下午才跑通,先说结论...
关于 Windows平台上 ttsfrd 库的问题。
文献阅读:X-VECTOR--用于说话人识别的鲁棒深度神经网络嵌入
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
展开全部
docker安装部署FunASR
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
展开全部
还有其他疑问?
咨询AI助理