产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
多模态
>
正文
ofa有没有多语言的版本?
已解决
ofa有没有多语言的版本?
展开
收起
OFA视觉问答模型-英文-通用领域-huge
叫我饭啊啊
2023-02-24 09:42:41
585
0
1
条回答
写回答
取消
提交回答
大口吃饭饭啊
推荐回答
暂时还没有multi-lingual的的版本哈,目前是单独分开了中文和英文。
2023-02-24 10:32:05
赞同
展开评论
打赏
相关问答
多模态
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
55837
29
0
this xml file does not appear to have any style in
30360
8
0
如果购买了域名,一定要备案才能用吗
36789
35
0
OSS的endpoint如何查看
29747
3
0
办理ICP经营许可证,需要网络接入协议,去哪下载
3453
2
0
com/action/joingroup?code=v1是什么意思
205580
20
0
企业邮箱
8727
7
0
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
92656
16
0
配置了安全组规则,端口还是无法访问
27426
21
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
229276
10
0
ModelScope模型即服务
多模态
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域
我要提问
热门讨论
热门文章
为什么用vllm部署qwen2-2b-vl,传输2张照片却,只回答一张照片的问题?
162
请问Qwen-VL怎么用自己的数据集微调
1258
!pip install open_clip_torch !pip install pytorch-
441
【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题
71
下载模型之后,模型的大小验证缺不通过,请问这是什么原因?
664
怎么修改model scope的默认存储位置
201
如何本地化(局域网内)部署Qwen的多模态大模型,用作推理 并自有程序调用
146
18领域的文本分类模型在什么场景使用呢?
1681
OFA文生图模型,显存空间不足的问题如何解决
1737
text2video模型生成视频只有2s钟
1599
展开全部
Florence-VL:微软和马里兰大学共同开源的多模态大语言模型
71
NVILA:英伟达开源视觉语言大模型,高效处理高分辨率图像和长视频
49
GLM-4V-Flash:智谱 AI 免费开放的图像理解大模型 API 接口
45
MEMO:通过音频和图像生成肖像说话视频,感知音频中的情感来细化面部表情
36
Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式
83
Optimus-1:哈工大联合鹏城实验室推出挑战开放世界中长期任务的智能体框架
28
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
55
OmniSearch:阿里巴巴通义推出的多模态检索增强生成框架
127
GenMAC:港大、清华联合微软推出文本到视频生成的多代理协作框架
21
ACE:阿里通义实验室推出的全能图像生成和编辑模型
69
展开全部
相关文章
FineWeb 2:开源的多语言预训练数据集,覆盖超过 1000 种语言
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
Ultravox:端到端多模态大模型,能直接理解文本和语音内容,无需依赖语音识别
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
《C++赋能自然语言处理:词向量模型的构建与应用》
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载