大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
多模态
>
正文
有趣的体验,超人VS蝙蝠侠,希望越来越好
展开
收起
文本生成视频大模型-英文-通用领域
通义小二
2023-04-04 19:20:47
1353
0
0
条回答
写回答
取消
提交回答
相关问答
多模态
this xml file does not appear to have any style in
34398
8
0
如果购买了域名,一定要备案才能用吗
38125
36
0
com/action/joingroup?code=v1是什么意思
207514
20
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
233822
10
0
OSS的endpoint如何查看
30422
3
0
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
94775
16
0
配置了安全组规则,端口还是无法访问
28047
21
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
56516
30
0
企业邮箱
9031
7
0
建设网站
3767
2
0
ModelScope模型即服务
多模态
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域
我要提问
热门讨论
热门文章
关于qwen2-vl微调最佳实践
77
为什么用vllm部署qwen2-2b-vl,传输2张照片却,只回答一张照片的问题?
248
在4卡4090(24G)服务器上利用modelscope离线部署Qwen2vl-Flux时报错
50
有人遇到吗?modelscope:cuda is not available, using cpu
1053
!pip install open_clip_torch !pip install pytorch-
474
请问Qwen-VL怎么用自己的数据集微调
1324
怎么修改model scope的默认存储位置
237
中文CLIP模型卷土重来,这次加量不加价!
761
你好,在官方提供的实例上运行,报了下图错误。即使把modelscope库更新到1.8.4还是存在问题
141
【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题
95
展开全部
Large Motion Model:多模态运动生成模型,能够同时处理文本、音乐、视频等多种模态生成相应的运动动作
365
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
156
WeaveFox:蚂蚁集团推出 AI 前端智能研发平台,能够根据设计图直接生成源代码,支持多种客户端和技术栈
880
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
301
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
96
Eko:一句话就能快速构建复杂工作流的 AI 代理开发框架!快速实现自动操作电脑和浏览器完成任务
96
MiniCPM-o 2.6:面壁智能开源多模态大模型,仅8B参数量就能媲美GPT-4o,支持实时交互,在ipad等终端设备上运行
86
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
241
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
83
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
54
展开全部
相关文章
24.7K Star!用 KHOJ 打造你的AI第二大脑,自动整合和更新多源知识,轻松构建个人知识库
Pipecat实战:5步快速构建语音与AI整合项目,创建你的第一个多模态语音 AI 助手
ParGo:字节与中山大学联合推出的多模态大模型连接器,高效对齐视觉与语言模态
【潜意识Java】蓝桥杯算法有关的动态规划求解背包问题
Java数组:静态初始化与动态初始化详解
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载