计算机视觉-推荐-第2页-阿里云开发者社区-阿里云

开发者社区> ModelScope模型即服务> 计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

今日

3369

内容

活动

272

关注

来自： ModelScope模型即服务

文章

视频

问答

精华

游客umldh5c6n2vvg

4月前

问答

AIGC的训练器无法上传素材

143 1 0

蚝油菜花

10月前

机器学习/深度学习人工智能监控

博文

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

Amodal3R是一种创新的条件式3D生成模型，通过掩码加权多头交叉注意力机制和遮挡感知层，能够从部分可见的2D图像中重建完整3D形态，仅用合成数据训练即可实现真实场景的高精度重建。

483 13 13

蚝油菜花

11月前

人工智能编解码测试技术

博文

TripoSG：3D生成新纪元！修正流模型秒出高保真网格，碾压传统建模

TripoSG 是 VAST AI 推出的基于大规模修正流模型的高保真 3D 形状合成技术，能够从单张图像生成细节丰富的 3D 网格模型，在工业设计、游戏开发等领域具有广泛应用前景。

501 15 20

蚝油菜花

11月前

人工智能 vr&ar 图形学

博文

谷歌DeepMind联手牛津推出Bolt3D：AI秒速3D建模革命！单GPU仅需6秒生成3D场景

牛津大学与谷歌联合推出的Bolt3D技术，能在单个GPU上仅用6.25秒从单张或多张图像生成高质量3D场景，基于高斯溅射和几何多视角扩散模型，为游戏、VR/AR等领域带来革命性突破。

567 2 2

蚝油菜花

11月前

机器学习/深度学习人工智能图形学

博文

I2V3D：微软+港城大黑科技！单图秒变3D动态视频，相机轨迹自由操控

I2V3D 是由香港城市大学和微软联合开发的图像到视频生成框架，支持将静态图像转换为动态视频，基于3D几何引导实现精确的动画控制，适用于动画制作、视频编辑和内容创作等领域。

366 3 3

蚝油菜花

12月前

机器学习/深度学习人工智能自然语言处理

博文

VideoGrain：零样本多粒度视频编辑神器，用AI完成换装改场景，精准控制每一帧！

VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架，基于调节时空交叉注意力和自注意力机制，实现类别级、实例级和部件级的精细视频修改，保持时间一致性，显著优于现有方法。

538 0 0

ykanyezdnax7a

3月前

问答

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

107 0 0

游客wwcr5vyhxncgw

10月前

问答

凹多边形的三角细分模型有什么呢

147 0 0

蚝油菜花

11月前

人工智能图形学

博文

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

PhysGen3D是清华等高校联合开发的创新框架，通过单张图像重建3D场景并模拟物理行为，实现从静态图像到动态交互的突破性转换。

344 15 15

游客qw5nyup6bl6vc

2月前

人工智能

问答

创业项目：AI 拟人化中层解决方案

236 0 0

游客5dbqqnkbzrtgi

8月前

SQL

问答

在部署 SQL Server Express MCP 远程连接不通，求解

126 0 0

游客ub22igak5qixo

12月前

问答

请教大家，modelscope有能让图片中模糊文字变清晰的模型吗？

252 1 0

1452750375310896

12月前

算法框架/工具 PyTorch 开发工具

问答

RetinaFace下载下来的模型验证失败

327 1 0

你好！

登录掌握更多精彩内容

账号登录

我的内容

我的收藏

模型库

数据集

创空间

文档

更多版块

自然语言处理语音多模态科学计算

活跃用户

游客matpicq467xsy

游客brznjmavl6orc

游客np2duztwuwslq

计算机视觉

最新

文章

视频

问答

推荐

精华

AIGC的训练器无法上传素材

Amodal3R：3D重建领域新突破！这个模型让残破文物完美还原，3D重建结果助力文物修复

TripoSG：3D生成新纪元！修正流模型秒出高保真网格，碾压传统建模

谷歌DeepMind联手牛津推出Bolt3D：AI秒速3D建模革命！单GPU仅需6秒生成3D场景

I2V3D：微软+港城大黑科技！单图秒变3D动态视频，相机轨迹自由操控

VideoGrain：零样本多粒度视频编辑神器，用AI完成换装改场景，精准控制每一帧！

请教使用百度在线标注后的多数据集用llamafactory训练qwen2.5或3-vl系列的模型问题

凹多边形的三角细分模型有什么呢

PhysGen3D：清华等高校联合推出，单图秒变交互式3D场景

创业项目：AI 拟人化中层解决方案

在部署 SQL Server Express MCP 远程连接不通，求解

请教大家，modelscope有能让图片中模糊文字变清晰的模型吗？

RetinaFace下载下来的模型验证失败

活跃用户

相关产品