文档备案控制台

开发者社区 ModelScope模型即服务正文

ModelScope中，qwen有没有能力传入照片后分析出照片中物体的3d坐标？

ModelScope中，qwen有没有能力传入照片后分析出照片中物体的3d坐标？

展开

收起

小小爱吃香菜 2024-03-26 22:24:27 382 版权

2 条回答

写回答

取消提交回答

为了利利

3d坐标目前还不能。Qwen-VL 可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。https://www.modelscope.cn/models/qwen/Qwen-VL-Chat/summary 此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2024-03-27 12:25:21

赞同展开评论
请看我回答~

阿里云大降价~

Qwen系列模型是阿里巴巴推出的大型多模态模型，其中包括视觉语言模型Qwen-VL。根据目前公开的信息，Qwen具备处理视觉信息能力，但具体是否能够直接分析出照片中物体的3D坐标，这一功能并未明确提及。

Qwen-VL作为视觉多模态版本的大型模型，其主要特点是结合了视觉和语言的处理能力，这意味着它能够理解和分析图像内容，并结合语言信息进行交互和推理。在视觉识别领域，模型通常需要识别和理解图像中的物体、场景和文本等信息。然而，从2D图像中直接提取3D坐标是一项复杂的任务，通常需要专门的算法和技术来处理，如深度学习中的立体匹配、深度估计或使用3D传感器数据。

如果您需要从照片中获取物体的3D坐标，可能需要专门的3D视觉技术或者结合其他硬件设备来实现。例如，使用深度相机或者结构光技术来捕捉物体的三维信息，或者通过计算机视觉算法如立体视觉、光学测距等方法来估算3D坐标。此外，还可以考虑使用专业的3D建模软件或者服务来进行更为复杂的3D重建工作。

总之，虽然Qwen系列模型在视觉多模态领域具有强大的能力，但关于其是否能够直接输出照片中物体的标，目前没有确切的信息。如果需要实现这一功能，可能需要结合其他技术和设备来完成。

2024-03-27 08:48:28

赞同展开评论

相关问答

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

331

0

0

java如何使用DashScope SDK对接qwen-long上传文件获取分析结果

547

1

0

在4卡4090（24G）服务器上利用modelscope离线部署Qwen2vl-Flux时报错

495

1

0

通义千问-max不能对知识库的结构化数据进行全量读取和分析吗？

384

1

0

在modelscope上下载qwen2的0.5版本，左边这个正常加载，右边这个报错，为什么？

383

1

0

ModelScope我微调Qwen2-7B-Instruct,loss一直不变是什么原因？

363

1

0

ModelScope中.我下载到本地的模型，分析执行时间好像有点长，有办法提高效率吗？

326

1

0

ModelScope中，用qwen7b训练没有错，训练的时候报错了，怎么解决？

195

1

0

ModelScope中，想建立一个自己的客服ai，qwen如何集成知识库呀？

203

1

0

ModelScope有 qwen-agent 的讲解视频么？

201

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关解决方案

更多

精准分析检索，打造商品推荐体验

SelectDB实现日志高效存储与实时分析

分析 Agent 实现一键 AI 数据洞察

实现 MySQL 到 ADB 秒级分析性能

泛时序数据一站式分析与洞察

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope镜像地址是什么？

ModelScope下载速度慢怎么解决？

modelscope-funasr的onnxruntime c++只能使用onnx结尾的模型吗？

cuda 是11.3，ModelScope的mmcv怎么安装？

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个免费额度可以在哪里查询啊？

IndexTTS 部署报错：No module named 'tn'

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

展开全部

中企投资印度新能源“有戏”吗？

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

docker安装部署FunASR

HTTPS 原理

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

展开全部

还有其他疑问?