开发者社区 > ModelScope模型即服务 > 多模态 > 正文

【求助】关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题

关于使用Qwen2-7B-VL多模型模型识别图片某个元素的坐标的问题
我在使用的时候,模型返回的坐标很不准确
image.png

image.png

这是图片上两个位置相差较大的文字元素,但是模型返回的坐标居然是一样的。针对这种情况需要怎么处理。求助!!

展开
收起
游客ffug4tlsqqei4 2024-11-12 15:21:23 62 1
0 条回答
写回答
取消 提交回答

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载