视觉智能平台中,我看返回值里面没有物体坐标,我需要物体坐标计算大小,通用图像打标是否支持多物体呢?
视觉智能平台的通用图像打标功能确实支持多物体识别。但是,返回值中通常不会直接提供物体的坐标信息。
如果您需要计算物体的大小,可以通过以下步骤进行:
首先,使用视觉智能平台的通用图像打标功能对图像进行物体识别,获取到每个物体的标签信息。
然后,根据标签信息确定每个物体在图像中的位置。这可以通过查找每个标签对应的矩形框来实现。
接下来,根据矩形框的位置和尺寸信息,可以计算出每个物体的大小。矩形框的位置通常是以左上角的坐标表示,而尺寸则是矩形框的宽度和高度。
最后,您可以根据需要对物体的大小进行进一步的处理或分析。
需要注意的是,物体的大小计算可能会受到图像分辨率、物体形状等因素的影响,因此在实际应用中可能需要进行一些额外的处理和校准。
确实,视觉智能平台的通用图像打标服务可以识别图像中的主体内容并为其打上类型标签,它支持数千个内容标签,基本覆盖了常见的物体品类。在返回结果中,如果一张图片中有多个感兴趣物体,标签的格式会包含左上角x坐标,左上角y坐标,宽度,高度和类别标签。例如:"10 10 20 20 cat" 和 "15 15 30 30 dog"这样用空格隔开的形式来表示不同的物体及其位置信息。因此,您可以通过解析这些坐标信息来计算物体的大小。如果您需要进一步的帮助,欢迎通过在线咨询获取阿里云视觉智能的在线人工帮助。
是的,支持多物体。通用图像打标是没有返回物体的位置信息的。平台有物体检测会返回物体位置坐标,但是支持的物体标签有限。可以看下,如果这个不满足,那平台就没有其他能力满足需求了
https://help.aliyun.com/zh/viapi/developer-reference/api-b68b50
此回答整理自钉群“阿里云视觉智能开放平台咨询1群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。