如下图中的红框位置,本人使用的是官方的demo代码,除了单张本地图片和图片url可以传入,可以传入【多张图片】进行图像识别吗?
Qwen-VL-Chat 模型目前并不支持一次处理多张图片的功能。
该模型仅支持一次处理一张图片,并且只能返回该图片的一份文本描述。如果您想同时处理多张图片,那么您需要多次调用该模型,并分别对每张图片进行处理。
当然,您也可以考虑自己编写一些自定义代码来处理这种情况。例如,您可以编写一段 Python 代码,将所有图片合并成一张大图,然后再将其传递给 Qwen-VL-Chat 模型进行处理。
不可以。目前 qwen-vl-chat 模型不支持传入多张图片进行图像识别。根据官方文档,该模型仅支持传入单张本地图片或图片 URL。如果你需要进行多张图片的图像识别,
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352