开发者社区 > 百炼大模型 > 正文

dashcope 中的视觉问答中的图像数据格式的支持

通过python的 sdk (dashscope)访问通义视觉模型(如 qwen-vl-plus), MultiModalConversation 类的消息参数(messages),其中 content支持图片问答,如果要上传图片,目前支持url方式或者本地文件(看代码本地文件是会先上传到 oss然后取得 url地址),是否有考虑支持 Image对象或者base64编码的图片数据?

目前很多的多模态处理库,都支持base64 编码的图片,比如 openai sdk,autogen 等。而且在很多情况下图片数据是通过各种方式获取的,比如直接获取的摄像头数据,如果能支持 Image对象或者base64编码的图片数据将会很有用。

展开
收起
1220302993610537 2024-05-30 23:14:28 83 0
1 条回答
写回答
取消 提交回答
  • 您好,辛苦您加入“阿里云百炼使用体验”群的钉钉群号: 65295003032,在钉钉群内反馈您的问题

    2024-06-21 14:55:11
    赞同 展开评论 打赏

基于通义系列大模型和开源大模型的一站式大模型服务平台,提供「生成式大模型的全流程应用工具」和「企业大模型的全链路训练工具」。为大模型,也为小应用。 阿里云百炼官网网址:https://www.aliyun.com/product/bailian

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载