开发者社区阿里云百炼文章正文

QWEN-VL Plus 使用小记

2024-12-11 145

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 近期尝试使用Qwen VL Plus模型处理图像识别任务，以GIS专业背景选择了一张街景图片进行测试。体验上，API调用流畅，环境配置简单，且成本低廉，免费额度可支持约1,000张图片的处理。不过，模型在某些情况下会产生幻觉，如对仅含Google水印的街景图片错误地描述存在地名信息。此外，其文本描述风格多变，从轻松愉快到沉稳不一，有时甚至会拒绝回答。

最近在尝试使用image-text类型的LLM来判断图像。因为是GIS专业的，就随便找了一张街景。采用了Qwen VL Plus模型。

首先调用很丝滑。api配置很简单，环境配置很简单。
其次费用比较低。平均下来，一张图用了差不多1k token，这样的话，免费额度可以问1，000张。
但是回答的幻觉还是有的。

在街景图像中。只有google的水印。但是他描述了图片中有地名的存在……
文本描述能力上，文风多样。一会儿轻快愉悦。一会儿沉稳。甚至拒绝回答。

文章标签：

定位技术

数据安全/隐私保护

API

wsqstar

Deephub

8月前

机器学习/深度学习算法测试技术

使用ORPO微调Llama 3

ORPO是一种结合监督微调和偏好对齐的新型微调技术，旨在减少训练大型语言模型所需资源和时间。通过在一个综合训练过程中结合这两种方法，ORPO优化了语言模型的目标，强化了对首选响应的奖励，弱化对不期望回答的惩罚。实验证明ORPO在不同模型和基准上优于其他对齐方法。本文使用Llama 3 8b模型测试ORPO，结果显示即使只微调1000条数据一个epoch，性能也有所提升，证实了ORPO的有效性。完整代码和更多细节可在相关链接中找到。

Deephub

384 10 10

迟遇

自然语言处理安全机器人

什么是Chat GPT3

随着 Chat GPT 技术的进一步发展，有几个关键方面值得关注。首先是模型的扩展和改进。尽管 Chat GPT 在生成对话方面取得了很大的进展，但仍然存在一些局限性。模型在处理复杂问题和多轮对话时可能存在困难，很容易陷入回答模棱两可或不相关的内容。因此，改进模型在上下文理解和对话逻辑方面的能力是很重要的。其次是对话的多模态处理。目前的 Chat GPT 模型主要基于文本输入和生成。然而，与人类对话经常伴随着语音、图像和其他非文本的元素不同，模型在多模态对话中的表现仍然较弱。因此，将多模态信息整合到 Chat GPT 中，使其能够更好地处理多媒体对话，将是一个有挑战性但有前景的方向。

迟遇

221 0 0

不要葱姜蒜

19天前

搜索推荐物联网 PyTorch

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

不要葱姜蒜

521 34 40

游客s67t3mdq4gcco

18天前

存储 JSON 安全

使用 Qwen 进行Self-instruct数据生成

使用Qwen进行自指令数据生成，通过Self-instruct技术自动化为大型语言模型生成指令。用户可安装CAMEL包并设置Qwen API密钥，配置ChatAgent和SelfInstructPipeline，基于种子指令迭代生成大量新指令。支持多种过滤器（如长度、关键词、标点符号等）确保生成指令的质量和多样性。欢迎加入Discord获取支持与交流。

游客s67t3mdq4gcco

90 8 8

aliyun4381607004

17天前

并行计算 PyTorch 算法框架/工具

阿里云PAI-部署Qwen2-VL-72B

阿里云PAI-部署Qwen2-VL-72B踩坑实录

aliyun4381607004

147 1 1

游客prweojgbzagj2

23天前

机器学习/深度学习人工智能算法

QWEN-VL 也能打星际!!!

基于Camel agent框架和 QWEN-VL实现的星际争霸2 多模态决策环境, 提出了基于vlm的self-attention 算法

游客prweojgbzagj2

155 0 0

little1d

2月前

人工智能 JSON 监控

Qwen2.5-Coder-7B-Instruct Lora 微调 SwanLab 可视化记录版

本节我们简要介绍如何基于 transformers、peft 等框架，对Qwen2.5-Coder-7B-Instruct 模型进行Lora微调。使用的数据集是中文法律问答数据集 DISC-Law-SFT，同时使用 SwanLab 监控训练过程与评估模型效果。

little1d

204 4 4

小王老师呀

6月前

人工智能自然语言处理算法

GPT-4 Turbo 和 GPT-4 的区别

GPT-4 vs GPT-4 Turbo: 探索OpenAI的顶级模型，GPT-4以其出色的文本生成和理解闻名，适合高端内容需求，但成本高；GPT-4 Turbo，优化版，提供相似性能但更高效、经济，适用于大规模商业应用，尤其在速度和资源效率上展现优势。用户可根据质量、效率和成本需求选择合适模型。

小王老师呀

142 4 4

算精通

4月前

自然语言处理 API Python

LLaMA

【9月更文挑战第26天】

算精通

165 63 63

ModelScope内容运营小助手

5月前

自然语言处理资源调度机器人

10G显存，使用Unsloth微调Qwen2并使用Ollama推理

本文主要使用Unsloth基于Qwen2基础模型微调对话机器人以及在Ollama上运行。

ModelScope内容运营小助手

580 0 0

QWEN-VL Plus 使用小记

阿里云百炼

热门文章

最新文章

相关电子书

相关实验场景