开发者社区云计算文章正文

基于VisualGLM-6B大模型的本地部署与推理

2024-12-12 102

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文是基于清华开源的VisualGLM-6B 支持图像中英文的多模态对话语言模型，进行了一系列本地的简单部署，包括环境配置、模型部署、演示推理、模型微调（官方提供的代码），由于个人电脑显存不足，最后是在阿里云服务器交互式平台DSW终端进行微调和训练操作的。

VisualGLM-6B 依靠来自于 CogView 数据集的30M高质量中文图文对，与300M经过筛选的英文图文对进行预训练，中英文权重相同。该训练方式较好地将视觉信息对齐到ChatGLM的语义空间；之后的微调阶段，模型在长视觉问答数据上训练，以生成符合人类偏好的答案

由于采用轻量化部署推理，显存只占用7.8GB,可进行本地推理。

visualGLM-6B大语言模型的web界面推理演示：图像分析、按指令输出结果

香港理工大学wangrongsheng同学基于VisualGLM-6B,利用公开数据集微调训练出的XrayGLM,可实现对X光片进行解析和患者建议，本人只是进行的本地推理演示。

GLM_ONE

阿里云大数据Al技术

9月前

人工智能算法开发工具

Mixtral 8X7B MoE模型在阿里云PAI平台的微调部署实践

Mixtral 8x7B 是Mixtral AI最新发布的大语言模型，是当前最为先进的开源大语言模型之一。阿里云人工智能平台PAI，提供了对于 Mixtral 8x7B 模型的全面支持，开发者和企业用户可以基于 PAI-快速开始轻松完成Mixtral 8x7B 模型的微调和部署。

阿里云大数据Al技术

134614 6 9

魔搭ModelScope社区小助手

30天前

缓存异构计算

DashInfer-VLM，多模态SOTA推理性能，超vLLM！

DashInfer-VLM是一个针对于视觉多模态大模型VLM的推理架构，特别优化了Qwen VL模型的推理加速，DashInfer-VLM和其他的VLM的推理加速框架最大的区别是，它把VIT部分和LLM部分进行了分离，并且VIT和LLM的运行是并行运行，不互相干扰。

魔搭ModelScope社区小助手

362 16 16

技术小达人

22天前

并行计算 API 调度

加速大语言模型推理：NVIDIATensorRT-LLM更新

本次分享由NVIDIA亚太区资深总监李曦鹏主讲，聚焦于加速大语言模型推理的挑战与解决方案。内容涵盖大模型推理优化、性能提升策略及KVCash在用户请求处理中的应用。通过TensorRT-LLM的更新，NVIDIA提供了高性能推理引擎和多种优化技术，如KVCache优化、InflightBatching等，大幅提升了大模型的推理效率。此外，还介绍了与魔搭社区的合作，支持超过50个主流模型的一键部署，显著降低了使用门槛和成本。

技术小达人

65 1 1

游客5wgpwz4lyt4j6

3月前

机器学习/深度学习人工智能算法

从 OpenAI-o1 看大模型的复杂推理能力

深入解析OpenAI o1模型的复杂推理技术与发展历程

游客5wgpwz4lyt4j6

191 1 1

叫做饺子

2月前

自然语言处理并行计算 API

Qwen模型应用：微调与部署实践

叫做饺子

561 0 0

阿里云云原生

9月前

机器学习/深度学习人工智能 Cloud Native

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

阿里云云原生

101872 2 2

ModelScope运营小助手

9月前

物联网 Shell Swift

NPU推理&微调大模型实战

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope运营小助手

2264 5 5

ModelScope内容运营小助手

5月前

文字识别自然语言处理数据可视化

Qwen2.5 全链路模型体验、下载、推理、微调、部署实战！

在 Qwen2 发布后的过去三个月里，许多开发者基于 Qwen2 语言模型构建了新的模型，并提供了宝贵的反馈。在这段时间里，通义千问团队专注于创建更智能、更博学的语言模型。今天，Qwen 家族的最新成员：Qwen2.5系列正式开源

ModelScope内容运营小助手

3185 5 5

bruce_xiaowei

3月前

存储弹性计算自然语言处理

基础大模型 vs 应用大模型

基础大模型（如GPT-3、BERT等）通过大量通用数据训练，具备强大的泛化能力。应用大模型则在此基础上进行微调，针对特定任务优化。两者均将知识编码在参数中，而非直接存储原始数据，实现“自然留存”。阿里云提供多种大模型和服务，欢迎体验。

bruce_xiaowei

67 0 0

LDG_AGI

6月前

机器学习/深度学习人工智能关系型数据库

【机器学习】Qwen2大模型原理、训练及推理部署实战

LDG_AGI

918 0 0

基于VisualGLM-6B大模型的本地部署与推理

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

基于VisualGLM-6B大模型的本地部署与推理

热门文章

最新文章

相关课程

相关电子书

相关实验场景