备案控制台

开发者社区 > ModelScope模型即服务 > 正文

ModelScope报错信息什么原因？用的gpu环境

https://modelscope.cn/models/thomas/ChatGLM-6B-Int8/summary ModelScope报错信息什么原因？用的gpu环境

展开

收起

真的很搞笑 2023-05-20 17:27:41 194 0

2 条回答

写回答

取消提交回答

游客mahexp74d6pzw
ModelScope 是一个用于在 PyTorch 中管理模型实例的上下文管理器，通常用于在分布式训练中管理模型副本。如果在 GPU 环境下使用 ModelScope 时出现错误，可能是以下几个原因之一：

未正确安装 DDP（分布式数据并行）库：在分布式训练中，需要使用 DDP 库来管理模型副本和数据并行。如果未正确安装 DDP 库，ModelScope 可能会引发错误。请确保安装了最新版本的 DDP 库。未正确设置环境变量：如果使用 GPU 进行分布式训练，需要设置一些环境变量来告诉进程如何找到其他进程和 GPU。请确保已正确设置这些环境变量，如 DISTRIBUTED_SERVE、DISTRIBUTED_NUM_SOCKET_PROCESSORS、DIST_BACKEND 等。未正确配置进程间通信：在使用 ModelScope 时，需要确保各个进程之间能够进行正确的通信。请检查进程间通信是否配置正确，如使用 Gloo 后端、设置正确的 rank 和 world size 等。以下是一个使用 ModelScope 的示例代码，可以帮助你排查问题：

import torch
import torch.distributed as dist
import ddp_backend
from ddp_backend import ModelScope

初始化进程组

dist.init_process_group("gloo", rank=0, world_size=2)

使用 ModelScope 管理模型实例

with ddp_backend.ModelScope(0):
# 创建模型实例
model = MyModel()
model.to(device)
model.train()
```
# 训练循环中的代码...  
# ...  
```
清理进程组

dist.destroy_process_group() 如果仍然遇到问题，请提供更多详细信息，以便我更好地帮助你解决问题。
2023-05-24 12:50:33

赞同展开评论打赏
芯在这

有个cpm_kernels依赖库提前装下，此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

2023-05-20 17:36:53

赞同展开评论打赏

相关问答

modelscope-funasr服务端部署的话，推荐什么样的GPU？

72

0

0

在modelscope-funasr如果使用GPU的话这个编译需要改什么？

67

0

0

modelscope-funasr的GPU调用失败了，是什么原因？

66

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

93

0

0

ModelScope中.我下载到本地的模型，分析执行时间好像有点长，有办法提高效率吗？

63

1

0

ModelScope微调mego query_poi排序模型时报错，怎么解决？

36

1

0

想提取一段文本中的，物品名称及其相关的数量，有哪些ModelScope模型可以参考？

47

1

0

在modelscope-funasr用离线模型不会报错，用实时模型报错是为什么呢？

36

0

0

modelscope-funasr官网离线模型配置，时间戳与说的话，对不上怎么解决？

93

1

0

ModelScope在尝试门址地址结构化要素解析，使用离线转写模型，为啥离线不了？

53

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope下载速度慢怎么解决？

ModelScope服务器太差了，下个模型断断续续的，有解决办法吗？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ollama+open-webui的一个小问题

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope下载的模型如何转ollama

展开全部

DeepSeek-V2.5-1210 在线开放使用！支持联网搜索，在各大领域的表现得到全面提升

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

阿里云PAI部署DeepSeek及调用

UE-蓝图中的使用正则表达式

VISION XL：支持四倍超分辨率的 AI 视频修复处理工具，提供去除模糊、修复缺失等功能

阿里云通义千问向全社会开放！

Qwen2.5-Max：阿里通义千问超大规模 MoE 模型，使用超过20万亿tokens的预训练数据

实战阿里qwen2.5-coder 32B，如何配置Cline的Ollama API接口。

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Janus-Pro：DeepSeek 开源的多模态模型，支持图像理解和生成

展开全部

相关课程

更多

云原生AI套件：一键训练大模型及部署GPU共享推理服务

82

1

去学习

个性化语音合成模型微调

262

1

去学习

ModelScope社区Library技术架构介绍

229

1

去学习

相关电子书

更多

DeepStream: GPU加速海量视频数据智能处理 立即下载

阿里巴巴高性能GPU架构与应用 立即下载

GPU在超大规模深度学习中的发展和应用 立即下载

相关实验场景

更多