开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

单个GPU显存较小,无法推理,如何设置多卡推理?

我们单个GPU显存较小,无法推理,ms有办法指定多卡推理吗?是device参数吗?

展开
收起
游客o4k5mx22dpaco 2023-05-11 10:44:20 867 0
1 条回答
写回答
取消 提交回答
  • 如果GPU显存较小或推理速度较慢,可开启半精度推理。临时的解决方法是使用源代码安装modelscope,然后将 modelscope/models/nlp/fid_T5/text_generation.py 文件76行# self.backbone.half()解除注释,mass后续sdk版本会支持可配置开启/关闭 半精度推理。

    2023-05-19 08:31:12
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
DeepStream: GPU加速海量视频数据智能处理 立即下载
阿里巴巴高性能GPU架构与应用 立即下载
GPU在超大规模深度学习中的发展和应用 立即下载