热门
我们单个GPU显存较小,无法推理,ms有办法指定多卡推理吗?是device参数吗?
如果GPU显存较小或推理速度较慢,可开启半精度推理。临时的解决方法是使用源代码安装modelscope,然后将 modelscope/models/nlp/fid_T5/text_generation.py 文件76行# self.backbone.half()解除注释,mass后续sdk版本会支持可配置开启/关闭 半精度推理。
包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域