"flash memory out of bound"
这 commonly 是一个Linux内核限制导致的问题,与ModelScope本身的兼容性无直接关系。
一般来说,有以下可能原因:
V100 GPU可能固件版本过低,不支持背景从内存中分配较大的显存。
Linux内核过低或没有打开相关GPU支持配置。
训练或推理数据太大,超过GPU可用内存限制。
一些解决方法:
1.升级V100固件至最新版本。
2.升级Linux内核增加GPU支持,或开启相关配置。
3.尝试减小batchsize或 sequenceslength降低单次内存占用。
4.使用部分GPU内存限制模型占用。
5.尝试更换容量大一些的GPU访问。
所以总体来说,ModelScope原理上支持V100,但由于内核态限制,在部署时可能会遇到这个问题。