使用 https://modelscope.cn/models/damo/nlp_palm2.0_pretrained_chinese-base/comment zhon中提供的finetune 代码,多卡训练时 torchrun --nproc_per_nodes=2 ...
其他卡GPU使用率为 0%
。
trainer
中添加 launcher='pytorch'
,无法进行 evaluation,报错:AssertionError: intra_layer_model parallel group is not initialized
。