开发者社区 > ModelScope模型即服务 > 正文

ModelScope代码:这个怎么处理呀?

ModelScope代码:import tempfile

from modelscope.msdatasets import MsDataset
from modelscope.metainfo import Trainers
from modelscope.trainers import build_trainer

my_csv = 'results/1.csv'

train_ds = MsDataset.load('csv', data_files=[my_csv])

print(next(iter(train_ds)))

通过data_files参数传入list来批量加载

my_csv_1 = 'results/1.csv'
my_csv_2 = 'results/sam.csv'

ds = MsDataset.load('csv', data_files={'train': [my_csv_1], 'test': [my_csv_2]})

以此类推,其它类型(txt/json/jsonl)数据也可采用此方式加载

训练数据的输入出均为文本,需要将数据集预处理为输入为 src_txt,输出为 tgt_txt 的格式:

train_dataset = MsDataset.load('csv', data_files=[my_csv_1]).remap_columns({'input_text': 'src_txt', 'category': 'tgt_txt'})
eval_dataset = MsDataset.load('csv', data_files=[my_csv_2]).remap_columns({'input_text': 'src_txt', 'category': 'tgt_txt'})

num_warmup_steps = 500

def noam_lambda(current_step: int):
current_step += 1
return min(current_step(-0.5),
current_step * num_warmup_steps
(-1.5))

可以在代码修改 configuration 的配置

def cfg_modify_fn(cfg):
cfg.train.lr_scheduler = {
'type': 'LambdaLR',
'lr_lambda': noam_lambda,
'options': {
'by_epoch': False
}
}
cfg.train.optimizer = {
"type": "AdamW",
"lr": 1e-3,
"options": {}
}
cfg.train.max_epochs = 3
cfg.train.dataloader = {
"batch_size_per_gpu": 8,
"workers_per_gpu": 1
}
return cfg

if name == 'main':
kwargs = dict(
model='F:/study/graduationProject/openingReport/nlp_mt5_zero-shot-augment_chinese-base',
model_revision="master",
train_dataset=train_dataset,
eval_dataset=eval_dataset,
work_dir=tempfile.TemporaryDirectory().name,
cfg_modify_fn=cfg_modify_fn)
trainer = build_trainer(
name=Trainers.text_generation_trainer, default_args=kwargs)
trainer.train()
报错:RuntimeError: expected scalar type Long but found Int这个怎么处理呀?

展开
收起
夹心789 2024-06-09 08:25:32 34 0
1 条回答
写回答
取消 提交回答
  • 改torch代码functional.py5726cf49b9360300de62f1d3d69bde6d.png
    ,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-06-11 09:44:39
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载