modelscope-funasr没有方法生成自己数据集的token?我训练自己的数据集,里面有中文和英文,但我看tokenlist里面并不能完全包含打标的内容。
这个没有关系,你先finetune,看看影响有多大,如果影响很大,可以自己手动把不在tokens.txt里面的word加进去(seg_dict也一起)。此回答整理自钉群“modelscope-funasr社区交流”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352