开发者社区 > ModelScope模型即服务 > 语音 > 正文

微调声学模型到底需要多久

服务器是8核32G,独显16G的ECS,按示例训练一个定制TTS模型,在微调声学模型阶段,已经跑了16个小时了,还未出结果,epoch到了39000+了,小白想问一下,大概多久能结束?示例里面讲根据显卡性能不同,大概5~10个小时就能完成,请问这个是基于什么样的硬件配置得出的结论,目前有点懵!!

展开
收起
瑞沃克 2022-12-22 09:28:33 1121 0
2 条回答
写回答
取消 提交回答
  • 通常基于预训练模型微调100k~200k timesteps就可以了,步数达到后可主动结束训练任务。

    教程中给出的时间预估是基于单卡V100 ECS,其他型号的显卡由于性能差异训练时间会有所不同。

    2022-12-26 16:59:23
    赞同 展开评论 打赏
  • 声码器需要的微调时间较长,根据GPU型号不同在12~20小时不等。

    2022-12-23 08:56:27
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载