热门
服务器是8核32G,独显16G的ECS,按示例训练一个定制TTS模型,在微调声学模型阶段,已经跑了16个小时了,还未出结果,epoch到了39000+了,小白想问一下,大概多久能结束?示例里面讲根据显卡性能不同,大概5~10个小时就能完成,请问这个是基于什么样的硬件配置得出的结论,目前有点懵!!
通常基于预训练模型微调100k~200k timesteps就可以了,步数达到后可主动结束训练任务。
教程中给出的时间预估是基于单卡V100 ECS,其他型号的显卡由于性能差异训练时间会有所不同。
声码器需要的微调时间较长,根据GPU型号不同在12~20小时不等。
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域