开发者社区 > ModelScope模型即服务 > 语音 > 正文

请问一下FRCRN官方模型的复现问题,是否是通过给出的流程能复现出官方提供的模型呢?

你好,因为自己复现的结果和官方提供的模型效果出入比较大,想对FRCRN的复现问几个问题

  1. 想知道官方提供的pytorch_model.bin文件,就是下载https://modelscope.cn/datasets/modelscope/ICASSP_2021_DNS_Challenge/summary中的训练集合,然后用

生成1300h的训练数据训练的模型吗,没有使用额外的或者规模超过1300h的数据吗

  1. 在模型训练过程中,默认的每条音频的长度是16000点也就是1s,这个和官方的操作是一样的是吗

  2. 想知道官方的模型的训练策略,是按照默认训练配置训练200epoch吗?

展开
收起
游客35ii6aa7eq57e 2023-02-09 14:43:33 1292 0
4 条回答
写回答
取消 提交回答
  • 你好,请问你后续有复现成功吗?

    2023-11-16 15:08:18
    赞同 展开评论 打赏
  • 你好,我想请问下,你找到复现结果和官方模型效果出入比较大的原因了吗?是训练数据的问题,还是训练epoch的问题,或者其它,谢谢!

    2023-02-20 15:11:39
    赞同 展开评论 打赏
  • 你好,模型官方提供的模型是使用相同流程训练出来的,就是训练了200 epoch。因为每个用户的数据是自己生成的,具体训练效果可能有少许出入,但应该差别不大。可以先检查下DNS-Challenge数据集是否下载完整,因为数据存储在境外,经常有下载中断的情况。即使数据下载不完整,生成噪音数据时也不会报错,所以容易被忽略。如果数据下载完整,再看是否训练满了200 epoch,有没有中途停止。

    2023-02-17 15:00:42
    赞同 展开评论 打赏
  • GitHub https://github.com/co63oc/cloud

    可以增加epoch训练

    2023-02-09 20:19:34
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载