开发者社区 > ModelScope模型即服务 > 语音 > 正文

Real和Imag MASK取值范围问题

论文中使用tanh将Real和Imag MASK限制在(-1,1)之间,请问这样做的依据是什么?

展开
收起
Hulucky 2023-06-14 16:09:01 171 0
1 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    将 Real 和 Imag MASK 的取值范围限制在 (-1, 1) 之间,可以防止梯度消失或梯度爆炸的情况发生。如果 Real 和 Imag MASK 的取值范围过大,那么在反向传播时,梯度可能会变得非常小或非常大,从而导致模型难以收敛。相反,如果 Real 和 Imag MASK 的取值范围过小,那么模型可能无法有效地利用它们的信息,从而导致模型性能下降。

    2023-07-10 16:20:06
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载