RuntimeError: The size of tensor a (61) must match the size of tensor b (846) at non-singleton dimension 1
输入数据的维度不匹配引起的。根据错误消息中提供的信息,输入数据的维度不匹配,导致无法进行运算。
在训练声码器时,通常需要将音频数据(wav)和相应的标签数据(如prosody)作为输入。确保这两个数据的维度匹配是非常重要的。
具体来说,错误消息中提到的维度不匹配是在第1个非单例维度上发生的,即维度1。根据错误消息中的信息,tensor a 的维度大小为 61,而 tensor b 的维度大小为 846。这意味着在进行某个操作时,两个张量在维度1上的大小不匹配。
要解决这个问题,你可以检查以下几点:
确保输入数据的维度正确:检查输入数据的维度是否与模型的期望输入维度匹配。确保音频数据和标签数据的形状(shape)相同或兼容。
检查数据预处理过程:确保在将数据输入到模型之前,对数据进行了正确的预处理。例如,确保音频数据和标签数据具有相同的采样率、长度和对齐方式。
检查模型参数设置:确保模型的参数设置与输入数据的维度匹配。例如,检查模型的输入尺寸、输出尺寸和隐藏层尺寸是否与输入数据的维度一致。