TensorFlow2实现去噪自编码器（Denoising Autoencoder）

2021-12-23 1860

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 去噪自编码器 (Denoising Autoencoder, DAE) 的目的就是用来去除图像中的噪声。本文将利用Tensorflow2实现使用 MNIST 数据集的 DAE。

去噪自编码器(Denoising Autoencoder, DAE)

在介绍去噪自编码器 (Denoising Autoencoder, DAE) 之前，首先介绍下DAE的一种使用场景示例，当我们在夜晚拍照时，或者其他黑暗环境时，我们的照片总是被大量的噪点所充斥，严重影响了图像质量，而 DAE 的目的就是用来去除这些图像中的噪声。为了更好的讲解 DAE，使用简单的 MNIST 数据集进行演示，以将我们的重心放在有关 DAE 的知识上。如下图所示，显示了三组 MNIST 数字。每组的顶行是原始图像 (Original Images)；中间的行显示 DAE 的输入 (Noised Images)，这些输入是被噪声破坏的原始图像，当噪声过多时，我们将很难读懂被破坏的数字；最后一行显示DAE的输出 (Denoised Images)。

8eaaf9c723d0472f9847bd17acd62a1d_tplv-k3u1fbpfcp-zoom-1.png

Tips：如果对于自编码器还不是很了解的话，可以参考自编码器模型详解与实现（采用tensorflow2.x实现）。

接下来就让我们实际构建一个 DAE，以消除图像中的噪声。

DAE模型架构

根据 DAE 的介绍可以将输入定义为：

x = x_orig + noise

其中 x_orig 表示被噪声 noise 破坏的原始 MNIST 图像，编码器的目的是学习潜矢量 z。DAE的损失函数表示为：

屏幕截图 2021-12-23 153400.png

其中，m 是输出的维度，例如在MNIST数据集中，m=width × height×channels=28 × 28 × 1 = 784。x_orig_i 和 x_i 分别是 x_orig 和中的元素。

DAE实现

数据预处理

为了实现 DAE，首先需要构造训练数据集，输入数据是添加噪声的 MNIST 数字，训练输出数据是原始的干净 MNIST 数字。添加的噪声需要满足高斯分布，均值 μ = 0.5，标准差 σ = 0.5。由于添加随机噪声可能会产生小于0或大于1的无效像素值，因此需要将像素值裁剪为 [0.0，1.0] 范围内。

# 数据加载(x_train,_),(x_test,_) =keras.datasets.mnist.load_data()
# 数据预处理image_size=x_train.shape[1]
x_train=np.reshape(x_train,[-1,image_size,image_size,1])
x_test=np.reshape(x_test,[-1,image_size,image_size,1])
x_train=x_train.astype('float32') /255.x_test=x_test.astype('float32') /255.# 产生高斯分布的噪声noise=np.random.normal(loc=0.5,scale=0.5,size=x_train.shape)
x_train_noisy=x_train+noisenoise=np.random.normal(loc=0.5,scale=0.5,size=x_test.shape)
x_test_noisy=x_test+noise# 将像素值裁剪为[0.0，1.0]范围内x_train_noisy=np.clip(x_train_noisy,0.0,1.0)
x_test_noisy=np.clip(x_test_noisy,0.0,1.0)

模型构建与模型训练

#编码器inputs=keras.layers.Input(shape=input_shape,name='encoder_input')
x=inputsforfiltersinlayer_filters:
x=keras.layers.Conv2D(filters=filters,
kernel_size=kernel_size,
strides=2,
activation='relu',
padding='same')(x)
shape=keras.backend.int_shape(x)
x=keras.layers.Flatten()(x)
latent=keras.layers.Dense(latent_dim,name='latent_vector')(x)
encoder=keras.Model(inputs,latent,name='encoder')
# 解码器latent_inputs=keras.layers.Input(shape=(latent_dim,),name='decoder_input')
x=keras.layers.Dense(shape[1]*shape[2]*shape[3])(latent_inputs)
x=keras.layers.Reshape((shape[1],shape[2],shape[3]))(x)
forfiltersinlayer_filters[::-1]:
x=keras.layers.Conv2DTranspose(filters=filters,
kernel_size=kernel_size,
strides=2,
padding='same',
activation='relu')(x)
outputs=keras.layers.Conv2DTranspose(filters=1,
kernel_size=kernel_size,
padding='same',
activation='sigmoid',
name='decoder_output')(x)
decoder=keras.Model(latent_inputs,outputs,name='decoder')
autoencoder=keras.Model(inputs,decoder(encoder(inputs)),name='autoencoder')
# 模型编译与训练autoencoder.compile(loss='mse',optimizer='adam')
autoencoder.fit(x_train_noisy,
x_train,validation_data=(x_test_noisy,x_test),
epochs=10,
batch_size=batch_size)
# 模型测试x_decoded=autoencoder.predict(x_test_noisy)

效果展示

如上图所示，当噪声水平从 σ=0.5 增加到 σ=0.75 和 σ=1.0 时，DAE 具有一定的鲁棒性，可以较好的恢复出原始图像。但是，在 σ=1.0 时，某些数字，没有被正确地恢复。

TensorFlow2实现去噪自编码器（Denoising Autoencoder）

去噪自编码器(Denoising Autoencoder, DAE)

DAE模型架构

DAE实现

数据预处理

模型构建与模型训练

效果展示

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

TensorFlow2实现去噪自编码器（Denoising Autoencoder）

去噪自编码器(Denoising Autoencoder, DAE)

DAE模型架构

DAE实现

数据预处理

模型构建与模型训练

效果展示

热门文章

最新文章

相关课程

相关电子书

相关实验场景