Pytorch 基于LeNet的手写数字识别

2022-11-08 186

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Pytorch 基于LeNet的手写数字识别

✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。
🍎个人主页：小嗷犬的博客
🍊个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。
🥭本文内容：Pytorch 基于LeNet的手写数字识别
更多内容请见👇

Python sklearn实现SVM鸢尾花分类

Python sklearn实现K-means鸢尾花聚类

Pytorch 基于AlexNet的服饰识别（使用Fashion-MNIST数据集）

介绍

使用到的库：

Pytorch

matplotlib

安装：

pip install matplotlib

Pytorch 环境配置请自行百度。
数据集：
使用 MNIST 数据集(Mixed National Institute of Standards and Technology database)。是美国国家标准与技术研究院收集整理的大型手写数字数据库，包含60,000个示例的训练集以及10,000个示例的测试集。

下载地址：
http://yann.lecun.com/exdb/mnist/
本文使用 Pytorch 自动下载。
LeNet 是由 Yann Lecun 提出的一种经典的卷积神经网络，是现代卷积神经网络的起源之一。本文使用的 LeNet 为 LeNet-5。结构图如下：

1.导入相关库

import torch
from torch import nn
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt

2.定义 LeNet-5 网络结构

# reshape输入为28*28的图像
class Reshape(nn.Module):
    def forward(self, x):
        return x.view(-1, 1, 28, 28)


# 定义网络
net = nn.Sequential(Reshape(), nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
                    nn.AvgPool2d(kernel_size=2, stride=2),
                    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
                    nn.AvgPool2d(kernel_size=2, stride=2),
                    nn.Flatten(),
                    nn.Linear(16*5*5, 120), nn.Sigmoid(),
                    nn.Linear(120, 84), nn.Sigmoid(),
                    nn.Linear(84, 10))

3.下载并配置数据集和加载器

# 下载并配置数据集
train_dataset = datasets.MNIST(root='./dataset', train=True,
                               transform=transforms.ToTensor(), download=True)
test_dataset = datasets.MNIST(root='./dataset', train=False,
                              transform=transforms.ToTensor(), download=True)

# 配置数据加载器
batch_size = 64
train_loader = DataLoader(dataset=train_dataset,
                          batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_dataset,
                         batch_size=batch_size, shuffle=True)

4.定义损失函数和优化器

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(net.parameters())

5.定义训练函数并训练和保存模型

def train(epochs):
    # 训练模型
    for epoch in range(epochs):
        for i, (images, labels) in enumerate(train_loader):
            outputs = net(images)
            loss = criterion(outputs, labels)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            if i % 50 == 0:
                print(
                    f'Epoch: {epoch + 1}, Step: {i + 1}, Loss: {loss.item():.4f}')

        correct = 0
        total = 0
        for images, labels in test_loader:
            outputs = net(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()

        print(f'Accuracy: {correct / total * 100:.2f}%')

    # 保存模型
    torch.save(net.state_dict(),
               f"./model/LeNet_Epoch{epochs}_Accuracy{correct / total * 100:.2f}%.pth") 


train(epochs=5)

6.可视化展示

def show_predict():
    # 预测结果图像可视化
    loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)
    plt.figure(figsize=(8, 8))
    for i in range(9):
        (images, labels) = next(iter(loader))
        outputs = net(images)
        _, predicted = torch.max(outputs.data, 1)
        title = f"Predicted: {predicted[0]}, True: {labels[0]}"
        plt.subplot(3, 3, i + 1)
        plt.imshow(images[0].squeeze(), cmap="gray")
        plt.title(title)
        plt.xticks([])
        plt.yticks([])
    plt.show()

show_predict()

7.预测图

结果来自训练轮数 epochs=10，准确率 Accuracy=98.42%的模型：

包含错误预测的结果：

8.加载现有模型（可选）

本文的训练函数会保存每次训练的模型，下一次预测可以不调用训练函数，而是直接加载已经保存的模型来进行预测：

# 加载保存的模型
net.load_state_dict(torch.load("./model/LeNet_Epoch10_Accuracy98.42%.pth"))

请根据自己的情况修改路径。

Pytorch 基于LeNet的手写数字识别

介绍

1.导入相关库

2.定义 LeNet-5 网络结构

3.下载并配置数据集和加载器

4.定义损失函数和优化器

5.定义训练函数并训练和保存模型

6.可视化展示

7.预测图

8.加载现有模型（可选）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Pytorch 基于LeNet的手写数字识别

介绍

1.导入相关库

2.定义 LeNet-5 网络结构

3.下载并配置数据集和加载器

4.定义损失函数和优化器

5.定义训练函数并训练和保存模型

6.可视化展示

7.预测图

8.加载现有模型（可选）

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像