Softmax 多分类 | 学习笔记

简介: 快速学习 Softmax 多分类

开发者学堂课程【Tensorflow 2.0入门与实战Softmax 多分类】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/664/detail/11105


Softmax多分类


内容介绍

一、softmax 分类

二、tf.keras 交叉熵

三、Fashion MNIST


一.softmax 分类

对数几率回归解决的是二分类的问题,对于多个选项的问题,我们可以使用softmax 函数它是对数几率回归在N个可能不同的值上的推广

神经网络的原始输出不是一个概率值,实质上只是输入的数值做了复杂的加权和与非线性处理之后的一个值而已,那么如何将这个输出变为概率分布?

这就是 Softmax 层的作用。

image.png

softmax 要求每个样本必须属于某个类别,且所有可能的样本均被覆盖。

softmax 个样本分量之和为1,当只有两个类别时,与对数几率回归完全相同。

 

二、tf.keras 交叉熵

在 tf.keras 里,对于多分类问题我们使用 categorical_crossentropy 和sparse_categorical_crossentropy 来计算 softmax 交叉熵。

softmax 输出的是概率值,使用交叉熵来计算两个概率分布之间的损失。

 

三、Fashion MNIST

Fashion MNIST 的作用是成为经典 MNIST 数据集的简易替换,MNIST 数据集包含手写数字(0、1、2等)的图像,这些图像的格式与本节课中使用的服饰图像的格式相同。

Fashion MNIST 比常规 MNIST 手写数据集更具挑战性。这两个数据集都相对较小,用于验证某个算法能否如期正常运行。它们都是测试和调试代码的良好起点。

如果第一次接触深度学习或做实验,推荐使用 Fashion MNIST 比较简单。

MNIST 手写数据集将作为作业。

Fashion MNIST 数据集包含70000张灰度图像,涵盖10个类别

image.png

我们将使用60000张图像训练网络,并使用10000张图像评估经过学习的网络分类图像的准确率。划分了训练数据和测试数据,这种方法比较客观。

import tensorflow as tf

print(’Tensorflow Version:{}’.format(tf._version_))

Tensorflow Version:2.0.0-alpha()

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline

(train_image,train_lable),(test_image,test_lable)=tf.keras.datasets.fashion_ mnist.lo

可以从 TensorFlow 直接访问 FashionMNIST,只需导入和加载数据即可。

用代码如何取加载 FashionMNIST 数据集

引入 TensorFlow 使用 tf.keras.datasets 加载 FashionMNIST 。

加载以后第一部分为 train_image 和 train_lable,第二部分为 test_image 和 test_lable。

如果是第一次运行,会在国外的网站上下载 FashionMNIST 的数据集,速度会很慢。

 

 

 

相关文章
|
存储 安全 Shell
⭐⭐【Shell 命令集合 文件传输 】Linux ftp工具 使用指南
⭐⭐【Shell 命令集合 文件传输 】Linux ftp工具 使用指南
471 0
|
10月前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
本书介绍了如何将Python与Excel结合使用,以提升数据分析和处理效率。内容涵盖Python入门、pandas库的使用、通过Python包操作Excel文件以及使用xlwings对Excel进行编程。书中详细讲解了Anaconda、Visual Studio Code和Jupyter笔记本等开发工具,并探讨了NumPy、DataFrame和Series等数据结构的应用。此外,还介绍了多个Python包(如OpenPyXL、XlsxWriter等)用于在无需安装Excel的情况下读写Excel文件,帮助用户实现自动化任务和数据处理。
|
数据挖掘 Python
利用Python进行数据分析PDF下载经典数据分享推荐
**Python数据分析大师作,Wes McKinney亲著,详述数据操作、清洗与分析。第2版面向Python 3.6,涵盖pandas、NumPy、IPython和Jupyter更新,实战案例丰富;第3版已升级至Python 3.10和pandas 1.4,继续引领数据科学潮流。[PDF下载](https://zhangfeidezhu.com/?p=337)**
717 0
利用Python进行数据分析PDF下载经典数据分享推荐
|
机器学习/深度学习 数据采集 监控
深度学习之在线学习与适应
基于深度学习的在线学习与适应,旨在开发能够在不断变化的环境中实时学习和调整的模型,使其在面对新数据或新任务时能够迅速适应并维持高性能。
353 0
|
存储 C语言
【学习笔记】verilog HDL之二:数据类型与表达式
本文介绍了Verilog语言中的常量、变量和表达式。Verilog有四种基本值:0、1、x(未知)和z(高阻)。整型常量有十进制和基数两种格式,实数型常量包括浮点数,字符串常量由双引号括起的字符序列构成。变量分为线网型和寄存器型,线网型包括wire、tri等11种类型,寄存器型有reg、integer、time等,其中reg可声明存储器。表达式中的操作数包括常数、参数、线网等8种类型,操作符包括算术、关系、逻辑等9种类型。
|
存储 缓存 运维
解密一致性哈希算法:实现高可用和负载均衡的秘诀
解密一致性哈希算法:实现高可用和负载均衡的秘诀
1657 0
|
算法 搜索推荐
信息流短视频时长多目标优化
背景       信息流短视频排序目前使用的是基于CTR预估Wide&Deep排序模型。在此基础上继续一系列优化,通过引入相关性信号、体感信号、多场景的样本融合、高层排序模型取得了不错收益。       信息流短视频模型优化可分为两部分优化: 感知相关性优化——点击模型以优化(CTR/CLICK为
8364 0
|
弹性计算 编解码 负载均衡
阿里云飞天洛神2.0:开放弹性的云网络NFV平台
作为飞天系统的核心组件,洛神平台支撑了超大规模租户、超大规模虚拟机的高性能云网络。其中洛神2.0 NFV平台的定位是构建通用、灵活的平台能力,降低业务网元NFV化的门槛和成本,实现了复杂业务网元超高的灵活性和弹性。
5534 0
阿里云飞天洛神2.0:开放弹性的云网络NFV平台
|
机器学习/深度学习 TensorFlow API
TensorFlow 2.0 快速入门指南:第一部分
TensorFlow 2.0 快速入门指南:第一部分
385 0
|
人工智能 供应链 数据可视化
电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。
电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。
电子商务平台市场动向的数据分析平台:阿里商品指数,包括淘宝采购指数,淘宝供应指数,1688供应指数。