多层感知机(二)

简介: 多层感知机(二)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):多层感知机(二)

课程地址:https://edu.aliyun.com/course/3112108/lesson/19267

 

多层感知机(二)

三、BP神经网络算法概述


BP 神经网络算法,BP 是 back propagation,BP 算法是神经网络深度学习里面最重要的算法之一,了解这个算法可以让我们更加了解神经网络深度学习模型训练的本质。

BP 神经网络是在 1986 年的时候就提出来的概念,它是一种按照误差命传播算法训练的多层神经网络,是应用会最广泛的神经网络模型之一。


BP 神经网络算法其实它的这个思想就已经写在这里,就是正向传播求损失,反向传播求误差,回传误差,它是根据误差的信号来修正每一层的权重。


比如你去投篮,打篮球的时候去投篮,把球扔向篮筐的时候可能力气大了,可能力气小了,我们目标就是把篮球投进去,每次投篮的时候,如果投不进,就要进行调整,这个调整就是学习的过程,神经网络的训练跟你去打篮球,这个投篮训练是很像的,你去训练的时候很重要的就是你需要有这个反馈,就是要知道你这个投篮的时候问题在哪里?是这个力气大了,还是力气小了还是这个方向不对正向传播求损失,就是按照现在的模式去投篮,投篮之后你需要去观察这个损失,你的力气大了还是小了,这个差别就是这个损失。


比如我这次投篮力气大了,那损失就是力气大了,这个投篮投过了,那我要把这个学习进来。我知道大了很多,我下一次就要修正,下次出手的力量要少一点,这个就是反向传播,我看到,我学习,我要调整,我下一次的动作就小一点,他可能就进。


这个根据误差信号来修正其实也是你投篮力气大了很多,你就是小多一点,力气小得多一点,如果下次力气小了,小了一点点,你下次调整就稍微大一点,这个修正误差的时候是根据上修正这个权重的时候,是根据上一次的误差来做这个调整的。


所以这里面有几个关键词,一个是损失,损失就是投篮的时候离这个投进差了多少,然后这个怎么样去修正这个权重,也就是你根据这个损失大小,回来去调整权重,这样就达到一个训练的目

BP 神经网络就是这样,就是正向传播,正向传播来了一个数据,就相当于你去投篮,开始有一个输入的值,它穿过隐层,比如这里用 sigmoid 的这个函数,然后输出,得到一个预测值,预测值就是你扔出去的那个,真实值就好像篮框真正的这个位置一样,他们可能差有差别,这个差别其实就是差别大了之后说明这个训练的不够,但是他们两个可以得到损失值,就根据预测值和真实值,就知道损失值是怎样。


根据这个损失值再反向的回去调整,根据损失值来调节这个参数,调节完之后下一次再输入训练得到预测值,再根据这个输入的训练的真实值来调整,然后再改变这个权重。你训练的时候要先知道我们在这个训练这个神经网络的时候是有训练数据的,其实已经预先知道这个输入值和这个真实值,你经过这种不断的训练,用数据不断的去训练,然后不断地去调节这个参数,这个神经网络就会被训练到这个误差,这个损失值会越来越小。


有可能是设定误差损失值小到什么程度之后就停止,或者我训练多少次之后停止。这个像打球时,我可能连续投进 10 个球就停止训练,或者是我今天要投进 200 个球,投完 200 个球,然后才能完成这个训练,就是按照训练次数或者是训练目标来决定什么时候完成。


这个算法的思想就是这个 BP 神经网络算法,这里在调节这个权重去进行修正的时候,就可以用我们之前有提到的这个梯度下降的方式去调节,这里面还有很多技术可以调优的地方。 BP 神经网络算法,我们就介绍到这里。

图片518.png

 

四、本节回顾

 

通过本节的学习,我们学到了:

1、感知机的概述

感知机是一种有监督的二分类算法,只能解决线性问题

2、多层感知机的层级结构与激活函数

多层感知机的层级结构主要包含输入层、隐藏层和输出层,可以用于拟合非线性函数

激活函数是一种在人工智能神经网络的神经单元上运行的函数,旨在帮助网络学习数据中的复杂模式,负责将神经元节点的输入映射到输出端

常见激活函数:Sigmoid函数、Tanh函数、ReLU函数等等

3、BP神经网络算法

BP神经网络是一种按误差逆传播算法训练的多层神经网络,正向传播求损失,反向传播回传误差,根据误差信号修正每层的权重

相关文章
|
机器学习/深度学习 运维 算法
Machine Learning机器学习之向量机(Support Vector Machine,SVM)
Machine Learning机器学习之向量机(Support Vector Machine,SVM)
|
5月前
|
存储 人工智能 安全
2025年跨境电商新标配:区块链溯源+AI验货+DAO治理的“信任三角”
区块链技术通过不可篡改的溯源体系、智能合约和去中心化验证,有效解决跨境电商代购中的商品真伪、物流造假与支付安全问题,提升交易透明度与消费者信任。
|
28天前
|
JSON 监控 API
淘宝天猫商品评论API,轻松采集评论数据
淘宝天猫商品评论API可获取商品评分、评论内容、晒图等结构化数据,支持分页、排序及按评价类型筛选,助力电商数据分析与口碑监控。
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
生成式人工智能的价值回归:重塑技术、社会与个体的发展轨迹
生成式人工智能(Generative AI)正以前所未有的速度重塑社会面貌。它从单一决策工具转变为创造性生产力引擎,推动知识生产、艺术创作与科学研究的发展。同时,其广泛应用引发社会生产力和生产关系的深刻变革,带来就业结构变化与社会公平挑战。此外,生成式AI还面临伦理法律问题,如透明性、责任归属及知识产权等。培生公司推出的生成式AI认证项目,旨在培养专业人才,促进技术与人文融合,助力技术可持续发展。总体而言,生成式AI正从工具属性向赋能属性升华,成为推动社会进步的新引擎。
|
JavaScript 前端开发 API
`toISOString()` 方法将日期对象转换为字符串
`toISOString()` 方法将日期对象转换为字符串
542 1
|
机器学习/深度学习 人工智能 自然语言处理
【AI系统】知识蒸馏原理
本文深入解析知识蒸馏(Knowledge Distillation, KD),一种将大型教师模型的知识高效转移至小型学生模型的技术,旨在减少模型复杂度和计算开销,同时保持高性能。文章涵盖知识蒸馏的基本原理、不同类型的知识(如响应、特征、关系知识)、蒸馏方式(离线、在线、自蒸馏)及Hinton的经典算法,为读者提供全面的理解。
1109 2
【AI系统】知识蒸馏原理
|
存储 SQL 分布式计算
湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
【10月更文挑战第7天】湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
902 1
java导出word
java导出word
|
存储 机器学习/深度学习 人工智能
AIGC训练场景下的存储特征研究
在今天这样以AIGC为代表的AI时代下,了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告,来看看AIGC对于存储有哪些具体的性能要求。
1417 4
AIGC训练场景下的存储特征研究
|
缓存 监控 API
利用Python构建高性能的Web API后端服务
随着微服务架构的普及和RESTful API的广泛应用,构建高性能、可扩展的Web API后端服务变得尤为重要。本文将探讨如何利用Python这一强大且灵活的语言,结合现代Web框架和工具,构建高效、可靠的Web API后端服务。我们将分析Python在Web开发中的优势,介绍常用的Web框架,并通过实际案例展示如何设计并实现高性能的API服务。