强化学习概述与基础

简介: 强化学习概述与基础

强化学习概述与基础

前言

2016年AlphaGo赢了与人类的围棋比赛。 在一阶段人工智能迅速火热起来,这是对新闻有所稍微知道的人都有了解的,在这个背后到底是什么推动AlphaGo强大的棋力的,这不得不来说一下今天主题:强化学习

一、强化学习概述

强化学习(Reinforcement Learning, RL),又称奖励学习、评价学习或增强学习,是机器学习的范式和方法论之一,他描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

比如:一个走迷宫的机器人。机器人在观察周围环境,根据他的观测来决定自己如何继续走下一步。错误的路线让他浪费时间,正确路线可以成功走出迷宫。在这个例子中,浪费时间就是对这个机器人惩罚,当然走出去就是对机器人的奖励了。

可以发现强化学习系统中有两个关键的因素:奖励和策略

智能机在行动后对结果好的就奖励,错的就惩罚,策略就是观测环境采取不同的行动。智能机在不停的学习,在学习中不停的改变策略。以最快最好的走出迷宫。这就是强化学习。

二、强化学习与机器学习

强化学习是和监督学习,非监督学习并列的第三种机器学习方法

强化学习来和监督学习区别是它是没有监督学习已经准备好的训练数据输出值的。强化学习只有奖励值,但是这个奖励值和监督学习的输出值不一样,它不是事先给出的,而是延后给出的,比如上面的例子里走路摔倒了才得到大脑的奖励值。同时,强化学习的每一步与时间顺序前后关系紧密。而监督学习的训练数据之间一般都是独立的,没有这种前后的依赖关系。

再来看看强化学习和非监督学习的区别。也还是在奖励值这个地方。非监督学习是没有输出值也没有奖励值的,它只有数据特征。同时和监督学习一样,数据之间也都是独立的,没有强化学习这样的前后依赖关系。

三、强化学习应用

在人工智能迅速火热这一段时间中。基于强化学习的人工智能已经有许多成功的案例的

  • 电动游戏:主要指的是当年打的电动游戏,玩家根据屏幕画面,来操作游戏,比如星际争霸,吃豆子这样的
  • 棋盘游戏:围棋,象棋,五子棋,军旗
  • 自动驾驶:自动驾驶的问题是控制方向盘,油门,刹车等,其可以在电脑虚拟环境中进行模拟学习,最后可以明确的达到目的。

四、强化学习主要算法

  • Sarsa算法
  • Q学习算法
  • 基于经验回放的DQN算法
  • QAC算法
  • 蒙特卡罗树搜索算法
    等等
    这一部份只是简单列举一下,详情可以参考李宏毅老师的强化学习课程

最后。如果文章中有不足之处,请务必指出,一定迅速改正。谢谢

相关文章
|
2月前
|
机器学习/深度学习 数据可视化 算法
经典时间序列分析概述:技术、应用和模型
时间序列数据按时间顺序收集,具有时间维度的重要性,需专门技术和模型进行分析预测。其应用广泛,涵盖经济预测、风险管理、天气预报、气候建模、流行病学、患者监测、需求预测、客户行为分析及预测性维护等领域。时间序列特征包括趋势、季节性和周期性模式。自相关和偏自相关用于衡量数据点间关系,白噪声表示无自相关的时间序列。平稳性指统计特性随时间保持一致,对建模至关重要。常见模型包括ARMA、ARIMA、SARIMA、ARCH和GARCH,用于捕捉复杂动态并预测未来模式。选择合适模型和确定顺序对准确预测至关重要。掌握这些基础知识不仅增强对复杂模型的理解,还能确保预测方法的稳健性和可靠性。
67 1
经典时间序列分析概述:技术、应用和模型
|
28天前
|
机器学习/深度学习 人工智能 算法
机器学习概述
机器学习概述
19 0
|
3月前
|
机器学习/深度学习 算法 搜索推荐
【机器学习】机器学习的基本概念、算法的工作原理、实际应用案例
机器学习是人工智能的一个分支,它使计算机能够在没有明确编程的情况下从数据中学习并改进其性能。机器学习的目标是让计算机自动学习模式和规律,从而能够对未知数据做出预测或决策。
87 2
|
6月前
|
机器学习/深度学习 算法 图计算
图机器学习入门:基本概念介绍
图机器学习是机器学习的分支,专注于处理图形结构数据,其中节点代表实体,边表示实体间关系。本文介绍了图的基本概念,如无向图与有向图,以及图的性质,如节点度、邻接矩阵。此外,还讨论了加权图、自循环、多重图、双部图、异构图、平面图和循环图。图在描述数据关系和特征方面具有灵活性,为机器学习算法提供了丰富的结构信息。
138 0
|
机器学习/深度学习 人工智能 算法
机器学习概述(三)
机器学习概述(三)
|
6月前
|
机器学习/深度学习 数据可视化 数据挖掘
强化学习第1天:强化学习概述
强化学习第1天:强化学习概述
|
机器学习/深度学习 人工智能 自然语言处理
机器学习概述(一)
机器学习概述(一)
106 2
|
机器学习/深度学习 人工智能 算法
机器学习概述(二)
机器学习概述(二)
|
机器学习/深度学习 人工智能 算法
深度学习概述(一)
深度学习概述(一)
|
机器学习/深度学习 TensorFlow 算法框架/工具
深度学习概述(二)
深度学习概述(二)
103 0
下一篇
无影云桌面