人工智能被定义为对理性主体的研究。理性主体可以是做出决策的任何事物,如个人、公司、机器或软件。它在考虑过去和当前的感知(代理在给定实例中的感知输入)后执行具有最佳结果的操作。一个 AI 系统由一个agent 和它的环境组成。代理人在他们的环境中行动。环境可能包含其他代理。
代理是任何可以被视为:
通过传感器感知其环境和
通过执行器作用于该环境
注意:每个代理都可以感知自己的动作(但并不总是效果)
要了解智能代理的结构,我们应该熟悉体系结构和代理程序。架构是代理执行的机器。它是一种带有传感器和执行器的设备,例如,机器人汽车、相机、PC。代理程序是代理功能的实现。代理函数是从感知序列(代理迄今为止所感知的所有历史记录)到动作的映射。
Agent = 架构 + Agent 程序
代理示例:
软件代理具有击键、文件内容、接收的网络包(充当传感器)并在屏幕上显示、文件、发送的网络包充当执行器。
Human-agent 有眼睛、耳朵和其他充当传感器的器官,以及充当执行器的手、腿、嘴和其他身体部位。
机器人代理具有充当传感器的相机和红外测距仪以及充当执行器的各种电机。
代理类型
代理可以根据他们感知的智能和能力程度分为五类:
简单反射剂
基于模型的反射代理
基于目标的代理
基于效用的代理
学习代理
简单的反射剂
简单反射代理忽略其余的感知历史,仅根据当前感知采取行动。感知历史是智能体迄今为止所感知的所有历史。代理功能基于条件-动作规则。条件-动作规则是将状态(即,条件)映射到动作的规则。如果条件为真,则采取行动,否则不采取行动。此代理功能仅在环境完全可观察时才会成功。对于在部分可观察环境中运行的简单反射代理,无限循环通常是不可避免的。如果代理可以随机化其动作,则有可能摆脱无限循环。
简单反射剂的问题是:
智力非常有限。
不知道状态的非感知部分。
通常太大而无法生成和存储。
如果环境发生任何变化,则需要更新规则集合。
基于模型的反射代理
它通过查找条件与当前情况匹配的规则来工作。基于模型的代理可以通过使用关于世界的模型来处理部分可观察的环境。代理必须跟踪由每个感知调整并取决于感知历史的内部状态。当前状态存储在代理内部,该代理维护某种结构来描述世界中不可见的部分。
更新状态需要以下信息:
世界如何独立于代理人而发展,以及
代理人的行为如何影响世界。
基于目标的代理
这些类型的代理根据他们目前离目标的距离(理想情况的描述)做出决定。他们的每一个动作都是为了缩短与目标的距离。这允许代理在多种可能性中进行选择,选择达到目标状态的一种。支持其决策的知识被明确表示并且可以修改,这使得这些代理更加灵活。他们通常需要搜索和计划。基于目标的代理的行为可以很容易地改变。
基于效用的代理
以其最终用途作为构建块而开发的代理称为基于实用程序的代理。当有多种可能的选择时,为了决定哪一个是最好的,使用基于效用的代理。他们根据每个状态的偏好(效用)选择行动。有时实现预期目标是不够的。我们可能会寻找更快、更安全、更便宜的旅程来到达目的地。应该考虑代理人的幸福感。效用描述了代理有多“快乐” 。由于世界的不确定性,效用主体选择最大化预期效用的行动。效用函数将状态映射到描述相关幸福程度的实数。
学习代理人 :
人工智能中的学习代理是一种可以从过去的经验中学习或具有学习能力的代理。它开始以基本知识行动,然后能够通过学习自动行动和适应。
学习代理主要有四个概念组件,它们是:
学习元素:它负责通过从环境中学习来做出改进
评论家:学习元素从评论家那里获取反馈,这些反馈描述了代理在固定性能标准方面的表现。
性能元素:负责选择外部动作
问题生成器:此组件负责建议将导致新的和信息丰富的体验的操作。