贝叶斯推断3| 学习笔记

简介: 快速学习贝叶斯推断3。

开发者学堂课程【机器学习算法 :贝叶斯推断3】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7275


贝叶斯推断3

 

一、最大后验估计

1.最大后验概率估计(Maximum A posteriori Estimation,MAE)最大后验估计是根据经验数据获得对难以观察的量的点估计。与最大似然估计类似,但是最大的不同时,最大后验估计的融入了要估计量的先验分布在其中。故最大后验估计可以看做规则化的最大似然估计。

2.例:

想判断某硬币是否均匀,抛十次,得到的结果是:反正正正正反正正正反,请做出合理的判断。

用最大后验估计的思路来考虑该问题:

该方法的主要思路是最大化后验概率(名字也是由此而来): image.png

硬币已经投完,现在要求 θ,在 x 样本出现前提下,求θ应该取什么值。

其中x为已经发生过的事实,即抛硬币的结果,所以 P(x) 是一个已知的值,和你多次抛硬币的结果相关。

如做了100次试验(每次试验都抛十次硬币),当前结果出现了20次,则概率P(x)=20%,该值可计算。

接下来考虑先验概率 P(θ),先验概率的选取,对最终结果有影响,所以要去选择合适的先验概率。

可以根据历史经验统计数据去确定先验概率、根据统计信息去确定先验概率,比如之前我们做过抛硬币的实验,可以根据实际结果来确定先验概率。在没有统计数据的时候,我们也可以根据常识/主观意愿来得到一个先验概率(经常被人诟病主观性太强)。

本例中先验概率并不是一个固定的概率值,而是一个概率的分布。比如硬币投掷出现正面的概率在0.5左右,具体来说满足一个(根据自己的认知拍的)均值为0.5,标差为0.1的正态分布。(MLE 先验分布是?)

image.png

如图所示:一个硬币正面朝上最有可能概率为0.5,又可能比0.5高或低。据此先验分布,去求后验概率,即。最大化 P(θ|x),最大化 x 已知,θ 取值概率,即最大化 P(x|θ)P(θ) ,P(θ) 本身也是正态分布,参数一旦确定,让x发生概率最大,参数本身是一个正态分布,还要保证参数概率发生最大。因为引入了先验概率概念,其本身也是概率分布,如果 θ 出现概率很小,整个式子乘积就比较小了,所以要选择 θ 使得两者乘积最大。以下将两者均列出:

image.png

似然函数

image.png

高斯分布拥有固定表达式,将已知数带入即可得出结果

接下来要对后验概率求对数:

image.png

对后验概率的对数形式求最大值:即对 θ 求偏导,令其得0

image.png

整理得

image.png

求得 θ=0.5577。与之前最大似然估计求得结果不同。

改进:优化先验概率,比如投掷100次硬币,发现有60(80)次出现正面,以此计算后验概率为:0.63(0.76),这些结果越来越朝向最大似然估计所得结果靠拢。

MAE,在去先验概率时将其做成概率分布,如果认为分布是均匀分布,和 θ 没有关系,则结果和 MLE 结果是一样得。

相关文章
|
4天前
|
数据采集 人工智能 安全
|
13天前
|
云安全 监控 安全
|
5天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1091 152
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1763 9
|
10天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
697 152
|
12天前
|
人工智能 安全 前端开发
AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
AgentScope 重磅发布 Java 版本,拥抱企业开发主流技术栈。
662 13
|
6天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
452 5