贝叶斯推断2| 学习笔记

简介: 快速学习贝叶斯推断2。

开发者学堂课程【机器学习算法 :贝叶斯推断2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7274


贝叶斯推断2

 

内容介绍

一、似然函数

二、似然函数 vs 先验概率 vs 后验概率

三、最大后验估计

 

一、似然函数

1. 似然函数(Likelihood Function)是一种关于统计模型参数的函数。似然函数是关于参数的函数,最大似然估计解决的模型已定参数未知,是区别于后验概率。给定输出 x 时,关于参数的似然函数 L(θ|x) 在数值上等于给定参数 θ 后变量x的概率:L(θ|x)=P(X=x|θ)。

2. 似然是对 Likelihood 的一种较为贴近文言文的翻译,似然用现代的中文来说即“可能性”

3. 数学语言定义:设总体 x 服从分布 P(X;θ),θ 为待估参数,X1,X2,…Xn是来自于总体 X 的样本,x1,x2,…,xn为样本X,X2,…Xn 的一个观察值,则样本的联合分布L(θ)=L(x1,x2,…,xn;θ)=ПP(xi;θ)称为似然函数。

4. 最大似然估计(MLE)是似然函数最初也是最自然的应用。上文已经提到,似然函数取得最大值表示相应的参数能够使得统计模型最为合理。最大似然估计原理:首先设立模型,认为当前样本/样本集符合模型分布,但模型中参数未知,依据现已产生的样本发生的事实去要求最大似然函数,即让当前已发生的事实发生概率最大。

5. 概率描述了已知参数时的随机变量的输出结果;似然则用来描述已知随机变量输出结果时,未知参数的可能取值。

 

二、似然函数 vs 先验概率 vs 后验概率

image.png

image.png实则是贝叶斯公式

其中image.png表示后验概率E发生情况下,H发生的概率。

P(H)是先验概率,想求准确概率前需要先估计出一个概率,就是先验概率。

P(E|H)是H发生条件下,E发生的概率。称之为“证据”似然函数。

P(E)为调整的量。

通过以上就可以得到先验函数、后验函数以及似然函数之间的关系。

 

 

三、最大后验估计  

1.最大后验概率估计(Maximum A posteriori Estimation,MAE)最大后验估计是根据经验数据获得对难以观察的量的点估计。与最大似然估计类似,但是最大的不同时,最大后验估计的融入了要估计量的先验分布在其中。故最大后验估计可以看做规则化的最大似然估计。

2.例:

想判断某硬币是否均匀,抛十次,得到的结果是:反正正正正反正正正反,请做出合理的判断。实际是需要算一下出现正面概率是多少,如果出现正面概率为50%,那么则认为均匀。

用最大似然估计的思路来考虑该问题:

抛硬币的结果实际上为二项分布(重复n次的伯努利分布):假设正面出现的概率为 θ,若为0.5,则均匀已经发生的抛硬币事件为:x={反,正,正,正,正,反,正,正,正,反},就出现的这个结果得到似然函数:

image.png

出现正面概率为 θ,所以出现反面概率为 1-θ,最后得出结果。

模型已定,参数未知。去求使得似然函数 L(x;θ) 最大的参数 θ,就是我们希望得到的正面出现的概率:

image.png

对似然函数求对数,会简单许多,将次方变乘法,将乘法变加法。再对似然函数对数求出最大值,对 θ 求偏导,令其等于0即可求出最大值。

image.png

采用最大似然估计对硬币出现正面概率为70%,不均匀

相关文章
|
存储 人工智能 算法
第十四届蓝桥杯真题解析
第十四届蓝桥杯真题解析
258 0
|
数据安全/隐私保护
CobaltStrike 流量隐藏
CobaltStrike 流量隐藏
246 0
|
iOS开发
iOS - QRCode 二维码
1、QRCode 在 iOS7 以前,在 iOS 中实现二维码和条形码扫描,我们所知的有,两大开源组件 ZBar 与 ZXing。iOS7 之后可以利用系统原生 API 生成二维码, iOS8 之后可以生成条形码, 系统默认生成的颜色是黑色。
3097 0
|
7月前
|
消息中间件 运维 Kafka
直播预告|Kafka+Flink双引擎实战:手把手带你搭建分布式实时分析平台!
在数字化转型中,企业亟需从海量数据中快速提取价值并转化为业务增长动力。5月15日19:00-21:00,阿里云三位技术专家将讲解Kafka与Flink的强强联合方案,帮助企业零门槛构建分布式实时分析平台。此组合广泛应用于实时风控、用户行为追踪等场景,具备高吞吐、弹性扩缩容及亚秒级响应优势。直播适合初学者、开发者和数据工程师,参与还有机会领取定制好礼!扫描海报二维码或点击链接预约直播:[https://developer.aliyun.com/live/255088](https://developer.aliyun.com/live/255088)
570 35
直播预告|Kafka+Flink双引擎实战:手把手带你搭建分布式实时分析平台!
|
9月前
|
机器学习/深度学习 人工智能 运维
让AI“接管”网络运维,效率提升不只是传说
让AI“接管”网络运维,效率提升不只是传说
852 16
|
存储 缓存 算法
优化 ChunkServer 的存储性能
【8月更文第30天】在分布式文件系统中,ChunkServer 是负责存储数据块的关键组件。为了提高ChunkServer的存储性能,可以通过多种技术手段进行优化,如缓存、压缩、并行处理等。本文将详细讨论这些技术的应用,并提供具体的代码示例。
196 0
|
物联网 vr&ar Android开发
移动应用与系统:探索现代移动技术的发展趋势####
【10月更文挑战第29天】 本文深入探讨了移动应用开发和移动操作系统的最新趋势,分析了它们对日常生活和行业的影响。随着智能手机的普及和技术的进步,移动应用和操作系统不断进化,以满足用户的需求和期望。文章将通过具体案例和数据分析,揭示这一领域的创新点和未来发展方向。 ####
|
XML Java 数据格式
Spring IOC—基于XML配置和管理Bean 万字详解(通俗易懂)
Spring 第二节 IOC—基于XML配置和管理Bean 万字详解!。
1218 5