回归模型参数估计-3| 学习笔记

简介: 快速学习回归模型参数估计-3。

开发者学堂课程【机器学习算法 :回归模型参数估计-3】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7191


回归模型参数估计-3

 

一、参数估计:最大似然估计

最大似然估计(Maximum Likelihood Estimation ,MLE):利用总体的分布密度或概率分布的表达式及其样本所提供的信息求未知参数估计量的一种方法。

如果概率或统计学学的很好是可以看的明白的,如果不好就来慢慢体会。

最大似然估计基本思路:已知样本符合某种分布,但分布的具体参数未知,通过实验,估算分布的参数。估算的思想为:已知某组参数能使当前样本出现的概率最大,就认为该参数为最终的估计值。

举一个例子,投掷一枚已知质地并不均匀硬币,正反面的结果符合二项式分布:image.png,其中 n 和 k 为与实验相关的常数(意思是投掷n次中有k次是正面,这两个是不用求),p 为出现正面的概率(p 是变量,如果投一个硬币,硬币并不均匀,正反面的结果是符合二项分布的,会有一个方程满足二项分布),也是待确定的参数。

将该硬币投掷 i 次,出现正面次数为 j,在没有其他更多信息的情况下,则有理由相信image.png。比如投了十次出现了三次正面,这就说明此时硬币正面的概率最可能是十分之三

最大似然估计解决的是“模型已定,参数未知“(就是已经知道模型是什么样,但不知道参数,就需要根据实际的情况去估计参数。)的问题,即用已知样本的结果,去反推既定模型中的参数最可能的取值。其实上次在讲到假设检验的时候提到过一个例子,实际上那个例子是实际评查但是改成了基因病,也是根据当前出现的这个结果。就是公式中,参数取到的值,最有可能出现当前的结果,就把它作为参数的估计值。举一个例子,根据已有样本的学习,穿裙子的可能百分之九十九的可能是女生。此时,来了一个并没有看清出男女的人过来,告诉穿了裙子来判断是男是女,根据已有的信息和知识,从平时的学习、接人待物,在跟人打交道的过程中,观察发现,女的爱穿裙子,男的基本不穿,那么这个就是已知的信息。回到判断的问题上,在没有更多信息的情况下,认为是女生的概率更大,所以会把参数定义为女。这个方法是很重要的,特别是一些不适合用在最小二乘法的情况下,经常会使用最大似然估计。

出现当前情形的概率为:image.png,image.png未知,n 个随机事件都发生,竖线是条件。就是在参数为的条件下,出现image.png事件的概率等于image.pngimage.png发生的概率乘以image.pngimage.png发生的概率一直乘到image.pngimage.png发生的概率。这就称之为似然函数image.pngimage.png,其实对于似然函数Limage.png来讲是在image.png的前提下求image.png,实际上是关于image.png的一个函数。注意第一个式子能够乘是有一个前提的是事件之间是独立的。

为了方便计算,取对数,取对数是为了把乘法变为加法、把除法变为减法,把次幂变为乘法,就相当于降低了复杂程度。image.pngimage.png

平均对数似然image.png记作:image.png,最大似然估计就是找到一个image.png使得image.png最大,即:image.png,这个公式建议记住数学含义,或者直白的讲当前事件发生的概率可以用来表示,这个事件发生了,要想办法使表达的方程、概率最大就可以。因为已经发生了,比如还是刚刚判断男女的,已经知道了是女的,如果把这个是男是女按照一个方程来表示,这有一个未知数已知数据是女的,那么这个表达出来,加入求得有两个值,第一个的概率使30%,第二个概率是25%,那现在应该选择概率大的那一个才符合现实。就已知的信息,30%的值是更加靠谱的,所以选择第一个。求一个最大的平均对数参数的值来作为参数,这个对于统计学学的一般的同学、理解会比较困难。将硬币投掷10次,出现正面次数为3,有理由相信 p=0.3,这是频率中的知识。还有10投3正的概率为:image.png

P 是正面的概率,(1-p) 就是背面的概率。注意这里发生了转换,在描述的时候发生的事件是image.png,前提条件是 p,但之后似然函数的条件与事件位置发生了变化。它的似然函数为image.png。其平均对数似然为:image.pngimage.png求最大值,对image.png求导并让等于0:image.png。解出 p=0.3,因为这个例子比较简单,可以算出答案,但如果题目比较复杂,就列出式子一步一步计算。

image.png

相关文章
|
Java 编译器 Go
Go 语言 入门 && 基于 GoLand 2023.1 创建第一个Go程序
Go 语言 入门 && 基于 GoLand 2023.1 创建第一个Go程序
457 0
|
安全
HTML常用表单写一个百度搜索和注册页面
HTML常用表单写一个百度搜索和注册页面
1269 0
|
8月前
|
安全 Android开发 iOS开发
《跨平台开发新范式:ArkUI-X代码定制与管控指南》
ArkUI-X助力开发者基于一套主代码构建支持OpenHarmony、Android、iOS等多平台的精美应用。然而,不同平台特性差异使得编写和管理平台特定代码成为关键环节。例如,Android需处理权限申请与推送服务,iOS注重交互规范与图像处理,OpenHarmony则发挥分布式能力。合理组织平台特定代码至专门文件夹(如platform_specific),并结合版本控制与定期优化,可提升项目可维护性。掌握这些方法与策略,开发者能充分发挥各平台优势,打造跨平台优质应用。
172 0
|
11月前
|
人工智能 自然语言处理 API
用自然语言控制电脑,字节跳动开源 UI-TARS 的桌面版应用!内附详细的安装和配置教程
UI-TARS Desktop 是一款基于视觉语言模型的 GUI 代理应用,支持通过自然语言控制电脑操作,提供跨平台支持、实时反馈和精准的鼠标键盘控制。
3201 17
用自然语言控制电脑,字节跳动开源 UI-TARS 的桌面版应用!内附详细的安装和配置教程
|
弹性计算 安全 关系型数据库
使用ECS手动部署MySQL数据库
领取免费云服务器ECS试用资源,快速部署MySQL数据库。
538 1
|
存储 缓存 算法
漫谈代码优化与效率提升
在当今快节奏的技术发展中,对于程序员来说,不仅仅是写出能运行的代码,更重要的是如何写出高效、优雅的代码,以提升工作效率和代码性能。本文从优化思路、技巧和实践三个方面探讨了代码优化与效率提升的方法,旨在为开发者提供一些实用的指导和启发。
519 31
|
关系型数据库 MySQL 数据安全/隐私保护
使用 Docker 部署一个文档管理系统,让宝贵文档不在丢失!
使用 Docker 部署一个文档管理系统,让宝贵文档不在丢失!
|
机器学习/深度学习 PyTorch 算法框架/工具
通过实例学习Pytorch加载权重.load_state_dict()与保存权重.save()
通过实例学习Pytorch加载权重.load_state_dict()与保存权重.save()
317 0
|
存储 缓存 负载均衡
无类别域间路由 (CIDR):Internet 地址分配和聚合计划
本备忘录讨论了现有 32 位 IPv4 地址空间的地址分配策略,以保护地址空间并限制全局路由状态的增长率。本文档废弃了 RFC 1519 中的原始无类别域间路由 (Classless Inter-domain Routing,CIDR) 规范,进行了更改以阐明其引入的概念,并在 12 年多之后更新 Internet 社区关于部署所描述技术的结果。
691 0
无类别域间路由 (CIDR):Internet 地址分配和聚合计划
|
机器学习/深度学习 存储 数据采集
m基于强化学习的永磁同步电机位置控制器simulink仿真,对比传统的PI控制器和模糊PI控制器
m基于强化学习的永磁同步电机位置控制器simulink仿真,对比传统的PI控制器和模糊PI控制器
617 1