参数估计-1| 学习笔记

简介: 快速学习参数估计-1。

开发者学堂课程【机器学习算法 :参数估计-1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7221


参数估计-1

 

内容介绍

一、回顾:最大似然估计

二、最大似然估计法估计参数值

 

一、回顾:最大似然估计

在上一章介绍了如果因变量是二分类变量的话,怎样去把它转化一个可以使用线性回归去处理的模型,选用了一个 Logistic 函数也就是逻辑回归函数来作为预测的对象。它实际上就把一个分类变量的取值转化成一个连续变量的取值,就是0到1之间的概率取值。通过这个转换之后回归模型就可以用了。同时又面临一个非常重要的问题,就是关于回归模型中的参数如何进行一个估计。之前在介绍回归模型的时候也介绍过了估算参数的一个重要方法叫最大似然估计。

最大似然估计(Maximum Likelihood Estimation,MLE):利用总体的分布密度或概率分布的表达式及其样本所提供的信息求未知参数估计量的一种方法。

最大似然估计基本思路:已知样本符合某种分布,但分布的具体参数未知,通过实验,估算分布的参数。估算的思想为:已知某组参数能使当前样本出现的概率最大,就认为该参数为最终的估计值。

投掷一枚已知质地并不均匀硬币,正反面的结果符合二项式分布: P(X=k)=image.png其中 n 和 k 为与实验相关的常数,p 为出现正面的概率,也是待确定的参数。

将该硬币投掷i次,出现正面次数为j,在没有其他更多信息的情况下,则有理由相信image.png

最大似然估计解决的是“模型已定,参数未知”的问题。即用已知样本的结果,去反推既定模型中的参数最可能的取值。原则上就是去构造一个似然函数,其他函数怎样取值才能让似然函数最大,然后根据这一点去求相关的参数。就是现在看到的事情已经发生了,如何去调节相关的参数让这个事情发生的概率最大。这个时候就认为这个参数是最契合观察到现象的一种参数。

出现当前情形的概率为:f(image.png)=f(image.png)f(image.png)…f(image.png),θ未知

称其为似然函数L:L(θ/image.png)=f(image.png/θ)=f(image.png/θ)f(image.png/θ)…f(image.png/θ)=image.pngnf(image.png/θ)

为了方便计算,取对数:lnL(θ/image.png)=lnf(image.png/θ)+lnf(image.png/θ)+…+lnf(image.png)=image.pnglnf(image.png/θ)

将该硬币投掷10次,出现正面次数为3,有理由相信p=0.3

10投3正的概率:image.png

其似然函数为:image.png

 

二、最大似然估计法估计参数值

其实在做逻辑回归的时候也是需要使用最大似然估计法的。

最大似然估计既可用于线性模型,也可用于复杂的非线性模型估计,比如: Logistic 回归。

具体步骤:建立似然函数(Likelihood function),该函数将观察数据的概率表述为未知模型的参数。这个事件已经发生了,想办法去调整这个模型里面的参数,让当前观察到的事件发生的概率最大。这个时候通过这个方法计算出来的参数就是最有可能满足当前观察现象发生的一组参数。就是选择能够使该函数值达到最大的参数估计值。即这套参数能够通过模型以最大概率再现观测数据。

似然函数:假设总体为 N 条数据,实际上这个总体是不太可能会得到的。随机抽取 n个数据作为观察样本,设image.png它的意思就是给定了一个 image.png,这个时候得到image.png的条件概率就是 image.png。同样的道理image.png的概率就是image.png。这个时候就可以得到一个观察值的概率:image.png的时候它的概率是image.png,等于0的时候就是image.png,这与刚才的假设是一致的。其中 image.png或者image.png。因为各项观测是互相独立的,所以它们的联合分布可以表示为各边际分布的乘积:image.png  假设有两条记录,第一条观测到是1,那就把第一条出现的概率算出来,第二条出现的概率也算出来,这两条记录同时出现的概率就是把这两个概率乘起来。因为前提条件是各项观测互相独立,所以每条记录出现都有一个概率,那所有记录出现的概率就是每一条记录出现的概率乘起来,这是最基本的概率知识。这个时候只要去让  L(θ)  取得最大值,此时求得的 θ 的值就是参数值。比如要从所有记录中抽出5条记录来,其实有很多种抽法。当前已经观察到的这5条数据出现的概率最大的情况就是要求这个 L(θ)  最大,就是每一条记录出现的概率都可以表达为一个 θ 的函数,然后多条记录同时出现就是把概率乘起来,让整个多条记录同时出现的概率最大,取 L(θ) 的最大值,根据这个条件求出来的 θ 就是要估算的参数最有可能出现的值。

image.png

参数估计:求解使 L(θ) 最大的参数 θ,实际上此处的 θ 为未知参数 β=image.png

为了方便计算,可将对 L(θ) 两侧取对数,得到:

image.png

这个就是对数似然函数。

对上述对数似然函数image.png求解使其最大的总体参数β=image.png,即求极值。

分别对 β 求偏导,令其分别等于 0,求解。此处简化为:image.png

即有image.png

image.png

多个参数可以生成联立方程组,不太容易求解,通常使用迭代的方式进行求解,如牛顿法、梯度法。假设一个值带进去,看这个值和最终结果的偏离程度,直到通过迭代的方法得出一个值和最终的结果接近。

相关文章
|
XML 前端开发 JavaScript
css的作用
【4月更文挑战第22天】css的作用
311 7
|
4天前
|
数据采集 人工智能 安全
|
13天前
|
云安全 监控 安全
|
5天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1091 152
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1763 9
|
10天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
697 152
|
12天前
|
人工智能 安全 前端开发
AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
AgentScope 重磅发布 Java 版本,拥抱企业开发主流技术栈。
661 13
|
6天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
452 5