回归模型的参数估计-1| 学习笔记

简介: 快速学习回归模型的参数估计-1。

开发者学堂课程【机器学习算法 :回归模型的参数估计-1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7189


回归模型的参数估计-1

 

内容简介

一、一元线性回归模型

二、参数估计:最小二乘估计

 

一、 一元线性回归模型

在前面的课程学习过线性回归、一元线性回归的基础知识。本节课学习如何去进行参数估计,先回忆一下一元线性估计,在研究一个现象的时候,或者在研究某一个问题的时候。发现有一些现象或是问题有一些直接的因素对其的影响较大,直接的因素和现象本身有一定的关系,但这俩个不是严格的函数关系,这时会使用一元线性回归模型。

image.png

这个线性回归方程的公式是image.png。y是因变量被解释的变量也就是这个现象通过变量要体现出来,或者是所解决的问题可以通过这个变量来展示;x是自变量就是解释变量,是影响现象的相关因素;image.png是一个回归常数;image.png是一个回归系数,通常把image.png叫做回归参数;就是随机误差,不是系统偏差,它的方程等与于一个常数是image.png,随机方差一旦满足均值为0,方程为常数,那它就会在0上下小范围浮动,方差表示浮动的范围,这个方差是说不是常数就行,而是在一个可浮动的范围内在可以。

一元线性回归方程:image.png。这个方程就是计算理论回归模型的期望值,说过随机误差是不可能去度量的或是说不可能很好的去每一个记录预测的时候来度量随机误差。所以就认为理论回归方程的期望值就是想要的结果,这个期望就是image.png,因为均值为0没有

重点:回归方程从平均意义上表达了变量y与 x的统计规律性。比如说用尺子来量一个纸带,纸带长度没有发生变化,那可能每一次量时度的数据都会有差距。而纸带的实际长度实际上如果测量误差是随机误差的话,把多次测量的结果取平均值,这个平均值就可以很好的表达纸带的长度,就是常说的平均意义上表达的统计的规律性。

回归分析的主要任务就是通过n组样本的观察值,对image.png进行估计,得到最终方程。这个方程是image.png,是什么也干不了的,image.png是未知的,x、y是已知的。比如在训练的时候,y、x都是已经知道的,在之前的测量身高的例子就是在已知父母身高下预测孩子的身高,父母的身高是x,孩子的身高是y。如何通过已知的样本去求出image.png的未知数,方程在应用的时候只知道父母的身高,用方程来预测孩子的身高,x已知、y未知。所以求image.png需要讲解一个重要的方法。

 

二、参数估计:最小二乘估计

通常把一个已知的数据、信息去估算未知参数的工作,接下来会讲解一个估计,这也是回归方程中最常使用的一个估计方法,叫做最小二乘估计,之前简单介绍过。

最小二乘估计(Least Square  Estimation ,OLE) 这个内容简写应该是LSE,但写作OLE,是因为一般说的最小二乘估计是普通最小二乘估计,是最常见的所以为OLE。

根据观察数据,寻找参数image.png的估计值image.pngimage.png上面有一个帽子后读作image.pngheight)就是观测数据使观测值和回归预测值的离差平方和达到极小。估计值image.png称作回归参数image.png的最小二乘估计。

回到这个例子,横轴为x,纵轴为y,可以看到实际的点在图中描述出来是在直线的上下两侧小范围波动,离差平方和:image.png

这个地方要注意,比如在写一个函数的时候f(x)说明x是这个里面的一个变量,这里写成的是image.png,说明这image.png是它的变量,就是这个方程是关于image.png的,现在要根据已知的数据样本来估算参数,样本已知有说明了x、y是已知的,所以就是常数了。就有很多人习惯认为x、y是变量,但在这就是一个常数。这个公式就是image.png的期望,image.png实际上就是回归方程,理论回归方程中有一个是一个随机误差,是无法处理的。就用平均意义上来表达变量之间的关系,所以求了一个期望,把image.png整体带入后变成了image.png,可以从图中看出实际值与预测值还有一定的距离。这就要求估计值image.png满足:image.png

注意在这个公式中用预测值代替实际值,实际值永远不知道,除非将所有人的身高测量一遍,否则是不知道全局意义上的image.png到底是多少。

在这里是采取一般的数值去估算image.png,用这个来代替image.png,在当前已知的所有信息情况下,所能求到的最佳的、和image.png最接近的就是image.png,带入之后就等于image.png。此时要求一个image.png使得后面一个式子的值最小,需要了解一些数学的一些基本符号,懂符号后记录比较方便,写了方便对后续交流、查询都方便。那么这个估计值image.png是非负二次函数,有最小值,其最小值的求法为求其偏导数,令其分别等于零,求解方程组即可。

image.png

相关文章
|
9月前
|
安全 物联网 数据建模
SSL证书:网络安全的重要基石
在数字化时代,数据安全与隐私保护至关重要。SSL证书作为一种关键网络安全技术,通过加密和认证确保通信安全。本文从定义、工作原理、类型、应用场景到选择与维护全面解析SSL证书。其类型包括DV、OV和EV,广泛应用于电商、金融、政府及物联网等领域。选择时需明确需求、信赖CA,并关注成本与服务。及时更新证书,保障持续安全。SSL证书是守护网络安全的重要工具,对提升信任度和满足合规性意义重大。
|
7月前
|
人工智能 芯片 开发者
鸿蒙电脑的诞生是国产操作系统的破壁之战
鸿蒙电脑的诞生标志着国产操作系统的重大突破。在Windows和Mac OS主导的市场中,华为凭借“全栈自研+分布式架构+系统级AI”创新组合,推出搭载HarmonyOS 5的HUAWEI MateBook Fold与MateBook Pro,实现从底层内核到用户体验的完全自主可控。作为混沌初开的“鸿蒙”,不仅补齐了华为“1+8+N”生态拼图,更开启了中国科技自立自强的新篇章。尽管生态建设仍在起步阶段,但已为全球电脑操作系统市场带来新格局。开发者可通过掌握ArkTS语言、利用分布式能力、参与开源项目等方式,抓住这一历史性机遇。
441 30
鸿蒙电脑的诞生是国产操作系统的破壁之战
|
4月前
|
云栖大会
2025 云栖大会来了|免费门票限量抢!
云栖大会 2025 门票免费领取!
317 0
|
7月前
|
数据挖掘 BI
|
9月前
|
NoSQL 数据库 Redis
如何保证MQ幂等性?或 如何防止消息重复消费?
如何保证MQ幂等性?或 如何防止消息重复消费?
|
8月前
|
人工智能 自然语言处理 数据可视化
推荐5款好用的小软件,实用性拉满
本文分享了五款实用的小软件,涵盖多种应用场景。DesktopCal是一款桌面日历工具,支持任务提醒与时间管理;Autoruns可深度扫描Windows自启动项,提升系统安全性;燃精灵专注微信空号检测,助力精准营销;Double Commander为双面板文件管理器,提高文件操作效率;GitMind提供可视化思维导图服务,支持多人协作与云同步。这些工具各具特色,满足不同用户需求。
290 12
|
10月前
|
机器学习/深度学习 XML 人工智能
我是如何基于 DeepSeek-R1 构建出高效学习Agent的?
我是如何基于 DeepSeek-R1 构建出高效学习Agent的?
Vue3 子传父 暴露数据 defineExpose
Vue3 子传父 暴露数据 defineExpose
724 0
Vue3 子传父 暴露数据 defineExpose
|
机器学习/深度学习 存储 人工智能
【AI系统】模型转换基本介绍
模型转换技术旨在解决深度学习模型在不同框架间的兼容性问题,通过格式转换和图优化,将训练框架生成的模型适配到推理框架中,实现高效部署。这一过程涉及模型格式转换、计算图优化、算子统一及输入输出支持等多个环节,确保模型能在特定硬件上快速、准确地运行。推理引擎作为核心组件,通过优化阶段和运行阶段,实现模型的加载、优化和高效执行。面对不同框架的模型文件格式和网络结构,推理引擎需具备高度的灵活性和兼容性,以支持多样化的应用场景。
612 4
【AI系统】模型转换基本介绍