违背基本假设-2| 学习笔记

简介: 快速学习违背基本假设-2。

开发者学堂课程【机器学习算法 :违背基本假设-2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7205


违背基本假设-2

 

内容介绍

一、 异方差检验:制图分析

二、 消除异方差

 

一、 异方差检验:制图分析

数据x、y,使用一元线性回归模型拟合:y-11.266+3.992*x,判断是否存在异方差。这是一个常见的问题,比如给一个数据,直接用一元线性回归拟合,把它当作一个结论得到结果,这还是有风险的。之前说过用线性回归模型去完成,有一些一系列的前置条件要满足的但不知道是否满足。这里讲的方差就要判断是否存在异方差。由散点图看出,还是有 x 随 y 的变化有明显的趋势。在从残差分析图中也可以看到一定的趋势,这就认为可能存在异方差的问题。

图片19.png

接下来做一个等级相关系数法:

第一步,做y关于x的普通最小二乘回归,求出image.png的估计值image.png

第二步,求等级差image.png,把image.pngimage.png按升序排列,ximage.png和|image.png|分别有一先求出image.png再计算image.png,求等级相关系数 rs 其中样本个数n=20

第三步,做 rs 的显著性检验,n>8时,进行 t 检验。计算 t 统计量:

image.png 原假设为image.png,拒绝原假设,即存在异方差问题

image.png

 

二、 消除异方差

消除异方差:加权最小二乘法

消除异方差办法有多种,常见的有加权最小二乘法、BOX-COX 变换法、方差稳定性变换法等以一元线性回归最小二乘法估计参数为例,其离差平方和公式:下图中可见。

存在的问题:每个观测值(即每个样本)的权重相同(都为1),同方差时,每个观测值在离差平方和中的地位是一样的,但是当异方差时,方差大的观测值,对平方和的影响也大,OLE 求得的回归线,会被拉向方差大的样本点,导致方差小的样本拟合效果差。

此时考虑调整权重,以平衡各个观察值的作用,即为加权最小二乘法,其离差平方和公式变为:公式如下:

image.png

尝试不同的 m 值,得到不同的权重,取结果最好的一组。权重值估算公式为:

以 m=2 为例,得到权重值 ω=1/xi2,即(0.08650519,0.30864198.0.04725898,0.02872738)

计算加权均值ω=1.638, ω=18.234

计算回归参数: 公式如图

等级相关系数法或残差分析图法去评估有没有改进。

image.png

相关文章
|
8月前
|
存储 双11 数据中心
数据中心网络关键技术,技术发明一等奖!
近日,阿里云联合清华大学与中国移动申报的“性能可预期的大规模数据中心网络关键技术与应用”项目荣获中国电子学会技术发明一等奖。该项目通过端网融合架构,实现数据中心网络性能的可预期性,在带宽保障、时延控制和故障恢复速度上取得重大突破,显著提升服务质量。成果已应用于阿里云多项产品及重大社会活动中,如巴黎奥运会直播、“双十一”购物节等,展现出国际领先水平。
|
DataWorks 数据挖掘 Serverless
阿里云EMR Serverless StarRocks 内容合集
阿里云 EMR StarRocks 提供存算分离架构,支持实时湖仓分析,适用于多种 OLAP 场景。结合 Paimon 与 Flink,助力企业高效处理海量数据,广泛应用于游戏、教育、生活服务等领域,显著提升数据分析效率与业务响应速度。
320 0
|
4月前
|
缓存 监控 中间件
Django中间件自定义开发指南:从原理到实战的深度解析
Django中间件是Web应用的“交通警察”,在请求与响应过程中进行全局处理,适用于身份验证、日志记录、性能监控等功能。本文详解中间件的工作原理、开发步骤及实战案例,帮助开发者掌握自定义中间件的构建方法,提升Django应用的可维护性与扩展性。
287 0
|
4月前
|
人工智能 物联网 API
ModelScope魔搭25年8月发布月报
🔥 这个夏天,开源热潮比气温更燃!Qwen3、GLM4.5、混元、Wan2.2、Qwen-Image等重磅模型密集发布,MoE、多模态、Agent、生图视频全爆发,ModelScope 全程 Day0 支持,生态持续进化中!
397 0
|
4月前
|
监控 安全 测试技术
API测试工具评测:Apipost与Apifox的优劣深度解读
本文对比了Apipost与Apifox在API设计、数据建模、代码生成、测试能力、协作权限、性能监控、插件生态、文档管理及安全合规等方面的差异。Apifox在专业性、自动化、扩展性及团队协作上表现更优,尤其适合中大型项目与复杂管理需求,而Apipost功能较基础,适用于轻量级使用场景。
|
9月前
|
安全 物联网 数据建模
SSL证书:网络安全的重要基石
在数字化时代,数据安全与隐私保护至关重要。SSL证书作为一种关键网络安全技术,通过加密和认证确保通信安全。本文从定义、工作原理、类型、应用场景到选择与维护全面解析SSL证书。其类型包括DV、OV和EV,广泛应用于电商、金融、政府及物联网等领域。选择时需明确需求、信赖CA,并关注成本与服务。及时更新证书,保障持续安全。SSL证书是守护网络安全的重要工具,对提升信任度和满足合规性意义重大。
|
9月前
|
关系型数据库 测试技术 新制造
基于 Websoft9 平台的 Odoo 教学实践:助力智能制造、物流与财务会计专业教师提升教学效果
Websoft9 是企业级开源软件自动化部署与管理平台,为高校智能制造、物流及财务会计等专业提供完整的 Odoo 教学解决方案。通过开箱即用的部署、全生命周期维护和功能扩展支持,助力教师快速构建真实业务场景,降低技术门槛。学生可进行模块化开发实践,并结合 CI/CD 工具链体验产业级 DevOps 流程,实现理论与实践结合,培养跨学科综合能力。
|
9月前
|
弹性计算 开发框架 安全
课时6:第6天:轻松复用你搭建好的环境和应用——镜像管理
欢迎收看玩转云服务器ECS系列课程,今天我们学习第六课,镜像的管理。本节课程有四小节。 1. 镜像有什么用? 2. 创建镜像 3. 复制、共享与导入镜像 4. 使用云市场镜像
223 1
|
10月前
|
搜索推荐 数据可视化 数据挖掘
点晴OA系统:用户体验至上,操作简单易上手
在数字化转型的浪潮中,企业选择办公自动化(OA)系统时,除了关注功能强大与否,更看重系统的用户体验。一个操作复杂、学习成本高的系统,不仅会降低员工的工作效率,还可能影响企业的整体运营。点晴OA系统以“用户体验至上”为核心理念,致力于打造操作简单、易上手的办公平台,帮助企业快速实现高效办公。
205 1
|
10月前
|
人工智能 大数据 物联网
申报开启|2025年阿里云协同育人项目申报指南
阿里云启动2025年协同育人项目申报,支持高校教学内容和课程体系改革及实践基地建设。项目涵盖人工智能通识教育、AIGC设计等领域,提供资金、云计算资源和技术培训等支持。申报截止至2025年2月28日,面向全国本科高校教师,旨在深化产教融合,共育创新人才。详情及流程见官网。