多重共线性-2| 学习笔记

简介: 快速学习多重共线性-2。

开发者学堂课程【机器学习算法 :多重共线性-2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7214


多重共线性-2

 

一、 案例

基于历史数据构建国家财政收入回归模型,判断已有解释变量中是否存在多重共线性,存在请消除

已知的自变量有,农业、工业、建筑业、人口,因变量是财政收入。

image.png

直接观察法:计算各自变量之间的相关系数,强线性关系得变量较多,存在较强得线性相关

就是说 x1 和 x1 的相关系数是1,那 x1 和 x2 按照公式算一下相关系数,x1 和 x2 是0.9963,x1 和 x3 是0.9918.。从图中可以看到是对称的 x1x2 和 x2x1 的值是一样的。就可以看到这个里面多个变量间存在强相关关系,就可以认为这当中必然存在多重线性。

方差扩大因子法:计算((X*)TX*)-1其对角线即为image.png还可以计算image.png。对输入的变量进行标准化,它的转置进行计算,它的逆就是公式中的含义。代入公式计算image.pngimage.png结果如下图

image.pngimage.png>>1,整体存在严重得多重共线性,根据image.png可以判断j=1,2,3,4,5时,多重共线性严重。第一个大于10,第二个大于一百,第三个大于十第四个一般,第五个也比较大,最后一个还好。

特征根判定法:计算 XTX 的特征根,使用条件数来判断有无多重共线性。

λi=(3.115674e+11,5.775479e+09,5.607608e+08, 4.159931e+06,1.332862e+06,1.234899e)

λm=max(λi)=3.115674e+11

image.png

得到ki =(1.00, 53.95,55.62, 74897.24, 233758.17,2523020.07)

条件数中,有4个条件 k>>100,存在严重的多重共线性

有一个条件 10≤k<100,有较强的多重共线性。这一节讲述了多重共线性的成因、恶劣影响以及判断方法(直接判断法或者计算的方法来看是否有多重共线性)。

相关文章
|
3月前
|
机器学习/深度学习 编解码 算法
【机器人路径规划】基于迪杰斯特拉算法(Dijkstra)的机器人路径规划(Python代码实现)
【机器人路径规划】基于迪杰斯特拉算法(Dijkstra)的机器人路径规划(Python代码实现)
381 4
|
Kubernetes 应用服务中间件 Linux
k8s--如何将chart包托管至harbor
k8s--如何将chart包托管至harbor
516 3
|
机器学习/深度学习 语音技术 开发工具
【独家秘籍】揭秘!如何用阿里云TTS魔法般将文字瞬间变成天籁之音,让你的作品开口说话,震撼人心!
【8月更文挑战第15天】通过阿里云语音合成服务(TTS),开发者可将文本转为自然语音,适用于有声阅读、客服等场景。首先注册并获取AccessKey ID/Secret,然后安装阿里云Python SDK。使用示例代码设置语音参数(如发音人xiaoyun、引擎wavenet),发送请求并保存生成的MP3文件。注意正确认证及异常处理,以确保应用稳定可靠。
998 0
BERT+PET方式模型训练(二)
• 本项目中完成BERT+PET模型搭建、训练及应用的步骤如下(注意:因为本项目中使用的是BERT预训练模型,所以直接加载即可,无需重复搭建模型架构): • 一、实现模型工具类函数 • 二、实现模型训练函数,验证函数 • 三、实现模型预测函数
|
机器学习/深度学习 人工智能 自然语言处理
【LangChain系列】第五篇:大语言模型中的提示词,模型及输出简介及实践
【5月更文挑战第19天】LangChain是一个Python库,简化了与大型语言模型(LLM)如GPT-3.5-turbo的交互。通过ChatOpenAI类,开发者可以创建确定性输出的应用。提示词是指导LLM执行任务的关键,ChatPromptTemplate允许创建可重用的提示模板。输出解析器如StructuredOutputParser将模型的响应转化为结构化数据,便于应用处理。LangChain提供可重用性、一致性、可扩展性,并有一系列预建功能。它使得利用LLM构建复杂、直观的应用变得更加容易。
801 0
|
SQL 存储 Oracle
Oracle中的Dual表:数据世界的“神奇小盒子”
【4月更文挑战第19天】Oracle的Dual表是一个虚拟表,仅含一行一列,常用于执行SQL函数、数据类型转换、测试语句和动态SQL。它是测试和便捷操作的工具,如获取当前日期(`SELECT SYSDATE FROM DUAL`)、数字转字符串(`SELECT TO_CHAR(12345) FROM DUAL`)。在存储过程、函数和触发器中也发挥重要作用,是数据库管理员的得力助手。
|
关系型数据库 MySQL 数据库
MYSQL数据库字母数字混合字段排序问题
对MySQL数据表里的一个字符型字段排序,其内容格式为一位字母+顺序数字。数字没有前导零,长度不固定。这种含字母的数字序列,排序出来的结果和我们想要的结果是不一样的,因为它不是纯数字,只能按字符规则排。
3109 0
|
存储 网络安全 虚拟化
Proxmox VE导入ESXI格式OVA、VMDK虚拟机文件
按照正常步骤建好虚拟机,之后删除掉该虚拟机的虚拟硬盘。本例中虚拟机VM ID为103,通过qm importdisk 进行导入挂载。具体导入位置,根据虚拟机存储情况进行确定,本示例为local-lvm。使用SCP工具,将OPNsense_22.7.4_ufs-disk1.vmdk上传到系统的root目录下。需要使用的文件为:OPNsense_22.7.4_ufs-disk1.vmdk。导入成功后,就能看到该硬盘,在该硬盘上点编辑,添加即可。
|
机器学习/深度学习 人工智能 智能设计
内容推荐场景中自监督学习的应用
内容推荐场景中自监督学习的应用
723 0
内容推荐场景中自监督学习的应用