偏相关与复相关 | 学习笔记

简介: 快速学习偏相关与复相关

开发者学堂课程【人工智能必备基础:概率论与数理统计:偏相关与复相关】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/545/detail/7460


偏相关与复相关

内容介绍

一.品质相关分析

二.列联相关系数

三.φ 相关

四.偏相关分析

五.复相关系数

 

一.品质相关分析

两个变量都是按质划分成几种类别,表示这两个变量之间的相关称为品质相关。

如,一个变量按性别分成男与女,另一个变量按学科成绩分成及格与不及格;又如,一个变量按学校类别分成重点及非重点,另一个变量按学科成绩分成优良、中、差,等等。

 

二.列联相关系数

1.概念

当两个变量均被分成两个以上类别,或其中一个变量被分成两个以上类别,这两个变量之间的相关程度可用列联相关系数( contingency coefficient )来测度。如行政人员、现任教师、学生家长与对现有考试制度持赞同、不置可否、反对意见有无相关。

假设变量 x 被分成 a 个类别 y 被分成 b 个类别,而且 a 和 b 至少有一个大于 2 这时变量与变量 y 的列联相关系数记为 C。

记 m 为观察数据属于变量 x 的第 i 类别 ( i=12-a )变量 y 的第 j 类别( j=12-6 )的频数。记

image.png

构造 image.png 其中 image.png这样可以得到列联相关系数 C 的计算公式

C=image.png

若 X2 检验显著,则列联相关系数也显著。

2.例题

2531 名学生和教师进行了抽样调查,计算调查对象和态度之间的列联相关系数,并进行统计显著检验

image.png

解:根据公式 image.png 计算值 X2

image.png

查 X2 分布表,得到临界值 image.png=12.277

因为 X2=13002>12.277

所以求得的列联系数 C=0.221 具有统计显著意义。

 

三.φ 相关

1.概念

当两个变量都是二分变量,无论是真正的二分变量还是人为的二分变量

这两个变量之间的相关系数就称为相关系数( phi-coefficient )。如:性别的男与女和体育成绩的达标与不达标之间的相关;户口的城市与农村和创新能力的强与弱之间的相关。

Ф 相关系数的适用条件 2x2 列联( contingency table cross tabulation )表。变量的数据结构如表10-15所示。

image.png

相关系数的计算公式如下:

image.png

容易证明: image.png

2.例题

为了研究青年大学生对性别与对心里测验态度的关系,选取了 170 名青年进行心里测验,计算性别对测验态度的中相关系数

image.png

解:根据公式image.png计算 X2

image.png

image.png

查 x 分布表,得到临界值 image.png=3.84。

因为 X2=21577<3.84 所以求得的系数相关系数 image.png=0.1127 不具有统计显著意义,即青年男女大学生的性别与对心理测验反应态度之间是独立无关的。

 

四.偏相关分析

1.概念

在名要素所构成的地理系统中,先不考虑其它要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。

在分析变量 x1 和 x2 之间的净相关时,当控制了变量 x3 的线性作用后,1 和 x2 之间的一阶偏相关系数定义为:

image.png

2.例题

对于某四个地理要素 x1,x2,x3,x4 的 23 个样本数据,经过计算得到了如下的单相关系数矩阵

image.png

计算可得部分偏相关系数:

image.png

3.偏相关系数的性质

偏相关系数分布的范围在 -1 到 1 之间

偏相关系数的绝对值越大,表示其偏相关程度越大

偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即R1·23≥/|r123|

4.偏相关系数的显著性检验

image.png服从 t(n-k-2) 分布

n: 样本容量

k 是剔除了的变量数

r 是偏相关系数

当有 3 个要素时,有三个偏相关系数,称为一级偏相关系数

当有 4 个要素时,则有六个偏相关系数,则称他们为二级偏相关系数

 

五.复相关系数

1.概念

(1)反映几个要素与某一个要素之间的复相关程度。复相关系数介于 0 到 1 之间。

(2)复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关:复相关系数为 0,表示完全无关。

(3)复相关系数必大干或至少等干单相关系数的绝对值。

测定一个变量 y,当有两个自变量时:

image.png

当有三个自变量时:

image.png

2.实例:

在上例中,若以x4为因变量,x1,x2,x3 为自变量,试计算 x4 与 x1,x2,x3 之间的复相关系数。

image.png

相关文章
|
2月前
|
Linux 内存技术
使用npm install -g pnpm的时候报错
使用npm install -g pnpm的时候报错
369 139
|
3月前
|
算法 机器人 Serverless
【机器人路径规划】基于6种算法(黑翅鸢优化算法BKA、SSA、MSA、RTH、TROA、COA)求解机器人路径规划研究(Matlab代码实现)
【机器人路径规划】基于6种算法(黑翅鸢优化算法BKA、SSA、MSA、RTH、TROA、COA)求解机器人路径规划研究(Matlab代码实现)
484 2
|
12月前
|
关系型数据库 MySQL 数据库
【MySQL基础篇】MySQL概述、Windows下载MySQL8.0超详细图文安装教程
在这一章节,主要介绍两个部分,数据库相关概念及MySQL数据库的介绍、下载、安装、启动及连接。接着,详细描述了MySQL 8.0的版本选择与下载,推荐使用社区版(免费)。安装过程包括自定义安装路径、配置环境变量、启动和停止服务、以及客户端连接测试。此外,还提供了在同一台电脑上安装多个MySQL版本的方法及卸载步骤。最后,解释了关系型数据库(RDBMS)的特点,即基于二维表存储数据,使用SQL语言进行操作,格式统一且便于维护。通过具体的结构图展示了MySQL的数据模型,说明了数据库服务器、数据库、表和记录之间的层次关系。
2025 56
【MySQL基础篇】MySQL概述、Windows下载MySQL8.0超详细图文安装教程
|
机器学习/深度学习 传感器 算法
强化学习(RL)在机器人领域的应用
强化学习(RL)在机器人领域的应用
298 0
|
编译器 C#
C#重载详解
C#重载详解
264 0
|
存储 Java 关系型数据库
Maven下载以及配置 一条龙全教程
Maven下载以及配置 一条龙全教程
553 0
|
算法 图形学 C++
[EasyX库安装介绍讲解】超详细入门级
[EasyX库安装介绍讲解】超详细入门级
918 1
|
负载均衡
【SpringCloud】Ribbon负载均衡原理、负载均衡策略、饥饿加载
【SpringCloud】Ribbon负载均衡原理、负载均衡策略、饥饿加载
329 0