比较检验-3| 学习笔记

简介: 快速学习比较检验-3。

开发者学堂课程【机器学习算法 :比较检验-3】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7180


比较检验-3

 

内容介绍

一、假设检验的例子:二项式检验

二、T 检验

三、原理

四、假设检验在模型比较中的应用

 

一、假设检验的例子:二项式检验

某工厂的一批产品,其次品率 μ 未知,按规定,如果 μ≤0.01,则该批产品可以接受。随机取样品100个,发现有3件次品,该批次产品是否达标?

如果不用假设检验,会发现100个样品会有三个次品。次品率是0.03,不达标。但是其中有一些不确定因素。这些因素会不会有影响?

确定假设:我们搜集数据是为了找到不达标的证据,即原假设Ho:μ<=0.0.1,备择假设H1:μ>0.01

确定检验水平:采取最常用的 α=0.05,或者严格的 α=0.01

构造统计量:产品是否符合二项式分布,原假设成立,则满足 b(k;n,001)

计算 P 值:即

图片9.png

得到结论:P 值大于显著水平 α,不能拒绝原假设(不能说次品率大于0.01),即通过本次采样得到的样本数据,并不能证明原假设 H0 不成立。

不能证明 H0 不成立,也不能证明 H0 成立。总之目前次品率到底是低于0.01还是高于0.01,在没有数据之前,没有任何结论。所以假设结论是和直觉没有关系的,是有区别的。

 

二、T 检验

某网站为了搞了一波市场活动,活动前一周的 PV(单位:万)为 1.40, 1.38, 1.43, 1.42,1.44,1.37,1.41,活动后六天的 PV(单位:万)为 1.35,1.40, 1.42, 1.36, 1.38,1.40。活动对 PV 有无彤响?

假设活动前后 PV 均符合正态分布,且方差相同。(这个问题比较常见)

确定假设:(双维检测)通过数据证明两者不同,即原假设 H0:U1=U2,备择假设 H1:U1 不等于 U2

确定检验水平:采取最常用的 α=0.05

构造统计量:两者均符合正态分布,且相等,方差未知(小于30个),使用T检验;Y 检验量如下:代入求T检验量的值为:T=1.525

图片10.png

接下来查表:

图片11.png

自由度是11.所以查出来是2.201.

计算 P 值,确定拒绝域:查 T 分布临界值表,T0.025/4=2.201,所以有T<T0.025/4,即P>0.05

得出结论:P 值大于显著水平 α。不能拒绝原假设。即无法证明活动有效。(不能拒绝原假设,需要收集更多的数据来进一步检验活动效果)

 

三、原理

1、原假设怎样设定;(相等,不相等,差异性)

2、提高,增加,降低如何选择;

3、原假设是希望收集数据推翻的,如果假设成立(当前的事情发生的概率大小,当然我们希望当前假设将原假设推翻)。如果证据无法推翻原假设,那就既证明原假设成立,也不能证明原假设不成立。

 

四、假设检验在模型比较中的应用

以一元线性回归为例,可以使用假设检验作如下比较和推断:

1、回归系数的显著性检验:y=β0+β1x(判断回归系数有无价值)

(1)检验自变量 x 对因变量 y 的影响程度是否显著(若影响不显著 β1 这一项就可以取消,说明 y 和 x 没有关系)

(2)假设误差 ε 满足均值为0的正态分布,原假设:H0:β1=0 备择假设:H:β1 不等于0

(3)使用 T 检验,如果原假设成立,则x和y并无线性关系(我们希望推翻 β1=0,可以证明 x 和y有关系)

2、回归方程的显著性检验:y=β0+β1x(检验方程本身有没有意义,原假设 β1=0.注意:一元线性回归只有一个参数,所以检测回归方程和回归系数是一致的;如果是多元就不一样)

(1)根据平方和分解式从回归效果检验回归方程的显著性

(2)原假设:16:β1=0 备择假设:H1:β1不等于0

(3)使用F检验,如果原假设成立,则说明回归方程不显著,该方程并无实质意义

3、相关系数的显著性检验

(1)检验两变量之间是否真正相关,或两个相关系数之间的差异是否显著

(2) 原假设:Ho:ƿ=0 备择假设:H1:ƿ+0(只要确定原假设,确定统计量即可)

相关文章
|
算法 Unix API
指数退避(Exponential backoff)在网络请求中的应用
## 一、背景 最近做云服务 API 测试项目的过程中,发现某些时候会大批量调用 API,从而导致限流的报错。在遇到这种报错时,传统的重试策略是每隔一段时间重试一次。但由于是固定的时间重试一次,重试时又会有大量的请求在同一时刻涌入,会不断地造成限流。 这让我回想起两年前在查阅[Celery Task 文档](http://docs.celeryproject.org/en/latest
13740 1
|
2月前
|
弹性计算 搜索推荐 异构计算
阿里云服务器收费标准:包年包月和按量付费费用整理
阿里云服务器提供包年包月与按量付费两种模式,包年包月低至38元起/年,涵盖2核2G到8核32G多款爆款配置,轻量应用服务器享200M峰值带宽不限流量,香港节点25元/月起,GPU服务器亦有优惠,新老用户均可享大幅折扣。
644 40
|
关系型数据库 MySQL
mysql中有大量sleep进程的原因与解决办法
mysql中有大量sleep进程的原因与解决办法
1142 0
|
11月前
|
负载均衡 Kubernetes 网络协议
注册中心如何选型?Eureka、Zookeeper、Nacos怎么选
这是小卷对分布式系统架构学习的第9篇文章,继续探讨注册中心的原理及选型。文章详细介绍了Eureka、Nacos的工作机制与特点,并对比了Eureka、Nacos、Consul和Zookeeper在一致性协议、健康检查、负载均衡等方面的差异。最后根据不同的应用场景给出了注册中心的选型建议,帮助读者理解如何选择最适合的注册中心。
950 100
|
11月前
|
存储 人工智能 API
七种RAG架构cheat sheet!
RAG 即检索增强生成,是一种结合检索技术和生成模型的人工智能方法。Weaviate厂商给出了七种RAG架构cheat sheet。
909 18
|
存储 安全 数据库
Flask框架中,如何实现用户身份验证和会话管理
Flask框架中,如何实现用户身份验证和会话管理
|
Android开发 Kotlin
kotlin开发安卓app,如何让布局自适应系统传统导航和全面屏导航
使用`navigationBarsPadding()`修饰符实现界面自适应,自动处理底部导航栏的内边距,再加上`.padding(bottom = 10.dp)`设定内容与屏幕底部的距离,以完成全面的布局适配。示例代码采用Kotlin。
397 15
|
druid Java 关系型数据库
在Spring Boot中集成Druid实现多数据源有两种常用的方式:使用Spring Boot的自动配置和手动配置。
在Spring Boot中集成Druid实现多数据源有两种常用的方式:使用Spring Boot的自动配置和手动配置。
3279 5
|
缓存 监控 负载均衡
万字讲解API网关的来龙去脉【珍藏】
万字讲解API网关的来龙去脉【珍藏】
3075 1
万字讲解API网关的来龙去脉【珍藏】
|
存储 Python
NumPy数据类型与转换指南
【4月更文挑战第17天】NumPy是Python的数值计算库,提供多种数据类型如整数(int8, int32等),浮点数(float16, float64等),复数(complex64, complex128)和布尔(bool)。使用`astype()`方法可转换数组数据类型,例如`int_array.astype(np.float64)`。NumPy还会在运算中自动进行类型转换。注意转换可能涉及数据丢失、精度降低及性能影响,需根据需求谨慎选择数据类型。