假设检验中的两类错误

假设检验中的两类错误 | 学习笔记

2022-11-13 925

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习假设检验中的两类错误

开发者学堂课程【人工智能必备基础：概率论与数理统计：假设检验中的两类错误】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/545/detail/7451

内容介绍

一. 假设检验中的两类错误

二. 实例

三. a 错误出现原因

四. β 错误出现原因

五. a 错误概率计算

六. β 错误的概率计算

七. 总结

一.假设检验中的两类错误

第一类错误(弃真错误):

原假设为真时拒绝原假设。

第一类错误的概率为 a

第二类错误(取伪错误):

原假设为假时接受原假设

第二类错误的概率为 β

没有办法让两类错误同时减小

二. 实例

一个公司有员工 3000 人(研究的总体)，为了检验公司员工工资统计报表的真实性，研究者作了 50 人的大样本随机抽样调查，人均收入的调查结果是; X(样本均值)=871元: S(标准差)=21 元问能否认为统计报表中人均收入=880 元的数据是真实的?(显著性水平 α=0.05 )

原假设 HO: 调查数据 871 元与报表数据 880 元之间没有显著性差异，公司员工工资均值的真实情况为 880 元。假设 H1: 调查数据和报表数据之间有显著性的差品，公司员工工资均值的直实情况不是 880元

三.a 错误出现原因

我们只抽了一个样本，而个别的样本可能是特殊的，不管你的抽样多么符合科学抽样的要求。理论上讲。在 3000 个员工中随机抽取 50 人作为调查样本，有很多种构成样本的可能性，相当于 3000 选 50，这个数目是很大的。这样，在理论上就有存在很多个样本平均数。也就是说，由于小概率事件的出现，我们把本来真实的原假设拒绝了。这就是 a 错误出现的原因。

四.β 错误出现原因

第二个问题是，统计检验的逻辑犯了从结论推断前提的错误。命题是由命题经演绎推论出来的，或写作符号 A→B，命题 C 是我们在检验中所依据操作法则。如果 A是真的，且我们从 A 到 B 的演绎推论如果也是正确的，那么可能是真实的。相反，如果结果 B 是真实的，那么就不能得出 A 必定是真实的结论。这就是 β 错误出现的原因。

五.a 错误概率计算

由实际推原理引起的。即“小概率事件不会发生”的假定所引起的，所以有理由将所有小概率事件发生的概率之和或者即显著性水平 (a=0.05) 看作 a 错误发生的

概率，换言之，a 错误发生的概率为检验所选择的显著性水平。如果是单侧检验，弃真错误的概率则为 a/2。

六.β 错误的概率计算

犯错误的概率的计算是比较复杂的，由于错误的出现原因是属于逻辑上的，所以在总体参数不知道的情况下是无法计算它出现概率的大小的。我们在以上例了的基础上进一步设计;这个公司职员的实际工资不是 880 元，而是是 870 元，原假设为伪，仍然假设实际工资是 880 元。这样我们就可以在总体均值为 870 元和 880 元两种情况下，分别作出两条正态分布曲线( A 线和 B 线)

犯错误的概率大小就是相对正态曲线 A 而言，图 1 中阴影部分的面积: ZX1=1.41;ZX2=5.59

查标准正态分布表可知，=(ZX2)Ф(ZX1)=00793 结果表明，如果总体的真值为 870元，而虚无假设为 880 元的话，那么，平均而言每 100 次抽样中，将约有8次把真实情况当作 880 元被接受，即犯B错误的概率大小是 0.0793。

七．总结

犯第一类错误的危害较大，由于报告了本来不存在的现象，则因此现象而衍生出的后续研究、应用的危害将是不可估量的。想对而言，第二类错误的危害则相对较小，因为研究者如果对自己的假设很有信心，可能会重新设计实验，再次来过，直到得到自己满意的结果(但是如果对本就错误的观点坚持的话，可能会演变成第一类错误)。

假设检验中的两类错误 | 学习笔记