假设检验随想

简介: 假设检验随想

⭐️ 前言

你会吵架吗?你会用数学吵架吗,不会的话就过来看看吧,哈哈

西方人发明了现代意义上的概率论,于是就想把它推广到生产和生活中。借助一大堆的概率论中的概念,他们发明了假设检验,想利用有限的数据和严谨的推理,来证明某些事情是不可能的。

“ 说你不可能,我是有证据的,还有数学来帮忙,你服不服?哈哈 ”

假设检验里有两个概念,原假设和备择假设,原假设是你认为是假的,备择假设是你认为是真的。你想要证明原假设是假的。

有点绕吧,我们看个例子,假设有人说,我有种能让人头发茂密的药水,用的人都说好。那你不信,你想证明他说的药水不可能这么神奇,那你就把它说的话作为原假设,把他说的话的反面作为备择假设,你就用数学来证明他说的药水不可能这么神奇。

那怎么证明呢,简单来说,你就假设它说的是真的,搜集数据,寻访那些被他坑过的人,看看他们的表现,看看他们的反应,看看他们的服用情况,最重要的是看看他们用完的效果。

好啦,你有数据了,那就开始用概率论的武器来分析吧。你先假设药水真的很灵,99%的情况都是灵验的,那么这就等于说 100个人中有 99 个人用都管用。

我们换个说法,也就是“ 100个人中会有20个人用了不管用 ” 这件事是不会发生或基本不会发生的,我们叫他小概率事件。

可是,事实真的如此吗,我们让数据来说话,通过数据统计,你发现,上面说的小概率事件发生了,这太离谱了,小概率事件怎么那么轻易就发生了!

于是,你终于有理由否定药水的神奇性了。

“ 赶快报警,把这个卖假药的贩子给抓起来,哈哈! ”

假设检验的原理就是这样:首先假设原假设是成立的,然后通过数据统计量的分析,发现了小概率事件的发生。由此可以推断,原假设很可能是错误的,因而被否定了。

当然,要展开讲,还有很多东西,里面都是数学。下面是一些偏理论的解释,更深层次的东西,网上资料很多,大家可以自行搜索。

⭐️ 假设检验

1. 假设检验的基本概念

1.1 什么是假设检验?

假设检验是一种统计推断方法,用于判断样本数据与某个假设之间是否存在显著差异。在假设检验中,我们首先提出一个原假设(null hypothesis),然后收集样本数据,并基于样本数据对原假设进行检验,最终得出结论。

1.2 假设检验的基本步骤

假设检验通常包括以下几个基本步骤:

提出原假设(H0)和备择假设(H1):

原假设是我们想要进行检验的假设,备择假设则是与原假设相对立的假设。

选择适当的检验统计量:

根据研究问题和数据类型选择合适的检验统计量,例如 t 检验、χ²检验等。

确定显著水平(α):

显著水平是拒绝原假设的概率阈值,通常选择0.05或0.01。

计算检验统计量的取值:

利用样本数据计算检验统计量的取值。

做出决策:

根据检验统计量的取值和显著水平,判断是否拒绝原假设。

2. 假设检验的基本原理

2.1 类型 I 错误和类型 II 错误

在假设检验中,可能会犯两种类型的错误:类型 I 错误和类型 II 错误。类型 I 错误指的是在原假设为真时,错误地拒绝了原假设;类型 II 错误指的是在原假设为假时,未能拒绝原假设。控制这两种错误的概率是假设检验中的重要考虑因素。

2.2 P 值

P 值是指观察到的样本数据或更极端数据出现的概率,当 P 值小于显著水平时,我们拒绝原假设。P 值越小,拒绝原假设的把握就越大,反之亦然。通常将 P 值与显著水平进行比较,来做出决策。

3. 常见类型的假设检验

3.1 单样本 t 检验

单样本 t 检验用于检验一个样本的均值是否等于某个已知值。

3.2 独立样本 t 检验

独立样本 t 检验用于比较两组独立样本的均值是否存在显著差异。

3.3 配对样本 t 检验

配对样本 t 检验用于比较同一组样本在两个不同条件下的均值是否存在显著差异。

3.4 卡方检验

卡方检验用于检验观察频数与期望频数之间的偏差是否显著。

4. 实例分析:某药物疗效检验

假设我们想要检验一种新药物的疗效,我们可以通过独立样本 t 检验来比较服用该药物和未服用该药物两组患者的病情好转情况。如果发现服用药物的患者病情好转的平均程度显著高于未服用药物的患者,我们就可以得出药物的疗效显著。

5. 总结

假设检验是统计学中一种重要的推断方法,通过对样本数据的分析,帮助我们判断研究结论的可靠性。在实际应用中,我们需要根据研究问题和数据特点选择合适的假设检验方法,并注意控制类型 I 错误和类型 II 错误的风险。希望本文能帮助读者更好地理解和运用假设检验这一统计学工具。

笔者水平有限,若有不对的地方欢迎评论指正!

相关文章
|
机器学习/深度学习 算法 数据挖掘
聚类分析(文末送书)
聚类分析中常用数据结构有数据矩阵和相异度矩阵
89 0
|
7月前
|
数据可视化 Python
R语言布朗运动模拟股市、物种进化树状图、二项分布可视化
R语言布朗运动模拟股市、物种进化树状图、二项分布可视化
|
数据挖掘 计算机视觉 Python
【每周一坑】蜥蜴流感与贝叶斯定理
不过今天的题,我希望你们用程序模拟一场蜥蜴流感。比如有10万个人,按照上述3条规则去模拟,最后去统计下检测结果阳性中有多少人是真正的患者。
|
机器学习/深度学习 Python
|
Dart 算法 Java
概率论与数理统计引论
概率论与数理统计引论
|
机器学习/深度学习 算法 数据可视化
女神也用的约会决策:决策树算法实践
由于决策树非常有价值,还衍生出了很多高级版本。决策树是机器学习中强大的有监督学习模型,本质上是一个二叉树的流程图,其中每个节点根据某个特征变量将一组观测值拆分。决策树的目标是将数据分成多个组,这样一个组中的每个元素都属于同一个类别。决策树也可以用来近似连续的目标变量。在这种情况下,树将进行拆分,使每个组的均方误差最小。决策树的一个重要特性可解释性好,即使你不熟悉机器学习技术,也可以理解决策树在做什么。
162 0
女神也用的约会决策:决策树算法实践
爱因斯坦yyds?广义相对论刚刚通过了一场历时16年的严格检验
爱因斯坦yyds?广义相对论刚刚通过了一场历时16年的严格检验
173 0
爱因斯坦yyds?广义相对论刚刚通过了一场历时16年的严格检验