如何在Python中执行F检验
统计学家使用 F 检验来检查两个数据集是否具有相同的方差。 F 检验以罗纳德·费舍尔爵士的名字命名。为了使用 F 检验,我们做出两个假设,一个原假设和一个备择假设。然后我们选择 F 检验认可的这两个假设中的任何一个。
方差是一种数据分布度量,用于说明数据与平均值的偏差。较高的值比较较小的值显示出更大的离散度。
在本文中,您将学习如何在Python编程语言中执行F-Test以及其使用案例。
F-测试过程
执行F-检验的过程如下:
首先,定义原假设和备择假设。
零假设或H0:σ12 = σ22(总体方差相等)
替代假设或 H1:σ12 ≠ σ22(总体方差不相等)
选择用于测试的统计数据。
计算总体的自由度。例如,如果 m 和 n 是总体形状,则自由度分别表示为 (df1) = m–1 和 (df2) = n – 1。
现在从 F 表中查找 F 值。
最后,将双尾检验的 alpha 值除以 2,计算出临界值。
因此,我们使用总体的自由度定义 F 值。我们读取第一行中的 df1,而第一列中的 df2。
有各种用于独特自由度的 F 表。我们将步骤 2 中的 F 统计量与步骤 4 中计算的临界值进行比较。如果临界值小于 F 统计量,我们可以拒绝原假设。相反,当临界值在某个显着水平上大于F统计量时,我们可以接受原假设。
假设
在进行基于数据集的F-检验之前,我们做出了一些假设。
数据总体服从正态分布,即符合钟形曲线。
样本之间不相关,即人群中不存在多重共线性。
除了这些假设之外,在进行F检验时,我们还应考虑以下关键要点:
最大方差值应该在分子中以执行右尾检验。
在双尾检验中,将alpha除以2后确定临界值。
检查是否存在方差或标准差。
如果 F 表中没有自由度,则以最大值作为临界值。
F-Test在Python中的应用
语法
scipy stats.f() 登录后复制