比例抽样分布计算器
比例的抽样分布
假设我们从给定的 总体中抽取所有可能的n 个 随机样本。进一步假设我们计算每个样本的 比例 。该统计量的 概率分布是该比例的 抽样分布。
抽样分布的形状
当下列条件成立时,可以安全地假设某一比例的抽样分布形状将近似为正态:
- 总体规模(N)至少为样本规模(n)的 10 倍。
- 抽样方法为简单随机抽样。
- n * p ≥ 10,其中 p 是样本比例。
- n*(1-p)≥10。
注意:后两个条件要求从总体中抽取至少 20 个观测值。当样本比例 p 大于 0.5 时,需要更多观测值。
抽样分布的标准差
在规模为N 的总体中,假设某个事件(称为“成功”)发生的概率为 P;事件不发生的概率(称为“失败”)为 Q。假设我们从这个总体中抽取所有可能的规模为n的简单随机样本。最后,假设我们在每个样本中确定成功的比例p和失败的比例q。这样,我们就创建了该比例的抽样分布。
抽样分布的标准差(σp )由总体比例P、总体大小N和样本大小n确定,如下所示:
σp = sqrt[ PQ/n ] * sqrt[ (N - n ) / (N - 1) ]
当总体规模相对于样本规模非常大时,标准差公式可以近似为:
σp =平方根[ PQ/n ]
在入门统计学教材中,你经常会看到这种“近似”公式。一般来说,当样本量不大于总体规模的 1/20 时,使用近似公式是安全的。
抽样分布的标准误差
通常,我们不知道总体参数 P 的值。而且,如果我们不知道 P,我们就无法计算抽样分布的标准差 (σ p )。
但是,我们知道样本比例 p 和 q。将 p 和 q 代入 σ p方程,我们得到:
SE p = sqrt[ pq/n ] * sqrt[ (N - n ) / (N - 1) ]
在这个等式中,p 是 P 的样本估计值,q 是 Q 的样本估计值,SE p是 σ p 的样本估计值,σ p 是抽样分布的标准差。SE p是样本比例差异的标准误差。
当总体规模相对于样本规模非常大时,标准误差公式可以近似为:
SE p = sqrt[ pq/n ]
在以后的课程中,您将看到,能够从样本数据计算标准误差对于推断统计至关重要。它将使我们能够计算比例的 置信区间 并检验有关比例的假设。
要点总结
本课的要点总结如下。
-
当满足以下条件时,样本比例的抽样分布将呈现正态分布:
- 总体规模(N)至少为样本规模(n)的 10 倍。
- 抽样方法为简单随机抽样。
- n * p ≥ 10,其中 p 是样本比例。
- n*(1-p)≥10。
-
如果总体规模相对于样本规模较大,则可以根据以下公式计算抽样分布的标准误差:
SE p = sqrt[ pq/n ]
如果总体比样本至少大 20 倍,则认为总体“庞大”。