【超几何分布公式】超几何分布是概率论中一种重要的离散概率分布,用于描述在不放回抽样情况下,成功事件发生的次数的概率分布。它常用于统计学、质量控制、抽样调查等领域。与二项分布不同的是,超几何分布适用于有限总体且不放回的抽样情况。
一、超几何分布的基本概念
设一个总体中有 $ N $ 个元素,其中 $ K $ 个是“成功”元素,其余 $ N-K $ 个是“失败”元素。从总体中随机抽取 $ n $ 个样本(不放回),则在这 $ n $ 个样本中恰好有 $ k $ 个“成功”元素的概率服从超几何分布。
二、超几何分布的概率质量函数
超几何分布的概率质量函数(PMF)为:
$$
P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}}
$$
其中:
- $ N $:总体大小
- $ K $:成功元素数量
- $ n $:抽取样本数
- $ k $:抽取样本中成功元素的数量
- $ \binom{a}{b} $:组合数,表示从 $ a $ 个元素中选取 $ b $ 个的方式数
三、超几何分布的期望与方差
指标 | 公式 |
期望值 | $ E(X) = n \cdot \frac{K}{N} $ |
方差 | $ \text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ |
注意:方差中多了一个修正因子 $ \frac{N - n}{N - 1} $,这是由于不放回抽样的影响。
四、超几何分布的应用场景
超几何分布常用于以下情形:
- 抽样检查产品质量(如从一批产品中抽取若干件进行检验)
- 病毒检测中的抽样分析
- 抽奖活动中的中奖概率计算
- 统计学中的无放回抽样问题
五、表格总结
项目 | 内容 |
分布名称 | 超几何分布 |
概率质量函数 | $ P(X = k) = \frac{\binom{K}{k} \binom{N - K}{n - k}}{\binom{N}{n}} $ |
期望值 | $ E(X) = n \cdot \frac{K}{N} $ |
方差 | $ \text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ |
应用场景 | 不放回抽样、质量控制、抽奖、统计调查等 |
与二项分布区别 | 超几何是不放回抽样,二项是放回抽样 |
通过了解和掌握超几何分布的公式及其应用,可以更好地处理实际生活和科研中的抽样问题,提高数据分析的准确性与科学性。