在概率论中,二项分布是一个十分重要且应用广泛的概率分布。
模型[]
设在重伯努利试验中,那么事件发生次()的概率是
例如,在摸球模型中:一个袋中装有除颜色不同外其余情况均相同的若干个红球和黄球,抽到红球的概率是
,有放回地从袋中抽出
个球,抽到
个红球的概率就满足上述分布。
容易验证二项分布满足规范化条件
因其求和使用到
二项式定理而得名。
当时退化为伯努利分布(即两点分布)。
对于二项分布,我们通常用随机变量表示事件发生的次数,这样
简记作
R 语言的二项分布分布律函数为dbinom
,一些不同参数的二项分布分布律为
中心项[]
我们讨论给定试验次数后,概率随的变化情况。
- 当时,
- 当时,
- 当时,
因此,当为整数时,概率在以及处同时达到最大值,概率整体的趋势是先增大后减小,当不为整数时,概率在处达到唯一最大值。
我们将最大值对应的称为二项分布的中心项。
泊松逼近[]
当二项分布的试验次数很大,每次试验的概率很小,而大小适中时,我们可以用泊松分布来近似二项分布的值。
泊松分布满足
其中,
为该分布的强度。
用这一分布对二项分布做近似,可以简化二项分布中的计算。
数字特征[]
二项分布的期望和方差分别是
这是因为
二项分布的
特征函数是
统计特性[]
- 指数分布族
参数空间为的二项分布族是指数分布族。
- 充分完备统计量
参数空间为的两点分布族是完备的。且它的一个充分完备统计量是
- 点估计
- 参数空间为的两点分布族的总体的矩估计和极大似然估计都是。
- 给定正整数,是参数,服从的样本关于参数的一致最小方差无偏估计是,关于的一致最小方差无偏估计是,而关于的无偏估计不存在。
- 双参数的二项分布族(这里都是未知参数)的矩估计分别是这里是取整函数,是样本方差。
上下节[]
参考资料