在概率論中,二項分布是一個十分重要且應用廣泛的概率分布。
模型[]
設在
重伯努利試驗中
,那麼事件
發生
次(
)的概率是
例如,在摸球模型中:一個袋中裝有除顏色不同外其餘情況均相同的若干個紅球和黃球,抽到紅球的概率是
,有放回地從袋中抽出
個球,抽到
個紅球的概率就滿足上述分布。
容易驗證二項分布滿足規範化條件
因其求和使用到二項式定理而得名。
當
時退化為伯努利分布(即兩點分布)。
對於二項分布,我們通常用隨機變量
表示事件
發生的次數,這樣
簡記作
R 語言的二項分布分布律函數為dbinom,一些不同參數的二項分布分布律為
中心項[]
我們討論給定試驗次數
後,概率
隨
的變化情況。
- 當
時,
- 當
時,
- 當
時,
因此,當
為整數時,概率
在
以及
處同時達到最大值,概率整體的趨勢是先增大後減小,當
不為整數時,概率在
處達到唯一最大值。
我們將最大值對應的
稱為二項分布的中心項。
泊松逼近[]
當二項分布的試驗次數
很大,每次試驗的概率
很小,而
大小適中時,我們可以用泊松分布來近似二項分布的值。
泊松分布滿足
其中,
為該分布的強度。
用這一分布對二項分布做近似,可以簡化二項分布中的計算。
數字特徵[]
二項分布的期望和方差分別是
這是因為
二項分布的特徵函數是
統計特性[]
- 指數分布族
參數空間為
的二項分布族
是指數分布族。
- 充分完備統計量
參數空間為
的兩點分布族
是完備的。且它的一個充分完備統計量是
- 點估計
- 參數空間為
的兩點分布族
的總體
的矩估計和極大似然估計都是
。
- 給定正整數
,
是參數,服從
的樣本
關於參數
的一致最小方差無偏估計是
,關於
的一致最小方差無偏估計是
,而關於
的無偏估計不存在。
- 雙參數的二項分布族
(這裡
都是未知參數)的矩估計分別是
這裡
是取整函數,
是樣本方差。
上下節[]
參考資料