|
二项分布 - 二项分布
一个事件必然出现,就说它100%要出现。100%=1,所以100%出现的含义就是出现的概率P=1。 即必然事件的出现概率为1。
如果掷一枚硬币,正面向上的结局的概率为0.5 。反面向上的结局的概率也是0.5 。那么出现正面向上事件或者反面向上事件的概率就是0.5+0.5=1 ,即二者必居其一。
如果掷两次硬币,根据独立事件的概率乘法定理那么两次都是正面(反面)向上的概率是0.5×0.5=0.25。另外第一个是正第二个是反的出现概率也是 0.5×0.5=0.25。同理第一个反第二个正的出现概率也是0.5×0.5=0.25。于是一正一反的概率是前面两个情况的和,即 0.25+0.25=2×0.25=0.5 。它们的合计值仍然是1。列成表就是:
两个正面的概率 | 一正一反的概率 | 两个反面的概率 | 0.25 | 2×0.25=0.5 | 0.25 |
注意到代数学中 (a+b)^2=a^2+2ab+b^2, 而在a=0.5,b=0.5时,有 1^2=(0.5+0.5)^2=0.25+2×0.5×0.5+0.25=1。这说明掷两次硬币的各个结局的出现概率可以通过对二项式的平方展开而得到。
顺此,对于掷n次硬币的各种结局的出现概率也可以通过对二项式的n次方的展开而得到。例如n=3时,有(注意0.5×0.5×0.5=0.125) 1^3=(0.5+0.5)^3=0.125+3×0.125+3×0.125+0.125 = 0.125+0.375+0.375+0.125 = 1。
3个正面的概率 | 2正1反的概率 | 1正2反的概率 | 3个反面的概率 | 0.125 | 0.375 | 0.375 | 0.125 |
二项式展开的牛顿公式表示为:
(a+b)^n=a^n + … + [n!/m!(n-m)!][a^(n-m)b^m]+ … + b^n (其中m=1,2,……n-1)。
即这种类型的问题(如掷多次硬币)的概率分布恰好可以用二项式展开的牛顿公式表示。而这也就是为什么把这种概率分布类型称为二项分布的原因。
如果a,b并不等于0.5,那么只要把A事件出现的概率以p代入,把B事件的出现概率以(1-p)代入,以上公式仍然正确,(a+b仍然=1)。所以对于仅有A,B两个结局的随机事件,如果A事件出现概率为p,B事件的出现概率为1-p,那么在n次随机实验中A事件出现n-m次、B事件出现m次的情况(对应一种复合事件)的出现概率P应当是(这里的P是大写的):
P=[n!/m!(n-m)!][p^(n-m) (1-p)^m] (其中m=0,1,……,n)
注意到上面公式的对称性,它也可以写为 P=[n!/m!(n-m)!][p^m (1-p)^(n-m)]。 它就是所谓二项分布概型 的随机事件的出现概率公式,也是牛顿二项式展开在变量为对应概率值的情况下的通项。
二项分布 - 正文
概率论中最常用的一种离散型 概率分布。若 随机变量X取整数值 k的 概率为
式中n是给定的正整数;是从n个对象中任意选取k个的组合数,则称X
的分布为二项分布,记作B(n,p)。它的命名来源于b(k;n,p)恰好是【(1-p)+p】n的二项式展开的第k+1项。
从不合格品率为p的产品中独立地抽出n个(每次抽一个,抽出后又放回),其中恰有k个不合格品的概率就是b(k;n,p);统计学由此建立检验产品质量的方案。类似的例子在生产实践和科学试验中是常见的。将这类问题模型化,假设每一次试验只有两个可能结果:A以及它的对立事件Ac,出现A的概率为P(A)=p,出现Ac的概率则为 1-p。这种只有两个可能结果的随机试验称为伯努利试验,将这种试验独立地重复进行n次所组成的随机试验称为n重伯努利试验,其中A出现的次数X是一个服从二项分布B(n,p)的随机变量。
若随机变量服从二项分布B(n,p),则它的数学期望为np,方差为np(1-p),特征函数为(1-p+peit)n,母函数为(1-p+ps)n。当k由0依次增大到n时,b(k;n,p)先增大后减小,当k=【(n+1)p】(记号【α】表示不超过实数α的最大整数)时,b(k;n,p)取最大值;若(n+1)p是整数,则k在(n+1)p-1及(n+1)p
处都使b(k;n,p)取最大值(见图)。
如果Xi服从B(ni,p),i=1,2,…n,而且X1,X2,…,Xn独立,则服从。如果Xn服从B(n,p),则对任何实数α<b,当n→∞时,有
式中
这说明,若p固定,当n充分大时,B(n,p)近似于正态分布。这个渐近公式最早由A.棣莫弗就p
=1/2的情形加以证明,而后由P.-S.拉普拉斯加以推广,常称为棣莫弗-拉普拉斯中心极限定理。S.-D.泊松又证明了:若则
这说明,当p很小而n较大时,B(n,p)可以用泊松分布近似。
正是这两个定理揭示了概率论中最重要的正态分布和泊松分布的意义,对概率论的发展有着深远的影响。
此外,多重伯努利试验中在出现第r个A以前A不出现的试验次数的概率分布就是负二项分布,又称帕斯卡分布。特别当r=1时,就是几何分布。如果每次试验的可能结果多于两个,则二项分布就推广为多项分布。
|
|