|
在生物统计/卫生统计里面,对于定性无序资料----率的差异检验我们常用的检验方法有卡方检验和Fisher确切概率法,后者是在前者的某些条件不满足的情况下的一种补充。几乎所有的医学统计学书上都给出了Fisher确切概率法的公式,即:P=(a+b)!(b+d)!(a+c)!(c+d)!/(a!b!c!d!n!),并且书上还会给出这样一句话,Fisher确切概率法不基于卡方分布,其理论依据是超几何分布。那么问题来了,如何通过超几何分布推导Fisher确切概率法的公式。
第一,我们要明确超几何分布的公式是什么 P=((N-M)!/((N-M-n+m)!(n-m)!))(M!/(M-m)!m!))/(N!/(N-n)!n!)。(公式1)N代表有限总体内研究对象总的个数,M代表总体的阳性个数,n代表抽样的个数,m代表抽样个数n中阳性个体m的个数。那么在四个参数确定的情况下,我们便可计算发生概率。
第二,在四格表中,总数n和四个周边合计确定的情况下,一旦一个格子的数值确认,那么其余三个格子的数值也就跟着确认了,我们用自由度1来描述。那么确切概率法要求我们选出四个周边合计中最小的那个来进行计算。不失一般性,我们假设合计a+c为最小。那么这时我们就以格子a为准,只要a的数值确定,那么其余三个格子的数值也确定;所以我们在讨论概率分布的时候,只需要对格子a的概率分布进行讨论即可。那么首先我们要知道a格子的取值范围,很明显,其范围是[0,a+c],假如现在a格子的数值是A,那么其余三个格子的数值分别是B,C,D;这时A+C是最小的合计,从而A+C就变成了超几何分布中的n,总数A+B+C+D为N,那么要从N中抽取n个个体出来有多少种情况,即为(N!/(N-n)!n!)=(N!/(N-(A+C))!(A+C)!)=(N!/(B+D)!(A+C)!)(公式2);接下来,我们要在A+B中选出A个个体,有多少种情况,即为((A+B)!/(A+B-A)!A!)=((A+B)!/(B!A!))(公式3),同理,我们要在C+D中选出C个个体,有多少种情况,即为((C+D)!/(C+D-C)!C!)=((C+D)!/(D!C!))(公式4),把公式2、3、4带入公式1,即得到P=(A+B)!(B+D)!(A+C)!(C+D)!/(A!B!C!D!N!),推导完毕。
|
|