|
药品临床试验中几个统计学概念浅释 摘要:本文介绍效应和响应, 平衡与均衡, 研究总体和研究人群, 区组和分层等可互相比较的统计学概念,说明了它们在药品临床试验中的用法。
关键词:效应和响应; 平衡与均衡; 研究总体和研究人群; 区组和分层
《Statistical Principles for Clinical Trials》 was prepared under the
auspices of the International Conference on Harmonisation of Technical
Requirements for Registration of Pharmaceuticals for Human Use (ICH). To build a
bridge between the principles and popular courses of medical statistics in our
country, we compare and interpret some important but misunderstood concepts in
this field. In this paper there are four pairs of such concepts with explanation
in clinical trials.
KEY WORDS: effect and response; balance and homogeneity study; population and
target population; blocking and stratifying
《临床试验的统计学原则》(ICH-E9)[1]是在人用药品注册技术要求国际协调会议(ICH)的赞助下制定的文件,其中列出29条名词解释以求准确理解文件。但这些解释对我国情况而言是很不够的,为使我国有关期刊和教材与国际接轨,我们对该领域一些重要的,但却常有混淆的概念做了一些探讨,陆续刊出,以求指正。本期刊出有效应和响应,
平衡与均衡, 研究总体和研究人群, 区组和分层等可互相比较的概念。
1效应和响应
效应(effect)在英语里是个常见的词,把它译作“效应”, “响应”, “效果”,
“作用”,“效用”等都是可以的,所发表的ICH-E9译文[2,3],对这个词就有不止一种译法,单从英文上看似乎无不可。然而,在数理统计和医学统计学科领域中,effect
在一定意义上说是专业名词,所以在统计学试验设计和分析中,宜按多数人习惯,只译为“效应”较妥。与之容易互相混淆的词是“响应”(response)。“响应”是试验所观测到的结果,是在受试对象那里所实测到的指标。而效应常常不是直接观测到的,是从一定数量的响应中分析出来的。效应一般分为三类[4]:处理效应,区组效应,和误差效应。处理效应是指当处理因素改变时引起响应的变化;区组效应是为了对于误差进行控制(区组可广义理解为可控制的非处理因素),把试验的非处理因素产生的效应分解出来;误差效应一般是随机的,服从正态分布的。效应和响应二者的对比如下。
响应 现象 结果 对因素效应的综合 包含各种误差影响
效应 实质 原因 对响应总和的分解 一种或几种因素的影响
ICH-E9的原文中还提到“效应大小”( effect size
),文献[5]中有专门条目解释这一词组:“效应大小指由于因素引起的差别”。有人[2,3]把effect size译作“样本含量”
,从[1]的上下文看,似乎不可能是sample
size之误,在“样本含量”一节提到“效应大小”,是指主要变量引起的响应差别除以相应的标准误差,这一相对量对估算样本含量是很重要的。
2平衡与均衡
平衡(balance)一词在统计学中也是专业术语,指可比较的两组或多组中各受试对象数或所作的处理数目相等;或者说,在不同的因素-水平组合的实验基元(cell)中各受试对象数目相同,则称为平衡。而均衡(homogeneity)是指一个试验组内的受试对象按照所研究的性质而言在统计上是均匀的,一致的。
有的书把均衡当作实验设计的一个原则,指“非处理因素都一样”。这里的均衡与我们所指的完全是不同的概念。有两个以上非处理因素时,很难做到“非处理因素都一样”,但针对这种情况有许多现代的多因素实验设计方法可供使用。
例1 随机区组实验(randomized block design),或称随机化完全区组实验(randomized complete block design
简称RCB):12只小鼠按体重的不同分为4个区组,每个区组有三只,随机分配喂以三种不同饲料。
这里每个区组内的小鼠从体重看是一致的,称为均衡;4个区组每个都有3种饲料,称为完全,本例也是平衡的;每种饲料都喂以4种不同体重的小鼠,称为配伍。
如果饲料多于3种,比方说是4种,每个区组只能安排其中的3种,所有区组喂每种饲料的小鼠数也相同,可以看出这里平衡有两种意义,一是指每区组都三只小鼠,另一是指整个试验每种饲料都喂4个小鼠,因此称为平衡的不完全区组实验(balanced
incomplete randomized block design, 简称BIB)。
如果12只小鼠的体重是均衡的,可以完全随机地分配喂以不同饲料,称完全随机设计(completely randomized
design)。这里完全随机,是简单随机,有别于RCB或BIB中的区组随机;后二者中“完全”和“不完全”是针对所有处理而言的,同一区组内不同对象接受了所有处理,谓之“完全”,不同区组是平衡的。
方差齐性(homogeneity of variances),意味着方差是一致的,人们却不翻译成“方差均衡”。 方差齐性不满足(heterogeneity of
variances), 也不翻译成“方差不均衡”。
对一个分布而言,均衡(homogeneity of distribution)是指其变异来自随机误差,不均衡(heterogeneity of
distribution )是指其变异还来自系统误差[6]。
3 研究总体和研究人群
“总体”(population)是个重要概念。在我国内目前出版的几十本医学统计学一类的书,几乎都认为总体是“同质观察单位的全体”。而国外有关的几十本书中,虽然他们在说明此概念的用语互相有很大差别,却没有见到用过“同质”、“均衡”、“均匀”一类的词。现把文献[7]中的定义翻译如下:“总体是特定时间内关心的观察单位最大的集合。如果用某一变量的数值作为观测总体中个体的尺度,于是产生变量数值的总体。”
一个实际的总体常常既有同质的一面,又有不同质的一面,一个总体一般都可分为不同的次级总体。从研究总体( study
population)得出统计结论,能否或怎样推广到以后所关心的总体(目标总体)呢?ICH-E9用很大篇幅回答这一问题。现有译文[2,3]都没把目标总体(target
population)作为专业词组翻出来, 把推广(generalization) 有时译成“推论”,有时译成“广义性”,就失去了统计推断的涵义。
在国外或国内的与临床试验有关的期刊中,经常会遇到“研究人群”或“研究群体”,这里人群或群体,在英文中也是population,它常常却不是统计学中的总体,仅仅指参与试验的受试对象的集合。因此,在ICH-E9
引入分析集(set)的概念,以避免population两种不同涵义引起混乱。
4区组和分层
文献[8]介绍了与这两个概念有关的内容,概括如下:
区组(blocking)是将受试对象作为样本所进行的分组或划分;分层(stratifying)是将受试对象所在总体按某(些)特征分割为次级总体。分组的原则一般是使一区组内处理数平衡,有时区组内各处理数之比是个常数。
区组大小或区组长度(size, length)是指一个区组包含多少个接受不同处理的受试单元。
预后因素(prognostic factor)是临床试验研究中有实际意义的协变量,它可作为分层的依据。
这里需要强调的是,在目前流行的统计学书籍上,往往受试对象存在不均衡的情况下才将其划分成不同的区组,用以分解出“区组效应”,从而降低随机误差,或者说是使随机误差更接近实际情况。
在文献[8]中扩展了区组的概念和用法:标以不同区组的受试对象可以是均衡的,即实际上并不存在区组因素,这时还要分成区组,是为了平衡处理因素,详见[8]中的有关例子。
参考文献
1.http://www.fda.gov/cder/guidance/ index.htm , E9 Statistical Principles
for Clinical Trials, September 16, 1998.
2. 高晨燕、 冯毅、 陈峰 等. ICH 临床试验的统计学指导原则(I). 中国临床药理学杂志, 1999;15(3):228-235
3. 郑筱庾,《药品临床试验管理规范》培训教材,中国医药科技出版社,2000;318-345;607-644
4.Klaus Hinkelmann & Oscar Kempthorne :DESIGN AND ANALYSIS OF EXPERIMENTS,
Volume I,Introduction to EXPERIMENTAL DESIGN,John Wiley & Sons, Inc., New
York,1994,P36
5. Curtis L. Meinert:Clinical Trials Dictionary Terminology and Usage
Recommendations ,The Johns Hopkins Center for Clinical Trials,1996,P84
6. Grimm & PR Yarnold :READING AND UNDERSTANDING MULTIVARIATE STATISTICS,
1995 by the American Psychological Association,p350 7. Wayne W.
Danniel:Biostatistics : a foundation for analysis in the health sciences
6th ed., 1995 by John Wiley & Sons, Inc.,New York, P5 8. 张学中
:用区组和分层改进简单随机,中国新药杂志,2000,9(10),383-6
|
|