一、概述
当前临床应用的生物技术药物中,基因治疗(载体)和大分子核酸类药物还很少,而很多细胞因子、治疗性单抗、针对小分子靶点的酶类药物已在常规应用,还有部分多肽类生物技术药物也已经用于临床。因此,本节主要讨论蛋白质和多肽类生物技术药物的成药性及其预测。
按照前述药物作用模式,当需增强体内某个信号传递蛋白或某个物质代谢途径的关键蛋白活性时,可选择性促进该蛋白质的合成、降低该蛋白质降解、促进蛋白修饰增强活性、增强其激动剂(activator)水平甚至上述策略中多种联用。为了实现这种效应,可用对应蛋白或特殊多肽作为药物从外界补充以增强或阻断对应信号通路或代谢途径的作用。除了局部外用蛋白质药物外,其他蛋白质药物经过各种途径给药后一般需经过血液循环;蛋白质药物很难进入细胞内,其主要是在血液循环系统发挥作用。除了药理活性外,多数蛋白质药物在人体内血浆的循环半衰期和人体免疫反应是其成药性的决定因素(显然蛋白疫苗需要其免疫反应)。决定蛋白质和多肽药物血浆半衰期的主要因素是血浆中蛋白质药物的肾脏滤除、热稳定性、免疫清除、蛋白酶解等因素,这对包括疫苗在内的蛋白质药物都适用;而除了疫苗以外,其余药用蛋白质都需要避免其引起人体的免疫反应,以免产生过敏和炎症反应等难以控制的副作用。多肽药物如分子比较小则除了设计的疫苗以外,一般免疫原性很小,影响其半衰期的主要是肾脏滤除和蛋白酶解等因素。
蛋白质和多肽类药物常需修饰其N端和C端的氨基酸残基(置换成非天然氨基酸等)以降低降解。除了蛋白质疫苗外,用亲水聚合物修饰蛋白质和多肽药物的抗原决定簇既可降低其免疫原性,又可延长其血浆半衰期。蛋白质表面能被免疫球蛋白分子的抗原结合位点或特定效应分子识别并结合的抗原区域即抗原表位(epitope)或抗原决定簇(antigenic determinant)。因此,预测药用蛋白质的抗原决定簇对改善其药代特性具有重要意义。本节简介蛋白质与多肽类药物除了其药理作用外的成药性特征及其预测。
二、蛋白质的免疫原性预测
免疫(immunity)是指机体对外源或本来不暴露的自身物质的识别,并利用相应方式进行清除以维持体内环境稳定的现象和过程,由机体的免疫系统执行,涉及免疫活性分子、免疫细胞、免疫组织和免疫器官等。动物都有免疫系统,但特异性免疫(specific immunity)主要在脊椎动物体内,无脊椎动物的免疫系统主要是非特异性免疫。免疫应答(immune response)指机体对异物刺激引起的一系列特异性生理反应以维持内环境稳定的过程;广义的免疫应答包括非特异性免疫(即天然免疫,innate immune)和特异性免疫。天然免疫是物种进化过程中具备的对外界刺激的自然防御系统,可遗传且相对稳定,主要识别异种物质,由皮肤粘膜、吞噬细胞、NK细胞和组织间隙液体成分组成。特异性免疫即获得性免疫(acquired immunity)或适应性免疫(adaptive immunity),其作用高度特异、效力强、有记忆性但不能遗传。诱导机体的特异性免疫是使用疫苗进行防疫与治疗的主要机制。参与特异性免疫反应的细胞主要是B淋巴细胞和T淋巴细胞;来自机体的参与免疫反应的主要蛋白质是抗体(antibody),补体(complement)和细胞因子(cytokine)。诱发免疫反应的是抗原(antigen),即能刺激机体产生特异性抗体或致敏淋巴细胞,并能与对应抗体等在体内外发生特异性相互作用的成分,可据其刺激B淋巴细胞产生抗体对胸腺的依赖分成胸腺依赖抗原(TD antigen)和非胸腺依赖抗原(TI antigen)。
免疫反应过程中抗原需经过抗原递呈中的识别和加工,再传递给特异性免疫细胞(主要是T和B淋巴细胞)。能进行抗原递呈的细胞称为抗原递呈细胞(antigen-presentation cell, APC)。抗原递呈中涉及蛋白质抗原的部分水解,主要有经过吞噬小泡进入溶酶体(lysosome)的水解途径、经过蛋白酶体(proteosome)的降解过程。APC主要有两类:一类表面表达主要组织相容性复合体(major histocompatibility complex, MHC)Ⅱ分子,负责识别通过吞噬加工的外来抗原;另一类在病原体和细胞因子作用下才参与抗原递呈,主要表达MHCⅠ分子并可识别和加工来自机体内部的自身抗原、寄生病毒、细菌抗原。T细胞依靠其表面受体识别与APC表面与MHC分子结合的连续抗原肽表位(epitope),其中CD4细胞识别与MHCⅡ结合的外来抗原,CD8识别与MHCⅠ结合的内源性抗原。B细胞识别抗原依靠表面的膜免疫球蛋白和免疫球蛋白形成的跨膜复合物,可识别TD抗原和TI抗原,但识别机制有差异。多数抗原为TD抗原,其需经过APC处理后提交给辅助性T淋巴细胞,再传递给B淋巴细胞;这些处理后的抗原肽含有多个抗原决定簇,分别与辅助性T淋巴细胞和B淋巴细胞作用后激活B淋巴细胞产生抗体。TI抗原不需要辅助性T淋巴细胞,可直接刺激B淋巴细胞产生抗体。
免疫反应涉及复杂的细胞和分子作用网络,并有精细的调节机制,这是机体选择性清除异物和维持自身稳定的必然要求。识别蛋白质药物的抗原决定簇是通过药用蛋白质分子改造和修饰消除其免疫原性以降低其毒副作用和延长其半衰期的关键环节,因为需要精心设计修饰或改造的位点才能避免修饰或改造使得药用蛋白质的活性下降过多且具有所需要的效率。显然,这是用生物信息学技术辅助药用蛋白质改造的应用;同时,这种预测还可用于疫苗的设计和优化以增强疫苗的效价。
对蛋白质免疫原性的预测即对其抗原表位的预测。蛋白质表面的抗原决定簇有两类:一类是线性的连续肽段;另一类是不连续的空间区域,即构象表位。对抗原表位的预测可直接用于多肽和蛋白疫苗的设计和改造,这属于反向疫苗研究策略。
以下简介对B淋巴细胞抗原表位和T淋巴细胞抗原表位的预测策略。
(一)B淋巴细胞的连续抗原表位预测
连续抗原表位为连续肽段,这类表位大约为各种可诱导单抗的表位总量的10%。抗原表位应能够与对应抗体特异性结合,而这种结合是蛋白质的功能域之间的相互作用,所以遵循蛋白质间相互作用的一般原则。因此,连续的抗原表位也会有对应的构象,可作为b片层结构或a螺旋等二级结构的链接结构并位于蛋白质的表面才能与对应抗体识别和结合。这是基于氨基酸残基形成B淋巴细胞连续抗原表位倾向性进行预测的主要理论依据,此类方法预测连续肽段是否位于蛋白质表面且亲水,一般长度少于20个氨基酸残基。近年来发展了基于机器学习的方法对此类抗原表位进行分类和预测。
利用氨基酸残基组成抗原表位的倾向性预测B淋巴细胞连续抗原表位主要考虑残基的亲水性、柔韧性、表面可及性、二级结构特性、在连续抗原表位中出现的频率等表示形成表位的标度。二级结构特性用于B淋巴细胞连续抗原表位预测的依据是蛋白质的二级结构类型中,b片层结构或a螺旋主要位于构象空间的内部,而b转角和环主要存在于b折叠链间或a螺旋间且多位于构象空间的表面;常用Chou-Fasman方法预测对应肽段是否形成b片层结构或a螺旋,属于b转角和环等位于构象空间表面的肽段易于成为连续抗原表位。显然这些理论依据都不够充分。
近年来逐步发展了以模式识别为主的预测方法,包括人工神经网络、决策树、支持向量机等方法。单独用这些机器学习方法获得的改进也有限。但这些模式识别方法同经典的氨基酸残基性质标度相结合的预测方法效果有明显改善,并有Bepitope、ABCpred (http://www.imtech.res.in/raghava/abcpred/)等免费程序可在线使用。但是这些方法的预测准确度很少超过70%,预测B淋巴细胞连续抗原表位的方法仍有待于改进。 (二)B淋巴细胞的构象表位预测
组成B淋巴细胞构象表位的氨基酸残基在肽链中不连续,但在空间相互靠近构成一个抗原表位功能域。确认这类表位的直接方法是蛋白质和对应单抗形成复合物的晶体结构,但这类数据非常少。目前的主要方法是基于序列和3D结构、基于结构和基于序列-结构联用的方法预测构象抗原表位。
基于序列和3D结构的识别方法需抗原蛋白质的三维结构数据,缺乏晶体结构数据也可用其同源模建的三维结构模型;这类方法识别抗原表位所需要的实验确认的抗原表位数据已有几百个,并有对应EPITOME和CED等专门数据库提供这类的分类。在EPITOME中,采用结构相似性联配等方法,从有晶体结构的抗原与单抗的复合物结构中确定抗体中识别抗原构象的互补区,用溶质的可及性确定抗原中与抗体中识别抗原构象的互补区相互作用的位置,即构象表位。虽然抗原与抗体的结合也属于蛋白质相互作用,但抗原表位的保守性明显低于其他的蛋白质-蛋白质相互作用区域的保守性。CED数据库主要是文献报道的构象抗原表位数据,其中包含用交叉肽方法、突变扫描的方法和噬菌体展示技术等获得的构象抗原表位数据。
基于结构的识别方法预测构象抗原表位实际上预测的是一个具有明确功能的结构域,该类方法利用小样本集的已知抗原与单抗复合物的晶体结构数据建立识别方法,预测的准确性可大于70%,有对应的免费服务器可用。基于序列-结构的预测方法是序列和结构信息联合应用的预测方法,目前用氨基酸残基出现在构象抗原表位的统计频率、三维结构信息以及对应区域的可及性为主要特征,用一个小样本集的已知抗原抗体复合物的晶体结构数据库建立打分判断的概率矩阵,并有免费在线软件DiscoTope(http://www.cbs.dtu.dk/services/DiscoTope/),但是该方法的预测灵敏度不高。 目前,B淋巴细胞的构象抗原表位识别方法还不成熟,预测的结果需要仔细的实验验证过程;此领域需要解决的技术与理论问题还很多,这也是当前生物信息学研究的热点领域之一。
(三)与MHCⅠ结合的T细胞抗原表位的预测
细胞免疫是人体免疫系统清除异物的重要体系,其涉及对抗原递呈细胞表面MHC分子亚型和抗原表位的同步识别。据抗原肽处理和识别对象的差异,T细胞的抗原表位分成细胞毒性T细胞 (cytotoxic T lymphocyte,CTL ) 抗原表位和辅助性T细胞抗原表位。CTL抗原表位主要与MHCⅠ形成复合物并由CD8细胞识别,辅助性T细胞抗原表位主要由CD4细胞识别(图17-9)。
图17-9 人MHC I和b-2巨球蛋白、HIV 包膜糖蛋白120的可变肽段的复合物
绿色为MHC I,蓝灰色为b-2巨球蛋白,红色为来自HIV包膜糖蛋白120的表位肽
CTL抗原表位与MHCⅠ形成复合物,抗原表位肽段常结合在MHCⅠ复合物的两段a螺旋间沟槽内(图17-9);此沟槽是MHCⅠ结合来自细胞内经过消化的抗原肽段的关键位置,其结构保守性较高,主要通过氢键结合少于九个残基的抗原表位肽。预测此类抗原表位主要有两类策略,第一类基于抗原表位肽与MHCⅠ结合特性,第二类基于抗原表位肽被加工处理的过程进行预测。基于抗原表位肽与MHCⅠ结合特性预测CTL抗原表位的基本方法有结合序列特征识别、人工神经网络等;基于对MHCⅠ与抗原表位肽复合物的晶体结构解析,逐步发展了类似于蛋白质折叠模式预测的穿引法(theading)以及研究小分子化合物与靶点亲和力的3D-QSAR方法;这些代表性方法如下。
1. MHCⅠ抗原表位肽结合区域的特殊结构使得与MHCⅠ形成复合物的肽段具有一定的序列特征,即其以一定的间隔出现保守的氨基酸残基。已知的这类抗原表位肽中,C端常为Ile、Val、Arg、Lys、Tyr和Phe,这些保守残基和C端的特征残基构成了MHCⅠ可结合的特征性肽序列。这些特征性肽序列主要通过用位置特异打分矩阵(position-specific scoring matrix,PSSM)识别实验测定的结合肽序列信息而确定。相对而言,这类结合肽基序识别的算法比较成熟。
2. 人工神经网络法用于预测MHCⅠ结合的抗原表位肽主要策略是利用实验测定的肽段库与MHCⅠ结合能力数据进行训练,然后用于预测未知肽段成为MHCⅠ结合的抗原表位的可能性,此方法阳性预测率能高于75%,且假阳性较少,但灵敏度不够。
3. 基于结构的预测方法中,有一种利用晶体结构数据建立MHCⅠ结合肽复合物的三维模型模拟预期的抗原表位肽与MHCⅠ的相互作用,这相当于预测蛋白质可结合配体的分子对接策略,并可计算结合自由能定量预测亲和力。这类方法获得了较好的结果,但是计算工作量很大。
4. 另一类基于结构的方法中,穿引法类似于预测蛋白质折叠,用待测的肽段沿着已知晶体结构的抗原表位肽叠放,考察与MHCⅠ的肽段结合域的相互作用,计算与晶体结构中模板肽相比的结合自由能预测亲和力。此方法的计算相对于结合基序的识别要复杂且要求结构分析较多,使用不广泛。
5. 3D-QSAR方法类似于小分子化合物与靶点亲和力预测方法,通过分析肽段的结构特征和与MHCⅠ结合特性,用类似于CoMFA的方法计算静电场、疏水场等的贡献,有较好的预测能力。
(四)与MHC II结合T淋巴细胞抗原表位预测(图17-10)
图17-10 人MHC II 、感冒病毒血凝素表位肽和葡萄球菌内毒素C3变异体3B2的复合物
黄色为葡萄球菌内毒素C3变异体3B2,红色为感冒病毒血凝素表位肽,绿色为MHC II的a链,蓝灰色为其b链
与MHCⅡ结合的T淋巴细胞抗原表位主要是胞外的蛋白质被吞噬形成吞噬小泡后进入溶酶体被部分水解所得肽段。MHCⅡ与MHCⅠ有类似的结构域结合抗原表位肽(图17-7),但是来自两条链,且可结合的抗原表位肽段长度比MHCⅠ可结合肽段多两个氨基酸。MHCⅡ结合肽段序列规律性低,基于结合肽基序预测成功率低
这本书真好。强烈建议买吧