|
随着 X-ray、NMR 等实验技术的的进步,蛋白质结构数据的数量日益增多,结构
精度也越来越高,使得结构比较更为可行。目前已经发现许多蛋白的一级序列差异
很大,难以通过序列比对进行分子进化的研究,但它们的空 间拓扑 结构仍 然很相
似,可以进行结构叠合比较、分析它们之间的进化关系,这表明结构比较可以比序
列比较获得更多更精确的结构信息。研究发现蛋白质结构比序列的保守性更强,进
化过程中蛋白质序列可能发生变化,但它的折叠模式更为保守,即使是 70%的序
列发生变化,它的折叠模式也不会有很大的改变 。蛋白质分子的结构比较与蛋白
质一级序列比较法相比,具有更高的优越性。
目前有关蛋白质结构比较的研究方法很多,主要有刚体结构叠合比较、多特征的结
构比较等方法。前者用比较后确定的拓扑等价位点的个数或等价位点 Cα 原子距离
的均方根值作为不同结构间差异性的量度(结构进化树);后者用蛋白质结构的多
项特征如残基的物理特性、残基的空间倾向性、主侧链的方向、主链的二面角、二
级结构类型和主侧链的可接近性等综合指标作为结构的差异性量度,有时称此类方
法构建的结构进化树为“类结构”进化树。
刚体叠合所构建的进化树适用于同源蛋白质结构预测的骨架结构的选择,基于序列
的进化树便于描述类似性较大的蛋白质的进化关系,而结构的多特征比较则适用于
分析分歧较大的蛋白质结构。
1.刚体结构叠合比较
当已知 2 个以上同源蛋白质的晶体结构时,可将每两套结构的原子坐标进行最佳叠
合,确定类似结构中完整的一套残基等价位点,并使等价位 点间的 距离平 方和最
小,这样便得到各结构的拓扑等价区。通常将结构简化为一系列 Cα 位置,等价位
点被定义为在重叠结构中位于某个特定距离范围(不大于 3 埃)之内的 Cα 原子。
通过计算不同结构等价位点的个数或计算多个结构的等价位点 Cα 距离的均方根值
作为不同结构间差异性的度量。再根据一般的建树方法,给出几个 结构的 进化关
系。
刚体结构叠合方法需要蛋白质的晶体结构数据的质量要高。事实上,相对于序列而
言,已测定的蛋白质晶体结构很少,许多同源蛋白质的结构并不知道。其次,尽管
同源蛋白质具有相同的折叠结构,它们的二级结构成分则经历形变、相对平移和旋
转使侧链达到优化的包装以适应进化的压力。对于序列相同率为 30%的两个蛋白
质,由刚体叠合所确定的拓扑等残基的均方根差大约为 1.5 埃,而且残基数可能只
占全部残基数的 1/3。它可能不足以进行结构比较。因此需要发展一种更灵活的确
定拓扑等价位点的方法,并且要把二级结构成分的相对运动和变形也考虑进去。
2.多特征结构比较
多特征结构比较以及构建“类结构”进化树的原理与基于残基匹配记分方法(常用
PAM250 矩阵)进行多序列比较和构建序列进化树的原理相同。包括以下步骤:
(1)动态规划配准和结构匹配;(2 )多个结构的多特征比较;(3)多特征结构
比较的距离量度;(4)绘制进化树图。
3.相关软件
Phylip
PHYLIP 是一个包含了大约 30 个程序的软件包,这些程序基本上囊括了系统发育
的所有方面。PHYLIP 是免费软件,并且可以在很多平台上运行(Mac, DOS, Unix,
VAX/VMS, 及其它)。PHYLIP 目前已经是最广泛使用的系统发育程序。
PAUP
开发 PAUP 的目的是为系统发育分析提供一个简单的,带有菜单界面的,与平台
无关的,拥有多种功能(包括进化树图)的程序。PAUP 3.0 只建立于 MP 相关的
进化树及其分析功能;而 PAUP 4.0 已经可以针对核苷酸数据进行与距离方法和
ML 方法相关的分析功能,以及其它一些特色。
除 了 PAUP 和 PHYLIP 以 外 , 还 有 其 它 一 些 系 统 发 育 程 序 , 这 些 程 序 包 括
FastDNAml, MACCLADE, MEGA plus METREE, MOLPHY 和 PAML。
PHYLOGENETIC RESOURCES
http://www.ucmp.berkeley.edu/subway/phylogen.html
PHYLOGENY PROGRAMS
http://evolution.genetics.washington.edu/phylip/software.html
PHYLOGENETIC ANALYSIS COMPUTER PROGRAMS
http://phylogeny.arizona.edu/tree/programs/programs.html
BIOCATALOG MOLECULAR EVOLUTION
http://www.ebi.ac.uk:/biocat/phylogeny.html
PHYLIP http://evolution.genetics.washington.edu/phylip.html
|
|