找回密码
 注册
查看: 4508|回复: 2

基于新一代测序数据的统计遗传学新理论、方法与应用

[复制链接]
发表于 2011-8-22 17:17:50 | 显示全部楼层 |阅读模式
基于新一代测序数据的统计遗传学新理论、方法与应用
研究遗传信息作用的一个重要途径是通过群体样本数据用统计遗传学手段寻找遗传规律,如果说从细胞和分子入手探索生物系统机理是从底向上的方法,那么统计遗传学可以看作是从顶向下的方法。二者各有优势、相辅相成。从孟德尔遗传定律,到摩尔根发现基因遗传连锁、重组规律,很多生物学原理都是通过这种从顶向下的方法发现的。近年来,随着基因芯片等高通量技术的发展,统计遗传学取得了很大进展。新一代测序对统计遗传学带来了很多新的问题和机遇,本课题将对其中的基本理论和方法进行研究,并应用于对癌症尤其是肺癌的研究,预期可在混合样本统计检验的理论和对癌症分子标志物的研究等方面取得创新性成果。
基于新一代测序进行统计遗传学研究,首先要发展从测序数据有效、准确地检测各类多态性信号的方法和软件。本课题拟结合测序数据误差模型,以贝叶斯模型为基础,发展准确鉴定基因组序列中的碱基突变、小片断缺失/插入和拷贝数变化的方法;研究外显子捕获测序和酶切测序中影响序列捕获效率和酶切效率的因素,建立统计回归模型进行校正;针对混合样本基因组或外显子测序,发展DNA序列变异识别方法尤其是稀有变异的识别方法,以及混合样本RNA测序中剪接变异的识别方法;研究新一代测序数据中对基因型缺失数据的估计策略,以及从群体全基因组数据中准确检测近期正选择突变的方法。
混合样本测序是在有限成本下进行大规模群体遗传学研究的有效途径,但关于混合样本测序对统计检测功效的影响和如何优化混合样本测序方案,尚没有很好的理论。我们将研究建立混合样本基因组、外显子组和RNA测序实验优化设计的基本理论,根据混合样本测序的性质重建用于基因组、外显子组及RNA测序的分析方法,将统计学中混合数据分析、不完全数据分析、分布拖尾分析的理论和方法应用于混合测序数据的理论模拟与分析之中,研究不同测序深度下测序数据的统计学性质,通过对数据的模拟完善理论和方法研究。
综合运用新一代测序技术和上述研究成果,以对我国人民健康影响极大的非小细胞肺癌(NSCLC)为例进行应用研究,拟通过合作者收集各类NSCLC(包括腺癌、鳞癌、大细胞癌和腺鳞癌)和正常对照样本,建立各类肺癌和正常组织的混合样本池,进行DNA和RNA测序,寻找与肺癌侵袭和转移相关的分子标志物,尤其是可能的新剪接体和miRNA,通过必要的细胞和分子实验验证其生物学功能。同时,通过对肿瘤细胞群体演化的研究,深入分析肿瘤基因组改变发生的模式,筛选转录调控元件上的肿瘤特异性序列变异,探索癌症发生发展的特征。
回复

使用道具 举报

发表于 2014-8-6 08:43:48 | 显示全部楼层
are you translating a paper? I read an article very similiar.
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-12-4 02:01 , Processed in 0.032530 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表