找回密码
 注册
查看: 5068|回复: 3

新一代转录组数据处理与网络集成分析的理论与方法

[复制链接]
发表于 2011-8-22 17:17:26 | 显示全部楼层 |阅读模式
新一代转录组数据处理与网络集成分析的理论与方法
在生物分子调控系统中,编码和非编码基因的转录是一个关键的环节,存储在基因组中的遗传信息、表观遗传学的调控作用,都是通过转录过程发挥作用。转录组学就是对转录的整体研究。本课题重点围绕转录组开展对新一代测序数据处理与分析的研究,并研究在转录组基础上整合多种数据构建调控网络,以及对网络功能进行定量分析的理论与方法,将在选择性剪接基因表达的新概念和计算方法、宏转录组的功能分析方法和复杂调控网络的定量功能描述等方面开展创新性的探索。
对转录组测序数据研究的基础是RNA-Seq数据读段回帖、基因表达模式推断和表达量估计。由于人类基因大量存在剪接和选择性剪接,RNA-Seq数据回帖比基因组测序数据回帖更具有挑战性。本课题拟结合转录本特点的动态哈希表技术,实现外显子跨越读段的快速回帖,基于隐马尔科夫模型等方法推断选择性剪接基因的表达模式,建立考虑读段分布特点的基因和选择性剪接等位型表达量估计方法。同时,根据对当前测序技术数据产生模型的认识,建立各种剪接模式及其组合下测序数据的正演模型,通过算法反演剪接模式及其表达量,系统研究现有测序技术下的不可分辨组合,并通过模型研究完全区分各种组合对测序数据的要求,为第二代测序的实验优化和第三代测序的发展指出方向。
对微生物群落的宏基因组和宏转录组测序是新一代测序应用的一个重要发展方向,研究生物体携带的微生物群落与宿主生理病理表型之间的联系,是系统生物学研究的一个崭新方向。宏基因组和转录组测序数据处理与单一物种测序数据处理有很多共同的任务,可以采用本项目研究的各种数据处理方法,但更有自己独特的特点。将针对宏基因组和转录组数据,我们将研究不依赖序列比对的读段序列分析方法,通过统计k字词的出现频率,用模式识别方法对宏基因组/转录组进行分析。进一步,重点研究宏转录组数据中跨物种的基因转录本识别和局部拼接,通过比较不同样本的宏转录组表达谱,选择特征,实现对微生物群落功能的分类,探索宏转录组表达谱与宿主状态之间的联系。
基因的转录受到转录因子和多种表观遗传学因素的调控,而转录后又通过其蛋白质或RNA产物参与对其他基因的调控,或者与其他蛋白质发生相互作用,构成了复杂的转录调控网络。对高等真核生物,调控网络中还包含了复杂的、人们目前尚了解很少的剪接调控网络。本课题拟研究整合RNA-seq、ChIP-seq、CLIP-seq等测序数据以及基因芯片、序列模体分析等数据构建转录和剪接调控网络的方法,发展描述存在多元调控关系的生物网络的数学方法,通过监督学习、非监督学习和半监督学习方法对网络进行功能分解。从功能角度和遗传稳定性角度探索定量描述网络或模块的整体功能性质的统计量,尝试发展定量描述网络整体功能的生物信息学理论与方法,以癌症疾病等为例探索网络功能指标与疾病表型的关联。

回复

使用道具 举报

发表于 2011-11-11 00:31:58 | 显示全部楼层
是否可推荐几篇这方面的文章?多谢
回复 支持 反对

使用道具 举报

发表于 2013-1-8 10:00:33 | 显示全部楼层
可以推荐一些好的一些文章给大家学习学习吗?谢谢!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|生物统计家园 网站价格

GMT+8, 2024-11-21 21:35 , Processed in 0.024465 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表