- 0
- 0
- 约5.39千字
- 约 3页
- 2017-07-09 发布于河南
- 举报
统计学在分子进化领域应用
统计学在分子进化领域的应用
生命科学学院万俊男
分子进化是一门在进几十年才快速发展起来的生物学领域。产生这样的迅猛发展,得力于PCR、DNA测序等生化技术的发展,除此之外的另一个重要原因就是数据分析的统计方法以及计算机技术的发展。
分子进化研究不同于生物学其他领域的一点在于,一项系统的研究往往需要海量的数据作支持,如何从庞大的蛋白质或DNA序列中获取想要的生物学信息,这就需要统计与数据分析来为分子进化的研究打开一扇大门。
我就从一篇我看过的文献来谈谈我对统计学在分子进化领域的应用的看法。
Ziheng Yang and Rasmus Nielsen. 200. Codon-Substitution Models for Detecting Molecular Adaptation at Individual Sites Along Speci?c Lineages. Molecular Biology and Evolution. 19:908–917.
在分子进化中,非同义替代与同义替代的比(ω = dN / dS )可以反映DNA是否受到达尔文正选择。如果有ω1,则可以认为该DNA的变异受到明显的正选择。但由于正选择往往只发生在几个特定的位点,正选择的作用会被其他位点的随机替换掩盖,一般都很难得到ω1的结果。这篇文章综合了以往用来分析正选择作用的分支特异模型(Branch-speci?c models)和位点特异模型(Site-speci?c models)的优缺点,建立了一种新的分支-位点模型(Branch-site models)。之后通过三个具体的例子,比较了三种模型的分析结果。
在新的模型中,被考察的进化支被定义为前景支(the ‘‘foreground’’ branches),而进化树中其他的支被定义为背景支(the ‘‘background’’ branches)。新模型就是希望通过扣除背景支的影响,单独考察我们所感兴趣的进化支受正选择的情况。
于是,不同位点的受选择情况就被划分为了四种(见Table 1):Class 0代表前景支与背景支中都高度保守的位点(ω0=0或ω01),Class 1代表前景支与背景支中都处于中性或受到弱选择的位点(ω1=1或ω1略小于1),Class 2和Class 3则分表表示背景支为ω0或ω1,而前景支受到正选择的位点(ω21)。其中,Class 2和Class 3在整个DNA序列中的比例,可以由Class 0和Class 1的比例估计。
在此基础上,就可以对得到的若干序列进行统计分析。由某一位点替代情况的观测数据集对应的条件概率,可以推断出该位点的非条件概率,并由此得到整个DNA序列的对数似然估计值l,这个值是之后对统计模型进行比较以及检验ω与1的关系的重要参数(2Δl服从分布,用来检验差异的显著性)。而之后就可以用贝叶斯公式计算某一位点情况的后验概率,以考察前景支那些位点是上面提到的Class 2和Class 3的情况,以确定具体受到正选择的位点。
以上就是新的分支-位点模型的基本思想。之后,作者选取了灵长类中的溶菌酶基因,灵长类中的肿瘤抑制基因BRCA1以及被子植物中的植物色素基因家族来比较三种模型的效率。在比较模型间的是否有明显差别时,计算出两模型的2Δl,然后计算分布的尾区概率P,看某种模型是否明显优于另一种。以Table 2(最后一排的最后一个数据应该为=3.383)中的M0的one-ratio模型与分支模型的two-ratios模型间的比较为例(H0为两模型无差异),计算得2Δl =2×2.13=4.26,查分布表(df=1)可得P=0.0390.05,拒绝H0,因此可以下结论,认为two-ratios模型显著优于one-ratio模型。
而在计算的ω1后,也不能直接下结论认为有正选择作用,而需要检验该ω是否显著大于1。用到的方法就是再建立一个ω固定为1的模型,比较我们感兴趣的模型与假设的模型是否有显著差异,与上面的检验方法相同,还是对2Δl进行检验。以Table 2中的two-ratios模型得到的=3.383为例,计算得2Δl =2×1.33=2.66,P=0.100.05(df=1),接受H0,认为与1无显著差异,无法认定有正选择作用的存在。可见,即使得到了ω1,也无法直接判断有正选择,而应该进行进一步的统计检验。
运用以上的方法,作者比较了三个例子中,三种模型的效率。结果显示,新的分支-位点模型,能够很好的清除背景的干扰,发现正选择的存在;并可以进一步通过计算相应位点的后验概率,确定正选择的作用位点。尤其是仅有极少的位点受到强的正选择时,其它两种模型都无法检测出正选择的效应,而分支-位点模型则可以很清晰的反映出那些位点受到了强的正选择作
您可能关注的文档
- STM32之外部中断EXTI.doc
- STM32串口中断接收方式详细比较.doc
- 模块五1 Great Scientists warming up and reading:八(34张PPT).ppt
- 模拟线与其图形符号通用技术条件.ppt
- 歌声中党史(148张幻灯片 90周年 2011年6月28日党课).ppt
- 正压式空气呼吸器工作原理与防护.ppt
- 正确版对甲苯磺酸合成与表征.ppt
- 步进电机 28BYJ-48介绍和驱动与c编程.doc
- 武汉市2011年初三元月调考_英语试题与答案.doc
- 毕业论文撰写内容与要求.doc
- CMS实验中双光子末态探寻低质量共振态的研究.docx
- 面向WCDMA HSUPA的多用户多业务调度算法:优化与创新.docx
- 天普洛安在肺组织保护中的应用与机制研究:从基础到临床.docx
- 锁相环中新型全差分CMOS电荷泵的创新设计与性能优化研究.docx
- 白龙江中上游种子植物区系地理特征与生态适应性研究.docx
- 基于报告基因稳定转化BmN细胞的BmNPV滴度精准测定方法构建与验证.docx
- 基于DSA的新型硅片缺陷检测系统:构建、应用与效能提升.docx
- 1,2,3-三芳基萘、苯甲酸酯衍生物及噻螨酮关键中间体合成工艺与优化研究.docx
- 基于MFGS方法的图像最佳分割数精准确定研究.docx
- 制造型企业库存优化:策略、实践与突破路径.docx
最近下载
- 2026届新高考物理冲刺复习:电磁感应中的双杆专题.pptx VIP
- 2025成都中考数学真题及答案解析.docx VIP
- 渔业作业安全手册.pptx
- 广西钦州市2025-2026高二上学期期末教学质量检测化学试卷.pdf VIP
- 风险分级评价方法(LEC LS)课件.pptx VIP
- TSLEA 1011.2-2024 实验室设计与建设技术规范 第2部分:化学实验室.pdf
- 2025年留置看护警务辅助人员招聘综合基础知识题库.docx
- 骨科护理MDT查房.pptx VIP
- 城乡内部空间结构(第1课时)示范公开课教学课件【鲁教版高中地理必修第二册(新课标)】.pptx VIP
- 2025年成都市中考数学试题卷(含标准答案及详解).pdf
原创力文档

文档评论(0)