- 1、本文档共53页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【2017年整理】PAML 中文说明
PAML: 最大似然法分析系统发育Phylogenetic Analysis by Maximum Likelyhood版本:4.3(2009年9月)Ziheng Yang马向辉翻译1、概述PAML (for Phylogenetic Analysis by Maximum Likelihood) 是一个用最大似然法分析蛋白质或DNA序列系统发育的一个程序包。1.1 PAML 文件:除了这个手册以外,以下资源也需要注意:PAML网站: HYPERLINK http://abacus.gene.ucl.ac.uk/software/PAML.html http://abacus.gene.ucl.ac.uk/software/PAML.html。在这个网站上有PAML的下载以及编译程序;PAML FAQ页面: HYPERLINK http://abacus.gene.ucl.ac.uk/software/pamlFAQs.pdf http://abacus.gene.ucl.ac.uk/software/pamlFAQs.pdf;PAML讨论群: HYPERLINK /phpBB2/ /phpBB2/,在这里你可以提出你的问题,或者提出你发现的漏洞。1.2 PAML 可以做些什么?PAML 的最新版本包含一下几个程序模块:baseml, basemlg, codeml, evolver, pamp, yn00, mcmctree, 以及 chi2。其中最常用的模块的介绍可以参考杨子恒教授2007年发表的文章。模块运行中用到的计算、统计方法在杨子恒教授的书中有详细的介绍。模块的主要作用包括:计算以及检测系统发育树(baseml 和 codeml); 计算复杂的碱基替代或者氨基酸替代模型中的参数,如不同位点间不同速率的模型或多个基因或者位点的综合分析模型(baseml和codeml); 用似然比例检测比较几个模型(baseml,codeml以及chi2); 用全局分子钟或者局部分子钟估算分歧时间(baseml和codeml); 用最大似然法重建祖先氨基酸、核苷酸序列以及密码子模型(baseml和codeml); 用蒙特卡洛模拟生成氨基酸、密码子或者核酸序列(evolver); 估算同义替代、非同义替代的速率,检测DNA的蛋白编码区的正选择(yn00和codeml); 综合贝叶斯法以及化石校正估算物种分歧时间(mcmctree)。PAML的优势在于它整合了各种复杂的替代模型。在baseml和codeml中建树的算法相对简单,所以较少的物种(如10个)可以用这两个软件分析,对于大量物种的建树分析,最好还是用其他的程序去分析树结构,例如phylip、paup或者myBayes。当然,你可以用其他的软件构树,然后作为用户树用baseml或codeml验证。baseml 和 codeml:baseml程序用于最大似然法分析核苷酸序列; codeml程序则是由两个旧程序组合而成:codonml和aaml。其中前者是基于Goldman和Yang在1994年提出的编码蛋白质的核酸序列的密码子替代模型,而后者主要用于氨基酸序列的替代模型。现在,这两种序列可以在codeml.ctl中通过seqtype定义,其中1表示密码子序列,2表示氨基酸序列。在这个手册里面,我将使用codonml和aaml来分别表示codeml中的seqtype=1和seqtype=2。这三个程序(baseml,codonml和aaml用相同的最大似然算法对于模型进行拟合,而三者之间主要的不同点在于,三个程序中对于序列进化的马尔科夫模型中“位点”的定义:在baseml中一个位点表示一个核苷酸,在codonml中一个位点表示一个密码子,aaml中一个位点表示一个氨基酸。马尔科夫过程模型常常用于描述核苷酸、氨基酸序列之间或者密码子之间的替代。对于不同的位点,这种替代既可以是恒定的,也可以是可变的。evolver:这个程序可以在特定的核苷酸、氨基酸、密码子替代模型下模拟序列的产生。它还可以用于其他的一些操作,如产生随机树、计算树间的距离。basemlg:这个程序主要用于执行Yang 在1993年提出的gamma模型的运算。在计算6或7个物种以上的数据时,这段程序运算非常的慢,而且较难执行。而baseml程序中的不连续的gamma模型则可以弥补这一不足。mcmctree:这个程序用于计算物种的分歧时间,使用的模型是Yang 和 Rannala在2006和2007年提出的。pamp:这个程序用于执行Yang和Kumar在1996年提出的简约分析。yn00:这段程序用于计算蛋白质编码的DNA的同义突变和非同义突变的速率,运算主要基于2000年Yang和Nielsen提出的方法。chi2:用于似
您可能关注的文档
- 【2017年整理】E7悬挂器投球下落时间计算方法探讨.doc
- 【2017年整理】ECE内部培训资料.doc
- 【2017年整理】EDSS神经功能状况评估.doc
- 【2017年整理】em菌发酵鸡粪猪粪牛粪养殖蝇蛆技术.doc
- 【2017年整理】Epstein-Barr病毒感染及其相关皮肤病.doc
- 【2017年整理】Eukxteo医学影像学知识点.doc
- 【2017年整理】excel表信息统计说明.doc
- 【2017年整理】FIB-Clauss标准操作流程.doc
- 【2017年整理】Flash项目实践(第三版)教学大纲.doc
- 【2017年整理】fname=大学语文结课论文.doc
- 2024-2025学年天津部分区高三第二次阶段性素质测试生物试题含解析.doc
- 2024-2025学年太原师院附中高考预测卷(全国I卷)英语试题试卷含解析.doc
- 2024-2025学年太原市重点中学高三下学期第二次月考生物试题[理]试题含解析.doc
- 2024-2025学年四川省自贡市旭川中学高三第一次联合模拟考试英语试题含解析.doc
- 2024-2025学年四川省成都市第七中学高三适应性月考(六)英语试题试卷含解析.doc
- 2024-2025学年四川省眉山实验高级中学高三第二学期入学检测试题试卷英语试题含解析.doc
- 2024-2025学年四川省眉山市彭山区高中毕业班综合测试(二)生物试题含解析.doc
- 2024-2025学年四川省绵阳南山实验高中高三下学期期中考试生物试题(B)含解析.doc
- 2024-2025学年沈阳外国语学校高考英语试题1-4月复习专号含解析.doc
- 2024-2025学年四川省雅安中学高考模拟金典卷生物试题(三)试题含解析.doc
文档评论(0)