PartitionFinder2筛选系统发育分析分隔模型.PDFVIP

PartitionFinder2筛选系统发育分析分隔模型.PDF

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PartitionFinder2筛选系统发育分析分隔模型

⽤PartitionFinder2 筛选系统发育分析分隔模型 张⾦龙 嘉道理农场暨植物园植物保育部 jinlongzhang01@ 核苷酸序列在不同位点有不同的突变速率。核苷酸序列又分为编码基因和⾮编码基 因。编码基因中,密码⼦第⼀第⼆位往往较为稳定,第三位往往变异速率较⾼。⾮编码基 因因为受到的选择压⼒⼀般较⼩,所以往往可保留更多突变。不同基因以及不同位点的 突变速率不同,可能对所推断进化树的稳定性有很⼤影响。所以,在多基因建⽴进化树过 程中,设置分隔模型就显得很重要。但是分隔模型怎样设置才算合理呢?在 PartitionFinder软件研发之前,研究⼈员⼀般通过将不同基因分开,例如 gene1 、gene2、 gene3 ,再将每个基因的不同位点分开如 gene1_1 、gene1_2、gene1_3作为分隔模型,以 提⾼进化树的稳健性。 RAxML 、MrBayes、BEAST等常⽤系统发育软件都⽀持分隔模型,但并不能帮忙确 定最优化的分隔模型设定⽅案。设置的分隔模型过多,则拟合的参数会过多,造成结果 不准确。设置的分隔模型过少,不设置分隔模型,设置的不合理,也会造成进化树不准 确。很多学者已经意识到这个问题,但是⼀直苦于没有很好的应对⽅法。 模型选择中的简约理论认为,⾚迟信息量AIC或者BIC最⼩的模型是最优的模型。AIC 结合模型的精度以及所要估计的参数数量。如果精度已经到达⼀定程度,进⼀步增加模 型的参数已经不能再显著提⾼似然值Likelihood的情况下,可以认为已经找到了最优模 型。但是这就要对每⼀种分隔模型所得的结果计算Likelihood ,并进⾏参数估计⼏乎是不 可能的。⾸先,对碱基⽐对矩阵计算Likelihood是⼗分耗费时间的。其次,分隔模型的各 种组合的数量呈⼏何级数增长,如果通过⼏个基因建树,则可能的分隔模型的数量已经 超出了⼤部分计算机的计算能⼒。此时就需要引⼊分隔模型的启发式搜索 Heuristic Search。 PartitionFinder 的作者们从理论上解决了以上的问题,并通过Python语⾔实现了相应 的算法 ( Lanfear et al., 2012) 。在该研究中,作者进⼀步证明, PartitionFinder所得的分隔 模型⽐之前的简单处理更加合理。不仅如此, PartitionFinder在获得最优化分隔⽅案后, Page 1 of 13 同时会给出每个分隔模块所对应的最优进化模型,所以Modeltest、jModeltest 以及ProtTest 等软件都已经被PartitionFinder所超越。事实上, 2012年, Lanfear介绍PartitionFinder的论 ⽂发表后,在google scholar上已经被引⽤了1748次(截⾄2017年4⽉7 ⽇) 。本⽂简述 PartitionFinder的安装和使⽤。 1. PartitionFinder下载和安装 1.1 PartitionFinder下载 PartitionFinder的下载⽹址/partitionfinder/ ,⽤WinRAR或者 7zip解压缩。 图1 PartitionFinder的结构 其中docs为说明⽂档 \Examples为⽰例⽂件,包含DNA序列,形态以及蛋⽩质三个例⼦ \partfinder⽂件夹为 python脚本 \Programs ⽂件夹下为phyml可执⾏⽂件,⽤来计算likelihood \Submodules ⽂件夹为下有raxml⽂件夹,但是该⽂件夹为空。作者并未交代这个⽂件夹 的内容。 \tests 为作者开发时的测试⽂件 PartitionFinder.py 为检测DNA序列的Python脚本 PartitionFinderMorphology.py 为检测形态数据的Python脚本 PartitionFinderProtein.py 为检测氨基酸序列的Python脚本。 Page 2 of 13 三个脚本根据不同的数据类型分别调⽤,不能混⽤。 1.2. 运⾏平台Anaconda的安装 Partition Finder是⽤Pyt

文档评论(0)

tangtianbao1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档