- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PartitionFinder2筛选系统发育分析分隔模型
⽤PartitionFinder2 筛选系统发育分析分隔模型
张⾦龙
嘉道理农场暨植物园植物保育部
jinlongzhang01@
核苷酸序列在不同位点有不同的突变速率。核苷酸序列又分为编码基因和⾮编码基
因。编码基因中,密码⼦第⼀第⼆位往往较为稳定,第三位往往变异速率较⾼。⾮编码基
因因为受到的选择压⼒⼀般较⼩,所以往往可保留更多突变。不同基因以及不同位点的
突变速率不同,可能对所推断进化树的稳定性有很⼤影响。所以,在多基因建⽴进化树过
程中,设置分隔模型就显得很重要。但是分隔模型怎样设置才算合理呢?在
PartitionFinder软件研发之前,研究⼈员⼀般通过将不同基因分开,例如 gene1 、gene2、
gene3 ,再将每个基因的不同位点分开如 gene1_1 、gene1_2、gene1_3作为分隔模型,以
提⾼进化树的稳健性。
RAxML 、MrBayes、BEAST等常⽤系统发育软件都⽀持分隔模型,但并不能帮忙确
定最优化的分隔模型设定⽅案。设置的分隔模型过多,则拟合的参数会过多,造成结果
不准确。设置的分隔模型过少,不设置分隔模型,设置的不合理,也会造成进化树不准
确。很多学者已经意识到这个问题,但是⼀直苦于没有很好的应对⽅法。
模型选择中的简约理论认为,⾚迟信息量AIC或者BIC最⼩的模型是最优的模型。AIC
结合模型的精度以及所要估计的参数数量。如果精度已经到达⼀定程度,进⼀步增加模
型的参数已经不能再显著提⾼似然值Likelihood的情况下,可以认为已经找到了最优模
型。但是这就要对每⼀种分隔模型所得的结果计算Likelihood ,并进⾏参数估计⼏乎是不
可能的。⾸先,对碱基⽐对矩阵计算Likelihood是⼗分耗费时间的。其次,分隔模型的各
种组合的数量呈⼏何级数增长,如果通过⼏个基因建树,则可能的分隔模型的数量已经
超出了⼤部分计算机的计算能⼒。此时就需要引⼊分隔模型的启发式搜索 Heuristic
Search。
PartitionFinder 的作者们从理论上解决了以上的问题,并通过Python语⾔实现了相应
的算法 ( Lanfear et al., 2012) 。在该研究中,作者进⼀步证明, PartitionFinder所得的分隔
模型⽐之前的简单处理更加合理。不仅如此, PartitionFinder在获得最优化分隔⽅案后,
Page 1 of 13
同时会给出每个分隔模块所对应的最优进化模型,所以Modeltest、jModeltest 以及ProtTest
等软件都已经被PartitionFinder所超越。事实上, 2012年, Lanfear介绍PartitionFinder的论
⽂发表后,在google scholar上已经被引⽤了1748次(截⾄2017年4⽉7 ⽇) 。本⽂简述
PartitionFinder的安装和使⽤。
1. PartitionFinder下载和安装
1.1 PartitionFinder下载
PartitionFinder的下载⽹址/partitionfinder/ ,⽤WinRAR或者
7zip解压缩。
图1 PartitionFinder的结构
其中docs为说明⽂档
\Examples为⽰例⽂件,包含DNA序列,形态以及蛋⽩质三个例⼦
\partfinder⽂件夹为 python脚本
\Programs ⽂件夹下为phyml可执⾏⽂件,⽤来计算likelihood
\Submodules ⽂件夹为下有raxml⽂件夹,但是该⽂件夹为空。作者并未交代这个⽂件夹
的内容。
\tests 为作者开发时的测试⽂件
PartitionFinder.py 为检测DNA序列的Python脚本
PartitionFinderMorphology.py 为检测形态数据的Python脚本
PartitionFinderProtein.py 为检测氨基酸序列的Python脚本。
Page 2 of 13
三个脚本根据不同的数据类型分别调⽤,不能混⽤。
1.2. 运⾏平台Anaconda的安装
Partition Finder是⽤Pyt
您可能关注的文档
- CKJ5系列低压真空接触器.PDF
- Cox模型多因子共线性处理方法的进一步研究.PDF
- CN补充的用户手册.PDF
- CIAMGroupLimited事安集团有限公司.PDF
- CodianMCU多久再试一连接,如果终端忙碌或不回答.PDF
- DAE阳离子淀粉生产应用试验.PDF
- DMX512无线接收器WR-512.PDF
- dh基因在毕赤酵母中的表达及溶血活性检测.PDF
- DM5680高清视频无线实时传输芯片.PDF
- DTSU6606型三相四线电子式电能表(导轨、液晶、红外、.PDF
- 初中生物:家乡特色美食中的植物资源利用研究论文.docx
- 高中生社团活动对学生领导力培养的实证分析论文.docx
- 光催化材料制备工艺的初中化学实验课创新教学研究论文.docx
- 古诗词教学在高中语文课堂中的文化传承与创新教育实践论文.docx
- 小学科学课堂中论证式教学与科学探究能力培养的互动研究论文.docx
- 高中生物:新型海水淡化膜材料在生物工程中的应用前景论文.docx
- 小学生图书馆图书更新对阅读兴趣的影响研究论文.docx
- 初中生艺术展览体验对审美能力的影响研究论文.docx
- 高中物理实验教学中的问题解决能力培养与实践论文.docx
- 高中环境教育实践:校园垃圾分类实施效果与可持续发展教育理念探讨论文.docx
最近下载
- 综合管廊机电施工方案(总包安装分).docx
- 精品解析:重庆市开州区2023-2024学年七年级下学期期末质量监测历史试题(原卷版).docx VIP
- 实验6二阶电路响应的仿真.pdf VIP
- 青岛版八年级数学下册知识点归纳总结.pdf VIP
- 老码头拆除方案.doc VIP
- 一阶rc电路的暂态响应实验报告.doc VIP
- 2025广东广州市教育系统招聘公办中小学体育教练员18人笔试模拟试题及答案解析.docx VIP
- 2023-2024学年安徽省合肥市高新区八年级(下)期末物理试卷+答案解析.pdf VIP
- 跨学科融合:博物馆地理研学课程设计方案.docx VIP
- 财务比率公式汇总.doc VIP
文档评论(0)