报告分子进化分析与相关分析软件的应用.ppt

报告分子进化分析与相关分析软件的应用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Phylip软件包的应用 1,根据你的分析数据,选择适当的程序 如,你分析的是DNA数据,就在核酸序列分析类中选择程序(dnapenny,dnapars, dnamove,dnaml,dnamlk, dnainvar,dnadist,dnacomp )如果分析的是离散数据,如突变位点数据,就在离散字符组里面选择程序。 2.选择适当的分析方法 如你分析的是DNA数据,可以选择简约法(DNAPARS),似然法(DNAML, DNAMLK),距离法等(DNADIST)。。。 Phylip软件包的应用 3.进行分析 选择好程序后,执行,读入分析数据,选择适当的参数,进行分析,结果自动保存为outfile,outtree。 Phylip软件包的应用 Outfile是一个记录文件,记录了分析的过程和结果,可以直接用文本编辑器(如写字板)打开。 outtree是分析结果的树文件,可以用phylip提供的绘树程序打开查看,也可以用其他的程序来打开,如treeview Phylip软件包的应用 出发数据-已经排列好的蛋白序列。 重构算法-距离法(protdist.exe) 最大简约法(protpars.exe) 最大似然法(proml.exe) 统计分析-拨靴法(bootstrap) 实际应用(从蛋白序列推导进化树) 实际操作 Phylip软件包中的每个分析程序都是一个独立的应用程序。我们选择好了分析算法后,按一定的顺序组合使用选择的程序,就可以获得按选择的算法分析的结果(进化树)。 例子:从我们刚刚通过clustal比对获得的蛋白序 列推测进化树。 选择方法:距离法(protdist.exe) 第一步:双击执行protdist.exe,根据提示输入分析的 文件名(程序默认是infile)。 第二步:设定各个参数,执行程序,获得距 离矩阵数据输出文件outfile。 第三步:选择通过距离矩阵推测进化树的算法(fitch.exe,kotsch.exe,neighbor.exe)。 第四步:将刚获得的输出文件改名为infile,执行选择的推测算法(neighbor.exe)。设置好参数后执行程序,获得outfile和outtree两个结果输出。 获得的结果文件中,outtree文件是一个树文件,可以用treeview等软件打开。outfile是一个分析结果的输出报告,包括了树和其他一些分析报告,可以用记事本直接打开。 outfile outtree NJ/邻接法 任意两个节点选为相邻序列的总支长计算公式 把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程。 邻居关系法 AB组合出现3次,DE组合出现3次,CD、AC、BC组合各一次,则AB和DE各为两对关系最近的邻居。(关系最近的邻居作为邻居的次数最多),将邻居看成一个新的复合序列,重复这个过程。 UPGMA法 d=e=10/2=5 c=19/2=9.5 g=c-d=9.5-5=4.5 a=b=22/2=11 A B (CDE) A - 22 39.5 B - - 41.5 (CDE) - - - (AB) (CDE) (AB) - 40.5 (CDE) - - f1+a=f2+c=40.5/2=20.25 f1=9.25 , f2=11.75 距离矩阵的改进:将序列相似性转化为距离记分 蛋白质的正规化相似性记分 Sreal:实际的相似性记分值 Srand:背景平均记分值(随机情况下可能的记分值) Sident:该长度下相似性记分的预测值 P=0.007时Srand的值为: 其中,λ、K由打分矩阵给出 对于长度为m和n的序列的排列的预测值Sident为: Sii为匹配记分,Pi为每种氨基酸的比例, n为较短序列的长度 修正后的相似值S表示为: 一旦得到S值,就可以用1-S计算序列的距离,实际中的距离计算则用下面的式子: 最大似然法(ML) 最大似然法(maximum likelihood,ML)最早应用于系统发育分析是在对基因频率数据的分析上,后来基于分子序列的分析中也已经引入了最大似然法的分析方法。 最大似然法分析中,选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率球最大值来估计枝长 。 最大似然法(ML) 最大似然法的建树

文档评论(0)

liuxiaoyu92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档