第二章核酸数据库及核酸序列的分析(第五构建进化树).ppt

第二章核酸数据库及核酸序列的分析(第五构建进化树).ppt

  1. 1、本文档共147页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章核酸数据库及核酸序列的分析(第五构建进化树)

* * * * * * * * * * * * * * * * * * * * * * * * * * * 随着人类基因组计划的开展,争夺有限基因资源的竞争日益激烈,利用网上软件分析未知序列,迅速得到尽可能多的信息显得尤为重要。仅仅在几年前,网上只零散地分布着一些功能简单的小程序用于新基因的鉴别,现在这些软件有了长足的发展。 目前,在国际上,一些优秀的软件根据功能归类被集中在一个网页上,极大地方便了使用。 http://bioinformatics.weizamann.ac.il/gdp/gdp.html 在国内,很多生物信息学软件来源信息(包括不少免费下载的软件)都可以生物软件网上获得。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 1)、TAXA块 主要是定义所分析的数据(如分子序列)个数,以及这些数据的名称(如物种名称)。 2)、CHARACTERS 块 主要是定义数据矩阵(如多序列比对结果)和其他一些相关的信息(如序列特征值,序列有效区域等) PAUP*的Nexus的文件块 3)、ASSUMPTIONS块 定义了对数据的一些设定,如那些特征值是不需考虑的,怎么处理gap这个特征值等,用户自定义的一些数据也放在这块,如自定义的打分矩阵。 4)、 SETS块 定义了一系列的数据组,如特征值组,物种组等,这些设置都是为了方便后续的分析。 5)、 TREES 块 定义了用户自己设定的树。用于后续的分析,如作为限制树等。 6)、 CODONS 块 定义了遗传密码子的一些信息。如编码的位置(哪些是编码的,密码子的位点等)。 7)、 DISTANCES 块 定义了一些距离矩阵。 8)、PAUP 块 是软件的核心块,所有的分析命令和一些参数设置(90多个命令)都放在这一块。 这一块并不是分析输入数据所必须的,这些命令可以写在这一块(文件中),这时载入文件时就开始根据该块的命令进行分析(有点类似dos的批处理过程)。当然也可以通过键盘命令逐一敲入 ,交互进行分析。 批处理的方式在分析过程比较长,耗时比较久的时候是比较有用的。当然在进行处理之前一定要先保证该批处理过程没有问题。 一个PAUP*的基本分析实例 1)通过clustalw/clustalx获取一个多序列比对结果(可能要经过人工调整,推荐用bioedit做辅助编辑器)。保存成nexus格式的文件,或者用其他格式转换软件转换成nexus格式。paup*中也有一个tonexus命令可以将其他格式(包括phylip,GCG等格式)的文件转换为nexus格式的文件。 2)、在PAUP*程序中读入数据(Nexus格式) 输入命令的地方 打开文件的窗口 程序自带的测试数据 执行该文件还是编辑该文件? 执行文件时将文件数据读入程序,编辑文件则调用一个文本编辑器。如果不是nexus格式,执行时候会出错,然后调用文本编辑器打开。 3)、数据输入完成,开始分析… 两个很有用的命令 ?:显示所有的命令 命令 ?:显示命令的所有参数 分析…(开始一) 1)、开始之前 打开记录文件?(跟踪整个分析过程) 命令:log start file =your_log_file_name; 停止:log stop; 2)、设置数据 哪些用于分析? 如:include coding/only; exclude coding/only; 哪些物种要分析(删除不要的)? 如: delete 1; 或者 delete taxa_name… undelete 1; …… 分析…(开始二) 3)、确定建树方法 最大简约法?最大似然法? 距离法? 命令:Set criterion=parsimony|likelihood|distance; 分析…(建树一) 4)、确定其他参数 Set ?查看其他参数的设置,改为自己所需要的设置。 如:set maxtree=10000 increase=no autoclose=yes; 分析… (建树二) 5)、确定搜索方法(对于距离法不适用) 穷尽法:alltrees 分支跳跃查找:bandb 启发式搜索:hsearch 其他:puzzle(只在likelihood时有效)… 分析… (建树三) 6)、开始搜索树之前(设置各个建树方法的参数) 距离法:dset 如:dset distance=tamnei negbrlen=allow 最大简约法:pset 如 pset collapse=

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档