MEGA5 Molecular Evolutionary Genetics Analysis 分子进化遗传学分析.pdfVIP

下载本文档

1416
0
约3.33千字
约 12页
2019-03-03 发布于辽宁
举报

MEGA5 Molecular Evolutionary Genetics Analysis 分子进化遗传学分析.pdf

MEGA5: Molecular Evolutionary Genetics Analysis 西北农林科技大学生物信息学中心 Maoyuanhui@163.com 1．序列格式序列格式指的是序列存储是所遵循的规范。生物信息学常见的用于进化分析的序列格式有： FASTA, PAUP, PHYLIP, GCG, PIR 等。其中前三种最为常用。 FASTA 格式（文件名一般用fa, fasta, fas 等后缀名标示）：序列名称序列 PAUP 格式（文件名一般用nexus, nex 等标示）：其中ntax 指明了五种的数量， nchar 表示比对后序列的长度，missin 指的是如果序列中存在位置位点，用？表示，symbols （本行可以没有）指的是序列中包含的字符，interleave 表示序列是否换行，如果写成interleave=no 则表示每个物种的序列都只占一行而不换行。 Datatype 表示序列的类型，gap 表示序列中插入缺失位点用‘- ’表示。整个文件末尾以分号（”;” ）结束。 PHYLIP 格式（后缀名一遍用phy 标示）第一行指明物种数量和序列长度，序列可分行或者不分行输出。需要注意的是PHYLIP 格式物种名不能超过十个字符，超出部分将被自动舍弃。 2．使用MEGA 进行进化分析进化分析的核心观念是：决定结果好坏的不是软件或者分析使用的方法，而是序列的质量。 1）准备数据从数据库上下载一组同源序列，要求序列长度（核酸）在500-1500 之间，物种数目在10-20 之间，比对后序列插入缺失比例不超过20% 。把数据保存为FASTA 格式。 MEGA 可以识别多种序列格式。其中如果是没有比对的序列，最好使用 FASTA 格式。如果是必读后的序列，可以使用 PHYLIP 或者 FASTA，MEGA 会自动转换序列格式。另外需要说明的是MEGA 分析需要的序列格式是MAS 或者MEG，其他的格式会提示自动转换。 2 ）序列比对（如果是已经比对好的序列可跳过次步骤）点击Align-Edit/Build a Alignment，出现对话框有三个选项，如果你手头有比对好的mas 格式的文件，选择第二个选项，Open a saved alignment session，否则，选择1 （创建新的比对）或3 （从文件输入序列）。这里我们先选择第一个选项,点击OK 。然后出现对话框，询问你的序列类型，如果是核酸序列，点击 DNA，如果是蛋白质序列，选择 Protein，如果不输入序列，选择Cancel 。选择 DNA, 出现新窗口 Alignment Explorer, 点主菜单 Data-open-retrieve sequences from file 。选择你的序列文件，点打开，文件中的序列出现在窗口中点击Edit-Select All 选中所有序列，然后点击Alignment ，可以选择Align by ClustalW 或者Align by Muscle 。选择中会弹出如下对话框比对参数设置和ClustalW 设置类似。点击OK 后，得到比对结果。此时可以通过File-Save 保存比对结果。 3 ）构建进化树点击主菜单File-Open a File/session，选择刚保存的mas 文件.主窗口出现所选择文件的图标。确定最佳的构树模型构树模型指的是构建进化树时，我们使用的核苷酸（氨基酸）替换模型。常见的替换模型有：单参数替换模型：该模型不区分替换类型（例如A-T 的替换和A-G 的替换将被视为同一种替换），基

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

MEGA5 Molecular Evolutionary Genetics Analysis 分子进化遗传学分析.pdfVIP