MEGA5 Molecular Evolutionary Genetics Analysis 分子进化遗传学分析.pdfVIP

  • 1416
  • 0
  • 约3.33千字
  • 约 12页
  • 2019-03-03 发布于辽宁
  • 举报

MEGA5 Molecular Evolutionary Genetics Analysis 分子进化遗传学分析.pdf

MEGA5: Molecular Evolutionary Genetics Analysis 西北农林科技大学生物信息学中心 Maoyuanhui@163.com 1.序列格式 序列格式指的是序列存储是所遵循的规范。生物信息学常见的用于进化分析 的序列格式有: FASTA, PAUP, PHYLIP, GCG, PIR 等。其中前三种最为常用。 FASTA 格式 (文件名一般用fa, fasta, fas 等后缀名标示): 序列名称 序列 PAUP 格式(文件名一般用nexus, nex 等标示): 其中ntax 指明了五种的数量, nchar 表示比对后序列的长度,missin 指的是 如果序列中存在位置位点,用?表示,symbols (本行可以没有)指的是序列 中包含的字符,interleave 表示序列是否换行,如果写成interleave=no 则表 示每个物种的序列都只占一行而不换行。 Datatype 表示序列的类型,gap 表 示序列中插入缺失位点用‘- ’表示。整个文件末尾以分号(”;” )结束。 PHYLIP 格式(后缀名一遍用phy 标示) 第一行指明物种数量和序列长度,序列可分行或者不分行输出。需要注意的 是PHYLIP 格式物种名不能超过十个字符,超出部分将被自动舍弃。 2.使用MEGA 进行进化分析 进化分析的核心观念是:决定结果好坏的不是软件或者分析使用的方法,而 是序列的质量。 1) 准备数据 从数据库上下载一组同源序列,要求序列长度(核酸)在500-1500 之间, 物种数目在10-20 之间,比对后序列插入缺失比例不超过20% 。把数据保 存为FASTA 格式。 MEGA 可以识别多种序列格式。其中如果是没有比对的序列,最好使用 FASTA 格式。如果是必读后的序列,可以使用 PHYLIP 或者 FASTA,MEGA 会自动转换序列格式。 另外需要说明的是MEGA 分析需要的序列格式是MAS 或者MEG,其他的 格式会提示自动转换。 2 ) 序列比对 (如果是已经比对好的序列可跳过次步骤) 点击Align-Edit/Build a Alignment,出现对话框有三个选项,如果你手头 有比对好的mas 格式的文件,选择第二个选项,Open a saved alignment session,否则,选择1 (创建新的比对)或3 (从文件输入序列)。 这里我们先选择第一个选项,点击OK 。然后出现对话框,询问你的序列类 型,如果是核酸序列,点击 DNA,如果是蛋白质序列,选择 Protein,如 果不输入序列,选择Cancel 。 选择 DNA, 出现新窗口 Alignment Explorer, 点主菜单 Data-open-retrieve sequences from file 。 选择你的序列文件,点打开,文件中的序列出现在窗口中 点击Edit-Select All 选中所有序列,然后点击Alignment ,可以选择Align by ClustalW 或者Align by Muscle 。 选择中会弹出如下对话框 比对参数设置和ClustalW 设置类似。 点击OK 后,得到比对结果。 此时可以通过File-Save 保存比对结果。 3 ) 构建进化树 点击主菜单File-Open a File/session,选择刚保存的mas 文件.主窗口出现 所选择文件的图标。 确定最佳的构树模型 构树模型指的是构建进化树时,我们使用的核苷酸(氨基酸)替换模型。 常见的替换模型有: 单参数替换模型:该模型不区分替换类型(例如A-T 的替换和A-G 的替 换将被视为同一种替换),基

文档评论(0)

1亿VIP精品文档

相关文档