生物信息学 实验四 用 Clustal, MUSLCE 和 T-Coffee 进行多条序列比对.docxVIP

生物信息学 实验四 用 Clustal, MUSLCE 和 T-Coffee 进行多条序列比对.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学 实验四 用 Clustal, MUSLCE 和 T-Coffee 进行多条序列比对

实验四用 Clustal, MUSLCE 和 T-Coffee 进行多条序列比对准备工作FASTA序列“”之后加上物种和序列名称,然后加空位,方便在多序列比对过程中分清每条序列分别来自哪个物种。1clustalX将上述序列文件用英文命名,且其中无空格,在D盘下建立一个用英文命名的文件夹并将序列文件放在其中。点击开始-程序-clustalX2-clustalX2。点主菜单File-Load Sequence-选择你刚保存的序列文件,点打开设置两条序列、多序列比对及输出格式参数后:Alignment-Alignment Parameters-Pairwise Alignment Parameters;Alilgnment-Alignment Parameters-Multiple Alignment Parameters;Alignment-Output Format Options1.1常规比对点击Aliglnment-Do Complete Alignment。此时出现一个对话框,提示比对结果保存的位置,在上一步选择了多少种输出格式,这里就会给出多少个文件的路径。点OK即可。比对结束后生成的aln文件是多条序列比对的结果,推荐用notepad++打开浏览。*对应的是完全匹配的列,保守替换(理化性质高度相似氨基酸之间的替换)用:表示,有一定保守的替换用.表示,如果下方没有标识,说明这列为非保守替换。生成的dnd文件是比对过程中利用NJ方法生成的进化树(guide tree),可以用Figtree软件浏览。1.2、迭代比对选择Alignment-iteration-iterate each alignment step(或iterate final alignment),然后再点击Aliglnment-Do Complete Alignment进行比对。其生成的aln文件与常规比对的一致,但NJ树不一致,迭代比对NJ树的8、9单独聚为一个分枝,而常规比对8、9与a、b聚在一枝。2、Clustal Omega2.1 网页版比对将保存的序列copy到STEP1下的文本框中,通过STEP2设置参数,最后Submit。点击Phylogenetic Tree,查看网页版的NJ树2.2 单机版比对result.txt,用npp打开3 Muscle alignment result点击开始-运行-输入 CMD-打开 DOS 窗口-输入d: 到达D盘,然后输入cd d:\ruanjian\muscle到达 MUSCLE 所在文件夹。输入muscle.exe -in human_globins.fasta -out output.txt –clw命令,输出human_globins的多序列比对结果。然后再对MAPK蛋白序列的进行多重比对,输入的命令为muscle.exe -in wjr.txt -out outputwjr.txt –clw注:(新建一个muscle文件夹,将muscle(名称改为muscle)软件,human_globins序列和MAPK的蛋白质序列(wjr)放在一起)按下图命令进入muscle文件夹。按下图命令对human_globins序列进行多重比对。按下图命令对MAPK蛋白序列进行多重比对。MAPK蛋白序列输出如下图:共找到25个保守位点,26个保守替换位点保守位点氨基酸依次为:GVAKE LLHRD LKNLD FLTYP EDWGP4 T-coffee alignment resultMAPK的蛋白序列用T-coffee多重比对结果如下图:共找到27个保守位点, 30个保守替换位点。保守氨基酸位点依次为:GVAKN LHRDL KNLDF LTYPE DWGLP RHT-coffee比对后用粉色高亮区对二级结构单元进行注释。M-Coffee alignment resultMAPK的蛋白序列用M-coffee多重比对结果如下图:共找到25个保守位点, 26个保守替换位点。保守氨基酸位点依次为:GVAKE LHRDL KNLDF LTYPE DWG-P - -M-coffee比对后也用粉色高亮区对二级结构单元进行注释。对T-coffee和M-coffee比对结果进行比较,除了第五个保守位点T-coffee是N,M-coffee为E,另外,T-coffee结果比M-coffee结果多出三个保守位点,三个保守位点均位于保守位点出现的末尾,M-coffee将两个连续空格(分别为3个和两个连续字符)插入放在了二级结构的内部,就这次比对来说,T-coffee将一个连续空格(4个字符)插入到二级结构内部。

文档评论(0)

189****1013 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档