实验二双序列比对分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验二双序列比对分析.doc

实验三 双序列比对分析 实验目的 Tay-Sachs是一种常染色体隐性遗传疾病,它的起因是第15号染色体的等位基因HEXA突变。人类的HEXA基因在GenBank中的编号为“NM_000520”,小鼠的HEXA基因在GenBank中的编号为“AK080777”,它们是核苷酸序列,以这两条序列为例,学习双序列比对分析。 学习和掌握在MATLAB平台上应用Bioinformatics工具包有关核苷酸和蛋白质双序列比对的命令和功能。 学习和掌握在MATLAB平台上应用Bioinformatics工具包访问GenBank,并提取核苷酸和蛋白质序列数据的方法。 学习和掌握在MATLAB平台上应用Bioinformatics工具包制作核苷酸或蛋白质两条序列比对的点阵图的方法。 学习和掌握在MATLAB平台上应用Bioinformatics工具包进行核苷酸或蛋白质双序列的局部比对和全局比对的方法。 实验内容 在MATLAB平台上应用Bioinformatics工具包访问GenBank,提取核苷酸序列并转换为蛋白质序列。 ① 用“web”命令在MATLAB平台上打开NCBI网页。 web(/) web(/books/bv.fcgi?call=bv.View.. ShowSectionrid=gnd) ② 用“getgenbank”功能从GenBank中读序列信息到MARLAB humanHEXA = getgenbank(NM_000520) mouseHEXA = getgenbank(AK080777) 在MATLAB的workshop打开humanHEXA 和mouseHEXA查看其内容。 ③ 从GenBank中提取2条核苷酸序列后,首先要做的是用全局比对来寻找两条序列中的相似序列。因为进行蛋白质序列的比对更能体现其生物学本质,所以常常进行蛋白质序列的比对。用“nt2aa”功能可将核苷酸序列转换为蛋白质序列。 mouseProtein = nt2aa(mouseHEXA.Sequence); humanProtein = nt2aa(humanHEXA.Sequence,Frame,3); 在MATLAB的workshop打开mouseProtein 和humanProtein查看其内容。 核苷酸和蛋白质双序列比对分析 ⑴ 蛋白质双序列比对的点阵图。 寻找两条序列的相似部分序列的最简单的方法是做点阵图。 用“seqdotplot”功能制作mouseProtein 和humanProtein的点阵图。 seqdotplot(humanProtein,mouseProtein) ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A); 用上述命令作出的点阵图的特点不清楚,可以将命令稍加修改,图象特点将非常清楚。 seqdotplot(humanProtein,mouseProtein,4,3) ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A); 思考并完成:如果想做两条核苷酸序列的点阵图应该怎样进行? ⑵ 应用Needleman-Wunsch 算法的蛋白质双序列全局比对。 应用“nwalign”功能对mouseProtein 和humanProtein两条蛋白质序列进行Needleman-Wunsch 算法的双序列全局比对。“showalignment”功能可以将比对结果以不同的颜色显示在“Help Browser”。 [score, globalAlignment] = nwalign(humanProtein,mouseProtein); showalignment(globalAlignment); 思考并完成:如果想做两条核苷酸序列的全局比对应该怎样进行? 分析一下比对结果。 ⑶ 蛋白质双序列的局部比对。 ① 从Needleman-Wunsch 算法的双序列全局比对结果来看,mouseProtein 和humanProtein两条序列的最开始的540个氨基酸比对非常好,而其后的序列匹配不好。注意,在这一点有一个停止的符号“*”。试想,如果只对“*”前面的序列进行比对,那么比对结果的得分将会很高。我们用“find”命令寻找“*”标志的位置。 humanStops = find(humanProtein == *) mouseStops = find(mouseProtein == *) ② 分别截取两条蛋白质序列的前540个氨基酸组成新的局部序列。用“seqdisp”功能将组成的两条新序列显示在屏幕上。 humanSe

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档