- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验二双序列比对分析.doc
实验三 双序列比对分析
实验目的
Tay-Sachs是一种常染色体隐性遗传疾病,它的起因是第15号染色体的等位基因HEXA突变。人类的HEXA基因在GenBank中的编号为“NM_000520”,小鼠的HEXA基因在GenBank中的编号为“AK080777”,它们是核苷酸序列,以这两条序列为例,学习双序列比对分析。
学习和掌握在MATLAB平台上应用Bioinformatics工具包有关核苷酸和蛋白质双序列比对的命令和功能。
学习和掌握在MATLAB平台上应用Bioinformatics工具包访问GenBank,并提取核苷酸和蛋白质序列数据的方法。
学习和掌握在MATLAB平台上应用Bioinformatics工具包制作核苷酸或蛋白质两条序列比对的点阵图的方法。
学习和掌握在MATLAB平台上应用Bioinformatics工具包进行核苷酸或蛋白质双序列的局部比对和全局比对的方法。
实验内容
在MATLAB平台上应用Bioinformatics工具包访问GenBank,提取核苷酸序列并转换为蛋白质序列。
① 用“web”命令在MATLAB平台上打开NCBI网页。
web(/) web(/books/bv.fcgi?call=bv.View..
ShowSectionrid=gnd)
② 用“getgenbank”功能从GenBank中读序列信息到MARLAB
humanHEXA = getgenbank(NM_000520)
mouseHEXA = getgenbank(AK080777)
在MATLAB的workshop打开humanHEXA 和mouseHEXA查看其内容。
③ 从GenBank中提取2条核苷酸序列后,首先要做的是用全局比对来寻找两条序列中的相似序列。因为进行蛋白质序列的比对更能体现其生物学本质,所以常常进行蛋白质序列的比对。用“nt2aa”功能可将核苷酸序列转换为蛋白质序列。
mouseProtein = nt2aa(mouseHEXA.Sequence);
humanProtein = nt2aa(humanHEXA.Sequence,Frame,3);
在MATLAB的workshop打开mouseProtein 和humanProtein查看其内容。
核苷酸和蛋白质双序列比对分析
⑴ 蛋白质双序列比对的点阵图。
寻找两条序列的相似部分序列的最简单的方法是做点阵图。
用“seqdotplot”功能制作mouseProtein 和humanProtein的点阵图。
seqdotplot(humanProtein,mouseProtein)
ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A);
用上述命令作出的点阵图的特点不清楚,可以将命令稍加修改,图象特点将非常清楚。
seqdotplot(humanProtein,mouseProtein,4,3)
ylabel(Human hexosaminidase A);xlabel(Mouse hexosaminidase A);
思考并完成:如果想做两条核苷酸序列的点阵图应该怎样进行?
⑵ 应用Needleman-Wunsch 算法的蛋白质双序列全局比对。
应用“nwalign”功能对mouseProtein 和humanProtein两条蛋白质序列进行Needleman-Wunsch 算法的双序列全局比对。“showalignment”功能可以将比对结果以不同的颜色显示在“Help Browser”。
[score, globalAlignment] = nwalign(humanProtein,mouseProtein);
showalignment(globalAlignment);
思考并完成:如果想做两条核苷酸序列的全局比对应该怎样进行?
分析一下比对结果。
⑶ 蛋白质双序列的局部比对。
① 从Needleman-Wunsch 算法的双序列全局比对结果来看,mouseProtein 和humanProtein两条序列的最开始的540个氨基酸比对非常好,而其后的序列匹配不好。注意,在这一点有一个停止的符号“*”。试想,如果只对“*”前面的序列进行比对,那么比对结果的得分将会很高。我们用“find”命令寻找“*”标志的位置。
humanStops = find(humanProtein == *)
mouseStops = find(mouseProtein == *)
② 分别截取两条蛋白质序列的前540个氨基酸组成新的局部序列。用“seqdisp”功能将组成的两条新序列显示在屏幕上。
humanSe
文档评论(0)