- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验七核酸序列分析(附加部分).doc
实验七 核酸序列分析(附加部分)
发现核酸序列中的蛋白质编码区域。
利用NCBI ORF Finder。/gorf/gorf.html
在NCBI上查找AC号为AE008569的核酸记录,思考:1、这个序列的名称?2、这个序列所属的生物学分类?
进入OFR Finder,首先在页面下方的Genetic codes 下拉菜单中浏览现有的22种遗传密码选择项(这里我们只使用默认的standard code),利用AC号或其裸序列(想一想怎么能得到)进行ORF finding。
在结果显示页面中,按照序列的正向+1、+2、+3以及反向的-1、-2、-3进行的六框翻译结果以图形的方式显示在页面中。利用默认的100bp阈值所发现的各框内的ORF以绿色条状显示。同时,按照六框内所有发现的ORF的大小顺序,在页面的右侧有一个列表,分别显示了ORF的翻译框、在基因组上的位置以及ORF的长度。你可以改变ORF鉴别中的长度阈值(50,100,300),点击Redraw重新进行计算。
点击图形上的绿色条框,就可以对这个ORF进行检查(当然也可以点击右侧的ORF列表),页面上会显示预测的氨基酸序列,同时页面上还嵌入了BLAST程序以及NCBI的有关序列数据库以便于发现与此ORF相似的库记录。非常方便!
SixFrames是以另外一种方法计算并显示结果,点击SixFrames,结果中各框上边拉下的绿色短线表示为一个起始密码子,而各框下方的粉色短线表示为一个终止密码子。
如果你拥有一个高等生物的cDNA时,可以利用ORF finder这个简单的工具来找到你的蛋白编码区域。因为cDNA不含有intron,因此可拥有与微生物相似的ORF结构。
ORF finder可以正确地鉴定85%左右的蛋白编码区,但要发现一些很短的蛋白序列,shadow gene或使用了非常用遗传密码子的基因,则需要使用那些包含了密码子使用频率及使用偏好等统计学特性的程序,如GeneMark。这里给出两个GeneMark网址:/GeneMark/ , http://www2.ebi.ac.uk/genemark/ 。
发现真核生物基因组(如脊椎动物)序列中的蛋白质编码区域。
剪切位点(splice site)的预测。
脊椎动物的外显子很小(平均150bp),它们的剪切位点还有一定的变化。因此发现外显子要比利用ORF finder或GeneMark发现ORF困难得多。下面是一种外显子预测程序:MZEF。点击/ ,这是位于冷泉港实验室Michae Q. Zhang’s的主页,点击左侧的databases and Software Tools,进入的页面中包含了多个物种的启动子数据库、外显子发现工具等,点击页面中间的Gene – Finding (public)连接,则进入了MZEF页面(/tools/genefinder/ )。程序的相关说明文件在页面下方的 For more information about MZEF行的here链接中,事先阅读一下此文件,有助于程序的使用以及对输出结果的理解(/tools/genefinder/readme.htm ),你也可以阅读实验数据-实验七中的MZEFexample.PDF文件,这一文件也可以从Michae Q. Zhang’s的数据库及软件工具页面上找到(/reprints/mzefexample.pdf)。回到MZEF主页,点击Human 链接(/tools/genefinder/human.htm ),进入由先前统计数据校准的人类编码外显子预测MZEF程序页面。
在NCBI上找到一条AC号为AF018429的人类核酸记录,这是一个包含了外显子1和外显子2的dUTPase基因(注意一下这两个外显子在基因上的位置)。将FASTA格式的序列粘贴到人类MZEF程序页面的检索框中,点击submit。程序很快给你返回结果。它发现了在1056-1172间的一个外显子(通过帮助文件理解结果中各项的含义)。预测的正确性有1/2(漏掉了一个exon)。而且,预测到的外显子的真实起始位点也不在1056。这样的正确率(1/2,不完全吻合)在外显子发现程序中并不少见。
下面两个网址则将MZEF与其它的方法综合在一起进行外显子预测:EBI的MZEF-SPC (http://corba.ebi.ac.uk/cgi-bin/sp/wrapper.cgi)以及Michigan Tech的AAT(/aat/aat.html )。
真核生物基因组的完全基因分析
如果你在进行基因组测序,那么所需要的就是那些最高水平的复杂的计算机辅助注释工具:基因组剖析软件(genome-parsing software)。这些软件程序是为一次处理一个基因组的大片段序列(10万到几百万bp)的注
文档评论(0)