第四章核酸序列-2资料.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章核酸序列-2资料

第四章 DNA序列分析;主要内容;§4.3 基因预测与鉴定;功能基因组学(Functional genomics):利用结构基因组学研究所得的各种信息在基因组水平上研究编码序列及非编码序列生物学功能的学科。 ;一、基因预测方法;二、从基因组序列预测新基因;概念:是指直接利用基因以及外显子/内含子结构在基因序列上已知的一些统计特征或信号,在基因组序列中直接预测基因的位置与组成。;GENSCAN基因预测程序;目前Christopher ?Burge还开发了适用于果蝇、拟南芥、玉米的专用版本。对于非版本专用的物种,其预测准确率会下降。 ;1 基因数目 可能将两个基因的外显子归并到一个基因,或者相反。 2 物种 GENSCAN主要是针对人类(或脊椎动物)基因组序列设计,用于其他物种准确性可能降低。目前有适用于果蝇、玉米、拟南芥菜、秀丽线虫的版本。原核生物和酵母的基因预测,建议用Glimmer或GeneMark软件。 3 根据测试集得到的准确性指标可能与实际的情况不同 4 对各个结构元件的预测准确性不同 总体来说,对中间外显子预测的准确性高于起始外显子和末端外显子,外显子的准确性高于polyA或启动子。对启动子的预测较不可靠,建议用NNPPprogram?预测启动子。 5 植物基因剪接位点的预测建议用Splice Predictor程序 ;以人类基因组序列Z83819 为例进行基因预测。;步骤1 进入页面,设置参数;步骤2 上传序列文件或粘贴序列;步骤3 点击按钮Run GENSCAN,开始GENSCAN的预测程序,获得预测结果;将预测出的基因翻译成蛋白序列;文字部分:;Z83819预测结果PDF;表头说明;Z83819-Reversed 预测结果;如果对原核生物及酵母的基因组进行预测,建议采用Glimmer或GeneMark程序 /GeneMark/ 或NCBI站点提供的Glimmer和GeneMark /genomes/MICROBES/glimmer_3.cgi /genomes/MICROBES/genemark.cgi;利用相似性搜索的方法来发现新基因是目前国际上另一个非常通用且成熟的方法。;有2个重要的软件可实现全基因组比较预测;主要区别: SPG-1能同时对基因组序列进行外显子预测后再进行同源性比较。尤其适用于比较两个完全未知的基因组序列。 VISTA则要求提供一个所谓的基础物种的基因组序列结构信息,然后在此基础上来预测其他物种的基因组序列中高度同源的基因结构。尤其适用于预测已知某个物种的基因在其它物种基因组中的同源基因。;SGP-1主页;VISTA主页;VISTA比较预测页面;除了基因组序列,目前最容易得到的也是信息量最大的基因鉴定数据来源就是各个物种的表达序列标签(EST)数据库。;其基本过程是:;重叠群(contig):是两个或两个以上的EST序列或转录序列组成的一致序列(consensus sequence);1)该序列是否可能为新基因?;2)该序列是否被包含在某个EST重叠群?;3)如何进行EST重叠群的拼接和组装? ;CAP3拼接程序;拼接结果;双序列比对结果,两条序列100%匹配;4)拼接后的一致序列是否为全长cDNA?;§4.4 非编码区分析与调控元件识别;真核生物基因序列中,绝大部分序列是非编码序列。人类基因组中,仅有3%的序列为编码序列。;真核生物基因表达在时间和空间上的有序性已吸引越来越多的科学家,并成为20世纪90年代以来分子生物学研究最为活跃的领域之一。;启动子是指确保转录精确而有效地起始的DNA序列。;重复序列是指在基因组中不同位置出现的相同或对称性片段,相同包括同一个基因组中相似的片段,也可以是不同物种间基因组中的相似片段。;真核生物中各种重复序列所占比???很高。;Repbase数据库主页;Censor 主页 /censor/;启动子(promoter):DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域,在许多情况下,还包括促进这一过程的调节蛋白的结合位点。;EPD(Eukaryotic Promoter Database),真核生物启动子数据库 http://www.epd.isb-sib.ch/;EPD是真核基因启动子数据库,提供从EMBL中得到的启动子序列,目标是帮助实验研究人员、生物信息学人员分析真核基因的转录信号。关于启动子的描述信息直接摘自科学文献,因而相对独立于EMBL。;EPD 主页;Promoter2.0 http://www.cbs.dtu.dk/services/Promoter/;NNPP主页(伯克利果蝇基因组计划网站);XM_001755776(SOD)分析结果;Promoter 2.0主页;Splice Site Prediction ,基于神

您可能关注的文档

文档评论(0)

LOVE爱 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档