基因组学基因组序列的诠释.pptxVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因组学基因组序列的诠释第1页/共67页 2第2页/共67页 3问 题基因组序列所包含的全部遗传信息是什么?基因组作为一个整体如何行使其功能?用什么方法寻找基因,研究基因的功能呢?第3页/共67页 4基因组序列的诠释研究基因组的最终目的不是为了仅仅得到基因组的全部序列,而是诠释基因组所包含的信息和基因组功能。在这一部分中,我们主要探讨利用什么方法来搜寻基因和研究基因组的功能1. 在基因组中搜寻基因根据顺序分析搜寻基因实验分析确认基因2. 基因功能的测定第4页/共67页 5A 起始密码子 ATG B 信号肽分析C 终止密码子D 3’端的确认E 非编码序列、内含子F 密码子偏爱性G 外显子-内含子边界H 上游调控序列I 软件预测 5.1 在基因组中搜寻基因 根据序列分析搜寻基因第5页/共67页 6 5.1 在基因组中搜寻基因 在获得基因组或DNA序列后,可以采用人工或计算机序列筛选的方法来获得基因。目前,使用比较多的方法是ORF(opening reading frames)扫描ORF:每个编码蛋白的基因都含有ORF,它是由一系列密码子组成,通常以ATG开始,TAA、TGA、TAG结束。通过寻找起始密码子和终止密码子的ORF序列是寻找基因的一种重要的方法寻找ORF的成功的关键在于终止子在DNA序列中出现的频率第6页/共67页 7 5.1 在基因组中搜寻基因 CG含量50%=50%50%终止子出现的频率64bp即可出现一次64bp出现一次64bp才可能出现一次终止子出现的频率与CG含量之间的关系第7页/共67页 85.1 在基因组中搜寻基因高等真核生物DNA的ORF的阅读障碍:基因间存在大量非编码序列(人类基因组占70%)很多基因含有内含子由于多数外显子长度100个密码子,当读码进入到内含子时很快就遇到终止密码,从而难以判断读码的准确性第8页/共67页 9A 起始密码子 ATG第一个ATG的确定(依据Kozak规则)Kozak规则是基于已知数据的统计结果所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律根据开放读码框(ORF)预测基因第9页/共67页 10Kozak规则:若将第一个ATG中的碱基A,T,G分别标为1, 2 , 3位,侧翼碱基序列具有以下特征:第4位的偏好碱基为GATG的5’端约15bp范围的侧翼序列内不含碱基T在-3,-6和-9位置,G是偏好碱基除-3,-6和-9位,在整个侧翼序列区,C是偏好碱基第10页/共67页 11B 信号肽分析信号肽分析软件(SignalP) http://www.cbs.dtu.dk/services/signalP把预测过程中证实含完整mRNA 5’端的序列翻译为蛋白序列然后用SignalP软件对前50个氨基酸序列(从第一个ATG对应的甲硫氨酸Met开始)进行评估,如果SignalP分析给出正面结果,则测试序列有可能为信号肽 第11页/共67页 12C 终止密码子终止密码子: TAA, TAG,TGA GC% = 50% 终止密码子每 64 bp出现一次 GC% 50% 终止密码子每100-200 bp 出现一次 由于多数基因 ORF 均多于50个密码子,因此最可能的选择应该是 ORF 不少于100 个密码子第12页/共67页 13D 3’端的确认 3’端的确认主要根据Poly(A)尾序列,若测试DNA片段不含Poly(A)序列,则根据加尾信号序列“AATAAA”和BLAST同源性比较结果共同判断第13页/共67页 14E 非编码序列、内含子 高等真核生物多数外显子长度少于100 个密码子,有的不到50个密码子甚至更少第14页/共67页 15F 密码子偏爱性编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同不同种属间使用同义密码的频率有很大差异,如人类基因中,丙氨酸(Ale)密码子多为GCA,GCC或GCT,而GCG很少使用第15页/共67页 16G 外显子-内含子边界外显子和内含子的边界有一些明显的特征如:内含子的5‘端或称供体位(donor site)常见的顺序为 5’ -AG↓GTTAAGT-3’3’端又称受体位(acceptor site),多为5‘PyPyPyPyPyPyCAG-3’ (Py:嘧啶核苷酸,T或C)第16页/共67页 17 H 上游调控序列几乎所有基因(或操纵子)上游都有调控序列,它们与DNA结合蛋白作用,控制基因表达通过同源性比较来预测mRNA的5’端,最常用的与转录起始位点相关的数据库是真核启动子数据库(The TRADAT Project , Eukaryotic Promoter Database, EPD. http://www.epd

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档