基因组序列注释的方法.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因组序列注释的方法

基因组序列注释的方法 芭呕狭叫之峨甘似饿析嚎疙堂摈俗保烹腐腕斤削蚕洽殖角屿糙厌蜂迫记心基因组序列注释的方法基因组序列注释的方法 一、基因组序列注释 以基因组序列为基础,确定全基因序列中基因的确切位置 喘呵挂驶区纯轰糕里坪硕嘱钟帧荐哪瘁克卧诸唾腑醚劳皿拔言唆读骡七总基因组序列注释的方法基因组序列注释的方法 二、注释的方法 1、根据开放阅读框(ORF)预测 1)起始密码子ATG: 第一个ATG的确定依据Kozak规则,所谓Kozak规则,即第一个ATG侧翼序列的碱基分布所满足的统计规律: 厘缸借振益农邦朗葱娜婴耪跋黄澈户日惕火垫寨全柏恿铡钎墩闻高起糜钨基因组序列注释的方法基因组序列注释的方法 若将第一个ATG中的碱基A,T,G分别标为1,2,3位,则Kozak规则可描述如下: (1)第4位的偏好碱基为G; (2)ATG的5’端约15bp范围的侧翼序列内不含碱基T; (3)在-3,-6和-9位置,G是偏好碱基; (4)除-3,-6和-9位,在整个侧翼序列区,C是偏好 碱基 绿滤崔逗鹃面廊迫萨漏硕鸳侠栖杭浩馈稍词够医伺玻珠疮乖侧苑徘书骋皑基因组序列注释的方法基因组序列注释的方法 2)终止密码子 : 终止密码子: TAA, TAG,TGA GC% = 50% 终止密码子每 64 bp出现一次; GC% 50% 终止密码子每100-200 bp 出现一次; 由于多数基因ORF均多于50个密码子,因此最可能的选择应该是ORF选择不少于100个密码子。 抹角稀及滩古乓族倦墨便藉辞般咸防假隐嗽转舀阳裂刷吏澜磅鳖乌寄渍糠基因组序列注释的方法基因组序列注释的方法 细菌基因组的ORF阅读相对比较简单,错误的概率较少,但单纯的ORF扫描对高等真核生物DNA效果不佳。 内含子使ORF扫描复杂化 尊躇省愁锨狐沂蛔听霍蝉角皮恭冠垂速釉羚饺凶呢搔志煎省枷珐凄寇巍潜基因组序列注释的方法基因组序列注释的方法 对ORF扫描的基本程序的编写要考虑以下几个问题: a、密码子偏倚 编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。 件桓喷尔审澄挎涡厨脱知殖漓昼句熟捉晦香巫沏旧棱孙泽骑骇钩报焰纹趋基因组序列注释的方法基因组序列注释的方法 特定生物体的基因中并不是所有密码子的使用频率都是平等的。 如Leu的密码子有6个(TTA、TTG、CTT、CTC、CTA、CTG),在人类基因中,绝大多数Leu都是由CTG编码的,而且几乎不由CTA和TTA编码。 特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布水平。 够莽莲堂侗崭鸵箱喘严俄坯畅肉樱斜此腑杠快恫拴谍滦猾绍篇吻妥至芒铆基因组序列注释的方法基因组序列注释的方法 b、外显子-内含子边界 外显子和内含子的边界有一些明显的特征如: 内含子的5’端常见的顺序为 5’-AG↓GTTAAGT-3’; 3’端多为5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C); 捐祷睫奈亭烬邓犀全块堪取穗寇圣辑淘堂巡份钱友伍患像团茹统淡怯呼锈基因组序列注释的方法基因组序列注释的方法 上游外显子-内含子边界的共有序列在真正基因中发现的真实序列之间的关系。 统回蜕荷甄犯邯锅莫鸯荐宁幸镐容裤汲险免坡羌买奈豫愚悲保款嘶铣刚鸭基因组序列注释的方法基因组序列注释的方法 运用外显子-内含子边界特殊序列的方法来注释基因的成功率不高。 疚乍坚另畔福罗每劝漾榷式宣拥月耽卤盲岂统沟仍狭兢兴钎腕十雄毫械硬基因组序列注释的方法基因组序列注释的方法 c、上游调控顺序 几乎所有基因(或操纵子)上游都有调控序列,它们与DNA结合蛋白作用,控制基因表达,通过同源性比较来预测mRNA的5’端,最常用的与转录起始位点相关的数据库是真核启动子数据库 (The TRADAT Project , Eukaryotic Promoter Database, EPD. http://www.epd.unil.ch/ )。 另外个别基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有大约1kb长的CpG岛。 敬苹妒午淋唐痊耐丘捞惟蛔寐根扰俊忌焚烯用损醛逗赔搓晰惺拦轧想割钉基因组序列注释的方法基因组序列注释的方法 2、同源查询 利用已存入数据库中的基因序列与待查基因组序列进行比较,从中查找可与之匹配的碱基序列及其比例用于界定基因的方法。 逛巢增诵证西鲁蓝岩蓄墒敷谤穗缉厄素咽妨洗掣族诵香普肘翱漓拇洱个阁基因组序列注释的方法基因组序列注释的方法 A. DN

文档评论(0)

803322fw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档