结构基因组学总结.pptVIP

  • 212
  • 0
  • 约 65页
  • 2017-05-12 发布于湖北
  • 举报
结构基因组学总结

第五章 基因组序列注释 完成基因组测序仅仅是基因组计划的第一步,更大的挑战在于弄清: 基因组序列中所包含的全部遗传信息是什么; 基因组作为一个整体如何行使其功能。 这两项任务都必须依赖于对基因组序列的正确注释(annotation)。 基因组注释方法: ① 自动注释:依据某些规则进行数据分析得出是否为基因的结论。 ② 人工注释:人为检测评价自动注释的结果并根据其他数据进行分析与校正。 ③ 实验注释:根据实验结果进行检测,如EST或全长cDNA。 自动注释的内容: 依据基因结构的特点采用软件预测,不依赖已有的表达序列; 同源性比较,在同一物种或不同物种中查找已有的基因序列; 功能域(domain)或基序(motif)分析。 5.1 搜寻基因 5.1.1 根据基因结构特征搜寻基因 Ⅰ. 开放读码框 在DNA链上,由蛋白质合成的起始密码子开始,到终止密码子为止的一个连续编码序列称为一个开放读码框(open reading frame, ORF)。 读码框(reading frame) 任意一段DNA序列都有6种可能的读码框。 ORF的长度: 终止密码子: TAA, TAG, TGA GC% = 50%,终止密码子每 64 bp出现一次; GC% 50%,终止密码子每100~200 bp 出现一次; 由于多数基因 ORF 均多于50个密码子,因此最可能的选择应该是 ORF

文档评论(0)

1亿VIP精品文档

相关文档