第07讲基因识别与基因组分析资料.pptVIP

  • 16
  • 0
  • 约 84页
  • 2016-12-24 发布于湖北
  • 举报
基因组中等值区(isochore)的分析 大部分真核基因组表现出一种称为等值区(isochore)的组织形式。等值区定义为“具有一致碱基组成的长区域”,它有两个特征:第一,等值区基因组序列的长度超过300kb对碱基;第二,虽然不同的等值区其GC含量差别显著,但同一等值区的GC含量始终相对均衡。 人类基因组大约可以划分为五个不同类型的等值区,其中有两个区域缺乏G和C,分别被称作L1和L2,平均GC含量分别为39%和42%,另三个区域所含的G和C相对丰富,分别被称作H1、H2和H3,GC含量平均值分别为46%、49%和54%。 在富含GC和缺乏GC的等值区所发现的基因的类型也有非常大的差别。尽管H3等值区只占整个人类基因组相对很小的部分(3%~5%),它却包含了人类约80%的管家基因。相反,L1和L2等值区(总共占人类基因组的66%)包含85%的人类组织特异性基因。 GC丰富等值区中的基因偏好使用G和C丰富的三联密码子对应的氨基酸。 基于序列特征的方法 编码序列统计学特征 密码子使用偏爱性 双联密码子出现频率 整个基因编码区长度一定是3的倍数 密码子使用偏爱性 利用密码子使用频率对序列进行分析可以发现编码区的粗略位置。 人类基因组密码子使用频率表 阅读框出现偏爱密码子,则该阅读框比较有可能是编码序列。 双联密码子出现频率 有些二联密码子(亮氨酸与色氨酸)倾向于同时出现,另一些(脯

文档评论(0)

1亿VIP精品文档

相关文档