基因结构和基因预测课件.ppt

  1. 1、本文档共104页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因结构和基因预测课件

第六讲 基因结构与基因预测; §6.1 高等真核生物 基因结构与基因预测简介 ;1 基因(gene)的概念 基因的概念随着科学的发展而不断发展,迄今为止,仍有各种说法。 Today when we speak of a gene for some malady, a regulatory gene, a structural gene, or a gene frequency, it is entirely possible that we are deploying different gene concepts even though we are using the same term. ——M. R. Dietrich,2000 从分子生物学的角度而言,一般认为基因是负载特定生物遗传信息的DNA分子片段,基因在一定条件下能够表达这种遗传信息,产生特定的生命功能。;2 基因的分类 按功能分为: (1)、结构基因(可被转录形成mRNA,并进而翻译成多肽链,构成各种结构蛋白质、催化各种生化反应的酶和激素等) (2)、调控基因(可调节控制结构基因表达的基因) (3)、只转录而不翻译的基因(如rRNA基因、tRNA基因) ;3 人类基因的结构 ORF(Open Reading Frame):在DNA链上,由蛋白质合成的起始密码开始,到终止密码子为止的一个连续编码序列。 人类结构基因的结构包括4个区域: (1)、外显子; (2)、内含子; (3)、前导区(位于编码区上游,相当于mRNA5’端非编码区(非翻译区)); (4)、调节区(包括启动子和增强子等基因编码区的两侧,也称为侧翼序列);;人类结构基因的结构示意图;人类结构基因的结构示意图;Contig 3 of Ch21 (Total length: 3,450,497 Bp);(1)、人类细胞核基因组中编码序列不到2%,约含3万左右不同的基因,且有近1/3为多拷贝; (2)、结构基因大多含有插入序列。即大部分基因为断裂基因(interrupted gene); (3)、外显子(exon)一般不长于800bp,内含子(intron)则在30bp~数十kb不等; (4)、mRNA剪接位点(Splice sites)的识别信号:每个外显子和内含子接头区都有一段高度保守序列(consensus sequence),即内含子5’端大多数是GT(称为donor site)开始,3’端大多数是AG(称为acceptor site)结束,称为GT-AG法则;; (5)、尽管拥有相同的一套基因组,不同的分化细胞中所表达的基因也不同,每个细胞只表达一部分基因 (例如:人脑细胞的基因表达百分比最高,为22%); (6)、转录在细胞核内进行,翻译在细胞质核糖体中进行,二者在时间空间上是分开的。;4 假基因 假基因:与功能性基因密切相关的DNA系列,但由于缺失、插入和无义突变失去阅读框架而不能编码蛋白质产物。有些人类假基因可以转录但不能翻译成蛋白质。 假基因的两种类型: (1)、由于一种基因的加倍而不能表达,但保留原来亲本基因的外显子及内含子; (2)、仅含有亲本基因的外显子,源于mRNA并通过逆转录而重新整合进基因组的。;5 重复序列 超过90%为重复序列,不编码mRNA前体或其它RNA。 (个体间的重复序列有巨大差异 -- DNA指纹) 重复序列分为3类:高度重复序列、中等重复序列、低重复序列。 目前的一些认识: (1)、GC含量低,AT含量高。(AT的氢键弱); (2)、3端和5端有直接重复序列的存在。有利于形成环状结构。 ;6 与转录有关的调控信号 (1)、启动子(promoter) (2)、增强子(enhancer) (3)、负性调节元件 (4)、LCR(Locus control regions)(基因座调控区) (5)、转录因子 (6)、与转录终止有关的序列: (7)、mRNA的剪接;7 内含子-外显子结构的统计研究;10种真核生物的外显子和内含子长度的统计分布 (Deutsch Long,1999) (外显子长度的单位为氨基酸,内含子长度的单位为核苷酸;图中横坐标表示长度,纵坐标表示频率。);人(Homo sapiens)的基因组: 平均每个基因包含内含子4.0个(最多的是116个),外显子5.0个,每1kb的CDS平均含有5.3个内含子,是这10种真核生物中内含子数目最多、长度最大的。内含子的平均长度为3413.1bp,其中大多数为75~150bp,已知最长的内含子要大于100kb。每1kb的CDS所包含的内含子长度为6825bp。同样地,人类基因组外显子长度的概率分布要比内含子的概率分布要紧凑得多。;人类基因组的外显子和内含子数目及长度的统计结果比

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档