第一章基因结构和基因组1.ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章基因结构和基因组1

生物的性状是经由遗传单位传递给下一代,这个概念在1900年由孟德尔(Gregor Mendel)提出,1909年约翰森(Wilhelm Johanssen)将这个遗传单位的概念冠上“gene”的名字,汉文将之翻译成“基因”,日本人则将之翻译成“遗传子”,更为直接。 最早的观念中,基因是前述的“遗传单位”(unit of inheritance)。这是一个比较功能性的概念,它是一个自主单位(autonomous unit),能把性状遗传给后代。相对地,有人认为基因是一个有形的物体(physical entity),它是染色体上面一段固定的序列。这两派看法多年来,各执一词,不相上下。 1920年代及1930年代早期Alfred H Sturtevant以Hermann Muller在果蝇研究上,发现基因在染色体上的位置改变时,尽管基因结构本身不变,其功能却会变化而造成果蝇性状的突变。实验中,他们将一个基因挪近所谓异染色质区(heterochromatin)时,果蝇会产生所谓杂色(variegated)的表现型,也就是一个基因在某些细胞会表现,却在某些细胞不会表现,而造成“杂色”,例如复眼中有些部分呈现白色,有些部分则呈现红色。由於基因的功能似乎会因应其所在位置而改变,以致有人甚至认为基因根本不是一个固定而具体的单位(particulate gene),然而,在实际上却又不能完全否定基因做为遗传单位的概念。 在最新版的Thompson Thompson Genetics in Medicine(2001),基因的定义是A sequence of chromosome DNA that is required for production of a functional product,be it a polypeptide or a functional RNA molecule。因此当代对基因的定义除了被转译的DNA序列本身之外,调控此一转译工作的DNA序列也应包含在内。那麽基因的范畴到底何在? 假若基因是一个比较固定而具体的单位(particulate gene)则我们应该可以找出界定基因的区隔(barrier or insulator)。然而学者费尽心力却遍寻不着能够区别个别基因的结构。因此,从学者无法找到能够区隔个别基因的barrier or insulator来看,基因可能是一个相当具有伸缩性的结构。另外一个观察是,一个基因的功能取决於它对某些转录因子(transcriptional factor)的反应,而非本身在染色体上的位置,这个现象是Frank Grosveld在人类β-globin locus control region首先观察到。因此基因应该是包含被转录的DNA序列以及转录因子的结合区。这些转录因子的结合区可以延伸几百个Kilobase。最近的研究显示人类的DACH基因,其enhancer甚至在远达1Mb的基因沙漠(gene desert)中。 这个“基因包含转录因子结合区”的概念,使基因变成一个功能性而且可以彼此重叠的概念。意即,一段DNA序列,可以因对转录因子反应的不同,可以有一种以上的基因功能,而一个基因的转录序列,可能是另一个基因的转录调控区。 时至今日,基因的定义已经不再是一段具有明显边界的固定DNA序列(particulate gene),而是一个具有伸缩性(flexible)的功能性组合,它的范围是以其(1)空间结构与位置(2)对特定调控因子的反应(3)对最终表现型的效果来决定。 根据以上的论述,基因的基本条件有三:1、必须要有产出(product)2、必须要有功能 3、包含转录区及调控区。根据这三个条件,我们如何去从漫长的DNA序列中找出基因呢?以下是五种常用的标准。 1、Open reading frames(ORF) ORF是指位于start codon与stop codon之间的DNA序列。以ORF寻找基因较适用于原核生物或其他intron稀少的生物。当生物的exon被隐藏在大段的intron时,ORF常常不易被找到。 2、Sequence features 分布特征 找出ORF之后,利用基因通常GC较AT多的特征,再加以验证。另外找寻splice site(AG、GT)可能也有助于基因的辨识。不过使用这些辨识原则的电脑软件只能预测50%的exon和20%的基因。 3、Sequence conservation 比对不同生物的碱基序列也是辨识基因的利器,理论上,在不同生物均有的序列(conserved sequence)应该有其功能上的重要性,本身是基因的机会较大。利用不同生物来比对基因序列,必须这些生物间有相当的演化距离(evolutionary distance),例

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档