- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因家族的定义
什么是一个基因家族呢?由一个共同的祖先基因经过重复(duplication)和突变(mutation)产生的、外显子中具有相似的序列的一组相关基因被称为基因家族(gene family)。基因重复主要有三种方式:片段复制、串联重复和逆转录转座或其他转座事件等,基因重复后可以彼此形成基因簇(gene clusters),同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。基因突变是基因分子进化的第一原因,由核苷酸替代、插入/缺失、重组和基因转换等引发的突变基因或DNA序列,通过群体水平的遗传漂变和/或自然选择进行扩散,并最终在物种基因组中得以固定,这种方式产生的新基因一般拷贝数目不会增加,相对基因重复是非常少的,主要是影响基因的序列以及其编码的蛋白。基因家族主要是指一组功能相似且核苷酸序列具有同源性的基因,是具有显著相似性的一组基因,编码相似的蛋白质产物。有时定义基因家族,从结构域角度来刻画。如:一类基因,其编码蛋白都含有同一个结构域,这一类基因是一个基因家族。比如MADS-box基因家族,这类基因都含有MADS-box结构域,还有SET结构域基因家族。这个定义信息更偏向功能信息,一般来说结构域决定某种功能,因为结构域序列保守,易形成稳定的三维结构。这与共同祖先的定义有些差别,很多结构域难找得到其共同祖先。另外一个基因的共同祖先定义比较复杂的,越是历史久远的祖先,因为物种的在进化过程中发生了很多丢失和增加事件。共同祖先是个相对的概念,比如植物的共同祖先,一般包括藻类及其它绿色植物,而被子植物共同祖先,根据已经测序的基因组,一般指单双子叶之前就可以。如果从共同祖先定义基因家族,很多已知的基因家族就要被分成很多个基因家族。有很多网站(数据库)专门收集结构域,比如Pfam和InterPro,这两个数据库内容差不多。这些数据库以Hmmer算法为基础,根据Uniprot中包含的蛋白,进行序列连配找到保守的片段(结构域),再以这些序列使用Hmmer构建种子,保存这些种子。一个蛋白拿过来后,与这些种子比对,根据打分能判断出这个蛋白是不是含有这个结构域,这也是判断一个基因编码蛋白是不是属于这个家族。基因家族定义 基因组进化中,一个基因通过基因重复产生了两个或更多的拷贝,这些基因即构成一个基因家族。 是具有显著相似性的一组基因,编码相似的蛋白质产物。 在真核细胞中许多相关的基因常按功能成套组合,被称为基因家族(gene family)。同一家族中的成员有时紧密的排列在一起,成为一个基因簇; 更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。 一组功能相似且核苷酸序列具有同源性的基因,可能由某一共同祖先基因经重复和突变产生。多基因家族 真核基因组的特点之一就是存在多基因家族(multi gene family)。多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。多基因家族大致可分为两类:一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene)。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。人们推测,假基因的来源之一,可能是基因经过转录后生成的RNA前体通过剪接失去内含子形成mRNA,如果mRNA经反复转录产生cDNA,再整合到染色体DNA中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。多基因家族的进化在进化过程中,基因家族如编码rRNA的基因或编码组蛋白的基因都是从共同的祖先基因通过重复(duplication)和歧化(divergence)进化而来的,它们具有相同或相关的功能。虽然如此,但它们在发育过程中并不总是同时表达的,不同的成员可能在不同的发育阶段和(或)不同的组织中表达,如有些血红蛋白基因家族成员在成体中表达,而另一些则只在胎儿期表达,这一事实说明在基因调控水平发生了进化歧化(evolutionary divergence)。 在足够时间的进化过程中,基因家族中某些成员的DNA序列可能歧化为可编码一种具有新功能的蛋白,例如,乳清蛋白(lactalbumi
文档评论(0)