- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
功能基因组学涵盖了“转录组学”、“蛋白质组学”及部分“生物信息学”的内容。 Relational Query Tools Sequence databases Genome What could happen Gene Expression databases Transcriptome + What would happen Protein Expression databases Proteome + What is happening * (3)家族中各基因编码的蛋白质具有高度的 同源性,但基因的核苷酸序列可能不同。 如 src 基因家族: src,abl,fes,fgr,fps,fym,kck,lck,lyn,ros,tkl,yes NH2 COOH 蛋白激酶同源结构域(250个氨基酸残基) 此家族中各基因的DNA序列没有明显的同源性。 (4)家族中各基因编码的蛋白质中具有很小的保守基序(conserved motif)。 如DEAD box基因家族。 DEAD box:Asp- Glu-Ala-Asp 此家族中各基因的DNA序列没有明显的同源性,但所有的表达产物都有解旋酶的功能,都具有同样的保守基序(DEAD盒),DEAD是酶活性的关键结构。 (5)基因超家族 基因超家族(gene superfamily)是指一组由多基因家族及单基因组成的更大的基因家族。它们的结构有程度不等的同源性,因此它们可能都起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。 免疫球蛋白超基因家族:表达产物都具有免疫球蛋白样的结构域结构。 β2 微球蛋白、MHC Ⅰ类抗原的α链、Ⅱ 类抗原的α链和β链,Thy1 , CD4 , CD8 等与免疫有关的分子,以后又陆续发现了许多免疫系统内和与免疫无关的家族成员。 丝氨酸蛋白酶基因超家族: 丝氨酸蛋白酶家族的基因产物都有一个特殊的功能区,具有酶的功能。功能区中丝氨酸是活性中心的关键氨基酸残基。 现有很多新成员加进去,如载脂蛋白(apolipoprotein),它们只是转移胆固醇蛋白颗粒中的成分而不具备任何水解蛋白质的酶功能。 (三)假基因 假基因(pseudogenes)是多基因家族中的成员,因碱基顺序发生某些突变而失去功能,不能表达或表达异常的无生物活性的多肽,这些DNA 顺序在相应基因名称之前加ψ表示。 α-like globin gene family: ……ζ…ψζ…ψα2…ψα1…α2…α1…θ……… 假基因DNA中的突变可以影响基因表达的任何一个环节: 转录起始信号消失(顺式元件缺失或突变) mRNA不能正常剪接(剪接位点缺失或突变) 翻译提前终止(突变产生终止密码子) α-like globin gene family: ……ζ…ψζ…ψα2…ψα1…α2…α1…θ……… ψζ与ζ序列一样,只有3个点突变。其中密码子6的GAG→TAG发生无义突变。 假基因普遍存在于真核生物中,在哺乳动物基因组中,约1/4基因为假基因。 (四)非编码序列 非编码序列在基因组 95%。 编码序列小于DNA总量的5%。 真核生物基因组非常大,即使只有5%的编码序列,其基因数量也可达到原核生物基因组的基因数量的几十倍。 (五) 真核生物基因组中的转座子 在真核基因组中,编码序列在染色体中的位置相对比较稳定,但一些中度重复序列往往是可移动的。 有些可移动成分的结构与原核基因组的转位因子相似,是通过DNA介导的。 而另外一些中度重复序列的转移成分则与一般细菌中的转移成分不同,要先转录成RNA,再逆转录生成cDNA,然后重新整合到基因组中,这种逆转录旁路的转移成分称为逆转录转座子(retroposon)。 (六)重复序列 重复序列中,除了编码rRNA、tRNA、组蛋白及免疫球蛋白的结构基因外,大部分是非编码序列。 它们的功能主要与基因组的结构稳定性、组织形式、以及基因表达的调控有关。 目前已经发现一些重复序列的特征与遗传病有密切联系,因此可以通过测定某些特定重复序列的重复次数而协助遗传病的诊断。 根据出现频率的不同可将DNA序列分为三类: 1.高度重复序列 在基因组中的重复次数 >105 2.中度重复序列 在基因组中的重复次数为101~105 3.单拷贝序列 在整个基因组中仅出现一次或少数几次 (七)端粒 以线性染色体形式存在的真核基因组DNA的末端都有
文档评论(0)