- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 基因组学和基因识别;6.1 原核基因组;基因测序
DNA测序方法自20世纪80年代中期以来都没有本质上的突破。
测序中很少产生长度大于1000个核苷酸的连续片段。
因此,可以想象要确定一个典型的原核生物基因组的全部序列是一件怎样繁琐的任务。比如大肠杆菌的基因组由单一的环状染色体组成,长460万个碱基,为了得到全基因组序列,至少需要进行4600次测序反应。然而事实上需要更多次反应。;组装重叠群原理
由于现在还不能直接测定整个分子的序列,所以我们只能通过序列拼接来完成序列的测序任务。通过多次反应来检查重要的重叠区域。这些序列片段覆盖待测序列,并且序列片段之间也存在着相互覆盖或者重叠。先前测定的特异性片段(STS——序列标签位点、ETS——表达序列标签等)有助于排列序列信息。; 我们需要区分出哪些基因表达而哪些基因不表达;
需要识别转录为RNA的DNA区域的起始和终止部位;
需要区分RNA中被核糖体翻译成蛋白质的区域的起始和终止部位;;6.2.1 启动子元件;大肠杆菌中的7个σ因子
;6.2.1 启动子元件;许多基因的蛋白质产物需要与其他基因的蛋白质产物结合在一起才能发挥作用。原核生物中普遍存在一个现象,即功能相关的基因排列成操纵子。
操纵子:转录的功能单位。很多功能上相关的基因前后相连成串,由一个共同的控制区进行转录的控制,包括结构基因以及调节基因的整个DNA序列。主要见于原核生物的转录调控,如乳糖操纵子、阿拉伯糖操纵子、组氨酸操纵子、色氨酸操纵子等。
只有原核生物存在操纵子结构,真核生物不含操纵子。;单独的调控蛋白;乳糖操纵子的调控过程;乳糖操纵子的调控过程;6.2.2 开放阅读框;6.2.2 开放阅读框;6.2.2 开放阅读框;6.2.3 假想翻译;6.2.4 终止序列;6.2.4 终止序列;6.2.4 终止序列;6.3 原核基因组中的GC含量;6.3 原核基因组中的GC含量;6.3 原核基因组中的GC含量;6.4 原核基因组密度;6.4 原核基因组密度;6.5 真核生物基因组;6.5 真核生物基因组;6.5 真核生物基因组;真核生物基因组测序工程;6.6 真核生物基因组结构;6.6 真核生物基因组结构;6.6.1 启动子元件;6.6.1 启动子元件;6.6.1 启动子元件;“TATA”框
定义:真核生物启动子中可以与RNA聚合酶Ⅱ紧密结合的序列。存在于转录起始点前的约25个核苷酸处(-25位)。决定转录起始点的准确位置。
其共有序列为:5′-TATAWAW-3′,这里W代表A或T以相同的频率出现在该位置。
;6.6.2 调控蛋白结合位点;6.6.2 调控蛋白结合位点;6.7 开放阅读框;6.7 开放阅读框;6.7.1 内含子和外显子;所有内含子序列5’端起始的两个核苷酸总是5’- GU -3’,而3’端的最后两个核苷酸始终是5’-AG-3’。;基因组中内含子的分布没有严格可循的规则,但是简单的真核基因组中内含子一般出现的比较少,而许多脊椎动物的基因中内含子是一个非常普通的特征,人类 95% 的基因中含有内含子。
除剪接所需要的序列之外,内含子的长度和核苷酸序列几乎不受选择性限制。
内含子在给定基因中的位置具有进化保守性,在同源基因的序列比对中内含子经常出现在相同的位置。;6.7.2 可变剪接;6.7.2 可变剪接;6.8 真核基因组中GC含量;6.8.1 CpG岛;6.8.1 CpG岛;6.8.1 CpG岛;组蛋白是真核细胞中的一种通常带正电的保守性较高的蛋白质,它们与带负电的 DNA 分子具有高度的亲和力。在真核细胞的细胞核中,DNA 和紧密关联的组蛋白大约以等质量混合形成染色质。
DNA 缠绕在组蛋白上,组蛋白进一步组织,最后将和基因组 DNA 压缩成约为原先长度的万分之一。
在转录活性区域中,乙酰基的加入使得正电荷减少,组蛋白和DNA亲和力下降,从而导致染色质压缩程度减轻,便于转录。这种打开的染色质区域称为常染色质。与之对应,转录失活并紧密压缩的区域称为异染色质。
;6.8.2 等值区;6.8.2 等值区;6.8.2 等值区;6.8.3 密码子使用偏性;6.8.3 密码子使用偏性;6.9 基因表达;6.9.1 cDNAs和ESTs; 由真核细胞中分离的RNA得到cDNA的过程可以简单的表示为下图;6.9.1 cDNAs和ESTs;6.9.2 基因表达的串行分析;6.9.2 基因表达的串行分析;6.9.3 微阵列;6.10 转座;6.10 转座;6.11 重复元件;串行重复DNA本身也可以分成两类:
(1)卫星DNA:真核细胞染色体具有的高度重复核苷酸序列的DNA。总量可占全部DNA的10%以上,主要存在于染色体的着丝粒区域,通常不被转录。因其碱基组成中 GC 含量少,具有不同
文档评论(0)