不同类型原核生物基因组编码蛋白基因组成及进化特征分析-微生物学专业论文.docxVIP

不同类型原核生物基因组编码蛋白基因组成及进化特征分析-微生物学专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不同类型原核生物基因组编码蛋白基因组成及进化特征分析-微生物学专业论文

山东师范大学硕士学位论文 山东师范大学硕士学位论文 万方数据 万方数据 万方数据 万方数据 不同类型原核生物基因组编码蛋白基因 组成及进化特征分析 中文摘要 原核生物是一类由没有真正细胞核的细胞组成的单细胞或多细胞的低等生物,基因 组大多较小,一般由一个单一的 DNA 分子组成,编码区在基因中所占比例很高,因此 原核生物蛋白质编码基因成为原核生物基因组相关研究的重要载体。随着测序技术快速 发展,基因组数据呈指数增长,有研究发现 GC 含量相近的原核生物基因组中蛋白质编 码基因具有较高的共性特征,而 GC 含量相差较大的基因组展现出不同的蛋白质编码基 因特征。同时,越来越多的基因组数据表明在有些原核生物基因组中含有多条染色体, 有些还具有 1 到多个质粒。而目前对原核生物基因组大、小染色体以及质粒之间相互进 化关系的研究很少,仅有的研究还存在分歧,有的研究认为小染色体与来源于大染色体, 而有的研究认为小染色体起源于质粒。本课题从基因组角度对不同 GC 含量原核生物基 因组中大、小染色体以及质粒之间的蛋白质编码基因组成及序列特征进行了系统对比分 析,结果发现相对于质粒而言,大、小染色体有更多相似的蛋白质编码基因序列特征, 因此本文可为今后三者之间进化研究提供可靠的方法和理论依据。论文工作主要包括: 1. 基于 RefSeq 数据库,构建了由 54 个不同 GC 含量的原核生物基因组构成的数据 集。数据集中所有的基因组都至少含有 2 条染色体和 1 个质粒。对各基因组大、小染色 体和质粒中蛋白质编码基因长度分布统计表明,大、小染色体中长度为 500 ~ 999 bp 蛋 白编码基因分布最为广泛,其次是长度为 1 ~ 499 bp 与 1000 ~ 1499 bp 的基因,进一步 分析表明有些 GC 含量较低的小染色体中的基因长度集中在 1 ~ 499 bp;相比之下,质 粒中蛋白编码基因长度的分布范围差异较大。对各基因组中大、小染色体和质粒中蛋白 质编码基因 GC 含量的分布统计发现,大多数大、小染色体中基因的 GC 含量分布更为 相似,且多质粒基因组中各质粒之间的 GC 含量分布有的差异较大。进一步将 54 种基 因组各组分的 GC 含量与该基因所在基因组的 GC 含量比较发现大、小染色体中基因的 GC 含量与基因组的 GC 含量差异较小,质粒中基因的 GC 含量有的与基因组 GC 含量 相近,有的则相差较大,而且即使同一物种中的质粒也展现出明显不同的基因特征。 2. 为了分析各基因组中大、小染色体和质粒中蛋白质编码基因进化特征,本文对 I 54 个基因组大、小染色体以及质粒中蛋白编码基因进行了同义密码子偏好分析。RSCU 值分析表明,大染色体与小染色体展现出更多的共同偏好同义密码子数目。进一步对各 组分中起始密码子与终止密码子的使用情况分析发现,大、小染色体与质粒对起始密码 子 AUG 的使用有显著偏好,终止密码子 UAA 和 UGA 的使用随基因组 GC 含量变化较 UAG 明显。在高 GC 含量基因组中部分质粒对终止密码子 UGA 的使用频率略低于大染 色体和小染色体的使用频率,对终止密码子 UAG 的使用频率则略高于大染色体和小染 色体。蛋白质编码基因中 CAI 与对应分析维度 1 的相关性分析表明,54 个物种基因组 各组分中显著相关所占比例分别为 68.52%、73.44%与 61.06%。GC3s 与维度 1 的相关性 分析表明,54 个基因组中大、小染色体以及质粒中显著相关所占比例分别为 83.33%、 79.69%以及 91.15%。这些结果说明各组分中基因表达水平和 GC3s 是影响密码子使用模 式的主要因素。在 54 个基因组中大、小染色体以及质粒 GC3s 与 CAI 显著相关所占比 例分别为 18.52%、34.38%以及 36.28%,表明基因组各组分中一定比例基因的表达水平 与碱基组成存在联系,二者共同作用于密码子使用模式。因此,密码子偏好分析结果说 明,大多数染色体的密码子使用模式在受到一种主要因素的影响的同时有多种因素共同 作用,这些因素对不同组分密码子使用模式的影响程度是不同的,在大部分物种中碱基 组成与基因表达水平都是影响密码子使用的主要因素,但在质粒中碱基组成的影响力更 强。 关键词:原核生物基因组,大染色体,小染色体,质粒,编码蛋白基因 分类号:Q937 II Composition and evolution analysis of protein-coding genes in different types of prokaryotic genomes Abstract Prokaryote is a class of lower organism that consists o

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档