- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
原核生物系统发生关系的k串组分距离研究
由于缺乏形态特征,原核生物系统分类成为微生物的面临挑战。20世纪70年代,w地壳等人通过在核糖体上形成小亚甲基钠序列(ssurrna)后,他们证实了系统的关系,并取得了突破。古细胞菌和它们支持着生命领域的三个超边界:老细胞菌,它们支持着绿色身体和瘦长神的内部环境。这是rrna结构树研究的主要成就。建立基于surrna的分子系统生成树是基于斯urna的。在《伯杰系统细菌学手册》(第二版)中,“基于分析不规则程度序列的系统生成框架是基于斯urrna的非表面特征的。”(参考)。
然而, 近年来对单独使用SSU rRNA推断系统发生关系的可靠性产生了质疑.这些大约有1500 bp的核苷酸序列, 不可能提供足够的系统发生信息来分辨生命之树的所有分支, 甚至有证据表明这些保守的RNA也可能存在水平转移.此外, 自1995年开始不断增加的原核生物完全基因组, 对分子系统发生关系的分析带来更多的问题.因而现在的一般看法是, 不同的基因反映不同的历史, 基因树不能等同于物种树.特别是在分子系统发生学上, 基因横向传递和世系之间保守基因的丢失已经成为讨论的热点.为了充分利用不断增加的基因组数据, 最近发展出许多基于全基因组的方法.介于使用单基因和全基因组两种极端之间, 还提出了基于联合蛋白质序列的方法.不过, 所有这些方法在不同阶段或明或暗地需要序列联配和打分方案, 因此依赖于许多参数和微调.
为了避免序列联配和对基因的特殊选择, 我们发展了一种基于K串的组分距离方法, 从完全基因组出发推断系统发生关系.该方法已被成功地应用于原核生物、叶绿体和冠状病毒的进化研究.然而, 使用完全基因组数据同时也可以视为这种方法的缺点.因此, 文中我们采用两组蛋白质, 它们包含的系统发生信息可能十分不同.核糖体蛋白质和rRNA交织成复合大分子, 作为一个整体来行使功能, 因此它们不易与别的物种发生横向传递.用连接核糖体蛋白质序列的方法很自然地产生合理的系统发生关系.相反, 氨酰tRNA合成酶作为独立的分子行使功能, 在不同物种之间发生横向传递没有很大障碍.事实上, 人们已经知道它不适合用于系统发生推断.如果单独使用20种不同的氨酰tRNA合成酶产生20种不同的树, 有一些甚至不能区分开生命之树上古细菌、细菌和真核生物三个超界[17~19].然而我们的结果表明收集一个物种所有的氨酰tRNA合成酶可以产生与核糖体蛋白质树和全蛋白质组树相一致的系统发生树.
本文的目的有三个方面.第一, 说明组分距离方法不必要求完全蛋白质组数据, 选取一个合适家族的蛋白质序列也可行.第二, 提供一种新的分子系统发生分析方法, 它独立于但支持基于SSU rRNA序列的“标准”方法.第三, 代替仅仅使用自举法或刀切法的稳定性和一致性测试, 通过与细菌分类学结果的严格比较, 验证这种新方法.
1 trna共聚合成酶链的计算
在NCBI数据库中存在两套原核生物基因组, 一套位于Ganbank目录下, 是作者提交的原始序列;另一套经NCBI人员重新整理和注释过, 索取号带有前缀NC_以示区别.我们使用后一套中所有的原核生物完全基因组, 截止日期到2003年6月10日;除去一个物种Pasteurella multocida, 因为在它的注释中没有核糖体蛋白质和氨酰tRNA合成酶的信息.附录中给出物种名字、缩写、NCBI索取号以及在《伯杰手册》中的位置.
我们采用基于K串的组分矢量方法计算距离矩阵, 见文献, 因此, 下面只给出方法的简洁概述.第一步, 从一个蛋白质家族或者完全基因组中收集所有的氨基酸序列.第二步, 计算定长为K的寡肽出现的频度.为了减弱在分子水平上随机中性突变的影响和突出选择进化的后果, 用 (K-2) 阶的Markov模型从这些频度中减除随机背景.第三步, 将这些规范处理后的频度按固定次序排放, 为每个物种形成一个20K维的组分矢量.第四步, 物种A和B的相关性C (A, B) 由两者的组分矢量之间的夹角余弦决定.因此, 如果两个矢量相同, 则相关性最高, C=1;如果它们没有共同的组分, 则相关性C=0, 两个矢量成正交关系.最后, 两个物种之间的距离可以定义为D= (1-C) /2.一旦获得了距离矩阵, 则采用标准方法, 如Phylip软件包中的邻接算法来构建亲缘树.随着K值的增加和对蛋白质序列再抽样检验, 树的拓扑结构也趋于稳定.关于统计检验和方法的更多介绍参看文献[13, 14].
2 种间竞争:从属性到结构性
图1为基于核糖体蛋白质的亲缘树, 基于氨酰t RNA合成酶的亲缘树见图2.计算包括所有123个物种, 然而由于相同种的不同菌株和同一属下不同的种总是形成一组, 因此在最后的图中仅仅保留了每个属下的一个物种作为代表.因此, 图
您可能关注的文档
最近下载
- 精品解析:浙江省温州实验中学2024-2025学年七年级上学期期中测试数学试卷(原卷版).docx VIP
- 世界现代设计史ppt【第四章】王受之、 陈鸿俊.pptx VIP
- 有创动脉血压监测.pptx VIP
- 对称微分算子扩张问题的深度剖析与应用探索.docx VIP
- GB50193-93(2010年版)二氧化碳灭火系统设计规范.pdf VIP
- 拖拉机及农机驾驶证复习资料题库(B).docx VIP
- 中考语文二轮复习讲练测(浙江专用)专题15议论文阅读综合(讲练)(原卷版+解析).docx VIP
- 世界现代设计史ppt【第二章】王受之、 陈鸿俊.pptx VIP
- 定向行走理论试题分析及答案.doc VIP
- 失眠症诊断和治疗指南(2025版)解读.pptx
原创力文档


文档评论(0)