- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
cogs类编码蛋白的结构分析
在分子进化研究中,作为每个谱系的一个或两个基因(磷酸、钠、氨基酸序列等)作为一个特征分子,并使用这些特征分子之间的差异来代表整个谱系之间的距离。然而,一种或多组分子只是整个重组的一部分。正如所示,很难代表森林。这些特征分子也很难代表整个重组过程。不同的资源分子很难选择,因此很难获得不同的发展结果。一些研究人员还建议使用整个重组过程的信息来建立一个系统发育树。
我们发展了一种新的基于全基因组信息构建系统发育树的方法.基于美国国家生物技术信息中心(NCBI)的COGs(clusters of orthologous groups of proteins)的17个功能分类,对每一个基因组的每一个基因,都用一个17维的矢量来描述其相应蛋白质序列隶属于17个COGs类的程度;而与一个基因组的所有基因相对应的那些矢量就组成一个集合(17维矢量的定义方法详见Ling等待发表于《Molecular Phylogentics and Evolution》).
由于基因组间的大小差别很大,所含的各种信息的多少和特征对进化的重要程度不一样,如何将这些信息间的差异准确地转化为基因组间的距离,对构建接近真实情况的进化树,无疑是十分重要的.特别是,17个COGs类代表不同的生物学功能,它们对生物进化的重要程度显然也是不平权的.因此,若直接用上述集合间各维平权的欧氏距离来代表基因组间的距离,必然有一定的偏差.基于这种考虑,我们对上述属于各基因组的矢量集合进行了Fisher线性变换.而Fisher线性判别函数是一种最优化的判别准则,它使得变换后集合间样本分得更开,集合内样本更密集(集合中任一矢量就是这个集合的一个样本).经过这样的变换,相当于寻找一种最优化的权重因子,使得变换后17个COGs类对基因组进化的重要程度得到更准确的反映.同时,由于那些横向迁移来的基因与内源基因明显有很大的不同,它们通常就是使得集合的方差很大的样本.经过Fisher线性变换后,集合内样本变得密集,即集合的方差变小,意味着有效地降低了基因横向迁移对整个基因组的影响.
1 建立结构矩阵并进行距离矩阵并进行真实生命之树的意义,并将二者通过一个前充模型的位置直接画进了真实生命之树的距离矩阵,并将其作为真实生命之树的距离打上看去,并将其作为真实生命之树的一种统计推理,并将其作为真实生命之树的距离矩阵
,各基因组的基因信息来自GenBank数据库中相关的*.gbk文件.选取的38个和43个基因组的信息见表1.按以下步骤构建进化树:
(1)依Ling等的方法构造每一个基因对应的17维矢量:
ν=(ν,ν,?,ν)ν=(ν,ν,?,ν)
(2)计算任两个基因组之间的Fisher参数ω*ij,ω*ij是对方程:
S?1ωijSbijω?ij=λω?ijSωij-1Sbijωij*=λωij*
(3)对每两个基因组样本的中心作变换(因为是线性变换,所以相当于对每一个样本求变换后再求中心):
yi=ω*Tijmiyj=ω*Tijmjyi=ωij*Τmiyj=ωij*Τmj
其中,mi是第i个集合的中心,yi是该基因组相应的映射空间的中心.
(4)求任两个基因组之间的距离:
dij=|yi?yj|dij=|yi-yj|
(5)将(4)得到的距离作为两个基因组之间的距离,用PHYLIP软件包的Neighbor joining缺省参数画进化树,它实际上是一种基于距离矩阵对真实生命之树的一种最优化的统计推断.再用treeview软件(http://taxonomy.zoology.gla.ac.uk/rod/rod.html)显示.
2 结果
2.13 真核的瑶河聚类
38个基因组的全称和缩写见表1中的前38个,构建出的进化树见图1.
从图1可以看出这38个基因组明显地分成三大支,除Mtub,Halo,Aper三个例外,6个古细菌、23个真细菌和6个真核都分别聚类在三个不同的分支中,在图1中分别标记为1,2,3三支.
a.在古细菌这一分支中:分别聚类成4,5两支,几个嗜热的生物:詹氏甲烷球菌(Mjan),热自养甲烷杆菌(Mthe), 嗜酸热原体(Taci),Pyrococcus abyssi(Paby),Pyrococcus horkoshi(Phor)聚类在同一分支5中,另一个嗜热的硫代谢古细菌闪烁古生球菌(Aful)和一个叫结核分枝杆菌(Mtub)的真细菌聚类在另一分支4中.文献报道Mtub与其他真细菌有明显的不同,我们的结果支持这种报道;而文献曾报道硫代谢古细菌与其他古细菌分成两支,我们的结果印证了这一点,但它不是真核的姊妹分支.在分支5的几个嗜热生物中,Mjan是从潜水艇热水排放口获得的一种极端嗜热的产烷生物,Mthe是一种嗜热的甲烷杆菌,它们都是与烷相关的生物,因此又聚
您可能关注的文档
最近下载
- 浅谈初中物理教学语言严密性.doc VIP
- 高压配电柜日常维护保养方案.docx VIP
- 国考物理化学真题及答案.doc VIP
- 强制氧化-尿素还原法(FO-UR)烟气脱硝成套技术.doc VIP
- 2024年江苏赛区复赛“扬子石化杯”第38届中国化学奥林匹克(初赛)选拔赛暨化学试题含答案.pdf VIP
- 招标代理服务技术方案104页.docx
- 政府采购项目招标代理机构服务投标技术方案(技术标).pptx VIP
- 2025至2030中国建筑信息模型(BIM)行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2024广东建设职业技术学院招聘笔试真题含答案详解.docx VIP
- 公司法中董事对第三人责任的性质界定与归责原则研究.docx VIP
文档评论(0)