原核生物与真核生物的比较研究.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
原核生物与真核生物的比较研究 地球上的生物在形状和生活方式上是不同的,但基本的生化过程是相同的。当生物发展时,他们发现遗传密码是统一的,这就表明生物有共同的祖先。以前的分类分类可以作为进化过程的参考。岩石学的发展有助于理解物种的亲和力,尤其是大量的钠和蛋白质数据积累,因此可以从分子层面反映亲和力。 20世纪70年代,Carl Woese等在分子研究的基础上提出原核生物分为2个大的类别:细菌和古细菌.他建议把原核生物再分两界.后来分子系统树的研究已涵盖了原核生物与真核生物的大部分门类,并揭示出建立在表型比较方法上的系统树所无法显示的物种之间的关系与进化规律.这一研究引起很大争论,目前生物界有二界,三界,五界,六界,八界之争. 目前的系统树构建中,比较特征(序列间的距离的确定)主要用联配的打分方法.本文提出一种比较2个基因序列的统计方法,用它分析细菌和古细菌. 1 窗口滑动地生成的窗口字 字母表:字母表指1个集合,它的每个元称为字母.例如Δ={a,t,g,c},我们就称Δ为4字母的字母表. 字:指由字母表中的字母构成的给定长度的符号串.若字母表有t个元.给定的长度为l,则长为l的字的种类数为tl. 窗口和窗口字:给定长度l,我们就得到长度为l个单位的窗口.其中每个单位允许填入1个字符.当所有单位都填满后.我们就得到1个字.称为窗口字. 窗口滑动:写出符号串S,给定长度l的窗口,将这个窗口的第1个单位与S的首字符对齐,第2个单位与S的第2个字符对齐,……,第l个单位与S的第l个字符对齐,并把这些字符填入对应单位中,这样就得到一个窗口字.下一步,将窗口的第1个单位S与的第2个字符对齐,第2个单位与S的第3个字符对齐,……,第l个单位与S的第l+1个字符对齐,并把这些字符填入对应单位中,得到另一个窗口字.这时称窗口滑动了1个单位.继续滑动,直到窗口的第l个单位与符号串的末字符对齐,这时得到最后一个窗口字. 特征矩阵:给定长度为l,由一个字符序列用窗口滑动的办法可以得到一组窗口字.统计各不同种类的窗口字可以得到1个2×tl的矩阵W.W的第1行记录这个字符序列中在窗口滑动地过程中出现的不同种窗口字,第2行记录对应窗口字的数目.称W为S的关于l的特征矩阵. 不同物种的特征矩阵不同.预示可以用之分辨序列.如果假定序列的相似性反映物种的发生学亲近程度,则比较序列就是比较物种. 对2个特征矩阵进行比较,可得它们所对应的序列之间的差异.称为距离.距离d(l,t)定义为 d(l,t)=D(l,t)/N(l), (1) N(l)是归一化数,大小为被比较的2个序列的窗口字数的总和.它与l有关,如N1和N2分别为2序列所含字母数,则 N(l)=N1+N2-2l+2, (2) D(l,t)是2个序列的差异的绝对数量 D(l,t)=∑i=1tl|n1i?n2i|,(3)D(l,t)=∑i=1tl|ni1-ni2|,(3) n1ii1表示序列1的特征矩阵的第i种窗口字的数目,n2ii2表示序列2的特征矩阵的同种窗口字的数目. 于是 d(l)=1N1+N2?2l+2∑i=1tl|n1i?n2i|,(4)d(l)=1Ν1+Ν2-2l+2∑i=1tl|ni1-ni2|,(4) 这个式子的意义是给定l时2个序列的有差异的窗口字占序列总窗口字数的比例,显然是一个标度不变量.可以作为衡量2个序列差异的特征. 2 种植物的结构特征 对1组基因序列,可以利用上述方法两两求出序列之间的距离,得到距离矩阵.然后可以作系统树.用EMBL中的29个物种的16sRNA由最大邻接方法作图,物种如下:1.Aeropyrum pernix TB1,2.Aeropyrum pernix TB7,3.Aeropyrum pernix,4.M.fervidus 16S rRNA,5.M.thermoautotrophicum (DELTA H),6.Methanococcus jannaschii,7.Pyrococcus horikoshii,8.S.solfataricus,9.T.tenax,10.Aquifex aeolicus,11.B.burgdorferi (297 strain),12.Bacillus subtilis,13.Bradyrhizobium japonicum PRY65,14.C.pneumoniae,15.C.ulcerans,16.Chlamydia trachomatis,17.Chlorobium limicola UdG 6002,18.D.radiopugnans,19.E.coli ,20.Flavobacterium heparinum,21.H.aurantiacus 16S,22.H.influenzae 16S,23.H.p

文档评论(0)

xlwkyc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档