Yesat基因组编码区特征参数研究.pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生糟糟理学报 第十七卷 第三期 二o0一年九月 ACTA B10PHYSICA SINICA Vo1.17 N0.3 Sept-2001 Yeast基 因组编码 区特征参数 的研究 张 额 , 李 宏 , 吕 军 , 罗辽复 (内蒙古大学理论舒理和理论生舒舒理研究室 ,内蒙古 呼和浩特 010021) 摘要 :以碱基成分偏移量D 值 0为基本参数定义参数 d,以 d为 Yeast螭码区的特征参数,对 Yeast的第 1、2、3类 ORF(openreading~rame)进行 了统计 .得到 d的特征参数 区间。并且 ,以此 区间为标 准对 Yeast的6类 oRF,以厦 5帽、3尾 、内舍子、组分随机序 列等非螭码序列进行 了检 验 。站秉表唧I,用 d作蝙码 区的特征参数是可行的,它可 以很好地 区分螭码序列和非螭码序列 。另 外 ,叉讨论 了参敦 d与基 目表遗 书平(用CAI值束衡量)的关系。发现 .参数 d与基 田表遗书平成 很好 的正相关关系;发现 密码子 的第 l位点和 第2住点的某些碱基分布与基 目表遗书平有关。 关■词 :Yeast基 因姐 ;蝙码 区;碱基成分偏穆 ;正相关 中硼分类号 :Q617 文t标识码 :A 文章冀号 :1000—6737(2001)03—0535—07 随着基 因组研究的不断进展 ,现已完成 了数十种原核生物细菌 和数个真核生物基 因组 DNA全序列 的测定工作 ,如大肠杆菌 (Escherichiacoli)、酵母 (Saccharomycescerevisiae)和 线虫(Caenorhabditiselegans)。到 2002年对果蝇 、2003年对人类 、2008年对小 鼠的全基 因组 序列 的测序也将完成 。但是 , 目前 已经完成和正在实施 的基 因组计划给人们 留下 的只是一部 “天书”。如何读懂这部 即无段落又无标点的 “天书”,已成为研究的重点。理论上对 DNA全序 列的分析主要是探讨寻找新基因的理论方法 ,而在这个方法确立之前,对 已知基因即编码序列 的特征进行分析 就显得很有 必要 。 Yeast已知 的0RF中,分成 6类 。第 1类 ORF是指有确定蛋 白质对应 的核酸序列 :第 2 类 ORF是指与已知蛋 白质强相似 的核酸序列 ;第 3类 ORF是指与已知蛋 白质弱相似 的核酸 序 列 ;第 4类 ORF是指与未知蛋 白质强相似的核酸序列 ;第 5类 ORF是指与未 知蛋 白质 弱 相似的核酸序列 ;第 6类是指有疑 问的ORF。我们选取 Yeast全基 因组数据库 中编号 以 “Y” 打头的 (如 :YALO01c,YBR299w等)第 1、2、3类 3587个 ORF作为统计对象 。得到 Yeast编 码 区的特征参数 ,从而试 图去预测 Yeast中尚未发现 的ORF是编码 区的可能性 ,或预测 Yeast中 6类 已知的 ORF中非真实基 因编码 区的可能性 ,并将 此方 法进一步推广去预测其它 生物基 因组 的编码 区 。 1 特征参数 的选取 文献 【2,3】用偏好模分析法 ,以对独立序列的偏离 Lk 为参数 。判定外显子 中存在三重性 读码框架 ,而 内舍子 、5帽、3尾等非编码 区不存在读码框架 ;文献 【4,5]又引入关联谱分析法 , 对关联 函数 C(r)进行谱分析 。发现编码 区的谱 P(k)在 k=N/3处存在峰 .表明碱基在密码子 收奠 日期 }2o00—12—1B 基套疆 茸;国寡 白鼻!;辩学基金赍助项 目 作者蕾介 :张囊 -1973年生,硬士研究生,电话 }(0471)6519888,E—mailq.ujun8210~263.1let 生 物 杨 理 学 报 2001整 的三个位 点上 的不 均 匀分 布 ;文 献 【6,71定 义 了非 均 匀指 教 HI(Z),进 而定 义 了 L,r,, 、 Fffj={ ,发现编码区F(z)在z=3时取极大值,表明编码区的三重读码框架。 J 一 1 , 由于不 同的氨基酸及其不 同的同义密码子使用频率各不相 同,导致 了在编码序列

文档评论(0)

nnh91 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档