2.4一级核酸数据库-02-GenBank真核生物核酸序列mRNA.pdf

2.4一级核酸数据库-02-GenBank真核生物核酸序列mRNA.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《生物信息学》第二章:生物数据库(第一部分) 一级核酸数据库:GenBank 真核生物核酸序列 mRNA 我们浏览真核生物的核酸序列。真核生物的基因与原核生物不同,是非线性排列的,也 就是基因里有外显子和内含子。因此真核生物核酸序列的数据库记录要要比原核生物复杂。 有时需要几条记录拼凑在一起才能描述出一个完整的基因。我们先来看看编码人 dUTPase 的成熟 mRNA 序列。成熟 mRNA 是已经剪切掉内含子,只剩外显子的序列,所以这条成熟 mRNA 序列和我们之前看到的原核生物的 DNA 序列从拓扑结构上看是几乎一样的,都是线 性的。输入这条成熟 mRNA 序列的检索号 U90223,搜索! 打开数据库记录,基本的注释内容和原核生物的差不多,这里只挑两点特别的地方说一 下。大家看到 KEYWORDS 后面只有一个点。这个点提示我们,数据库并不是完美的,所有 数据库都存在数据不完整的问题。再有,JOURNAL 后面我们看到是写的是未正式发表。但 事实上,这篇文章早在 1997 年就已经发表在 JBC 上了。因此,忠言逆耳:别指望 Genbank 或任何一个数据库能够百分百做到数据无误且实时更新。 Features里的注释内容与原核生物的数据库记录相似,CDS指出了从 63 到 821 是一 段编码区,在这段编码区里基因是连续的,因为是经过剪切后的成熟 mRNA,它将被翻译 成线粒体型 dUTPase 蛋白。下面/translation里给出的是计算机翻译出的该蛋白的序列。 在 Features 里还有两个新的条目之前没有见到过。sig_peptide和 mat_peptide。 sig_peptide,也就是 signal peptide,指出了编码信号肽的碱基的位置。信号肽决定了蛋 白质的亚细胞定位,也就是蛋白质工作的地方。mat_peptide,也就是 mature peptide,指 出了编码成熟肽链的碱基的位置。他从信号肽后面开始,到编码区结尾提前三个碱基结束。 编码区一直到第 821 号碱基,而编码成熟蛋白的最后一个碱基是第 818 号碱基,这中间差了 3 个碱基,那最后的这三个碱基干嘛去了呢?编码区的最后三个碱基是终止密码子,不翻译。 这条真核生物序列的 Genbank 注释看起来和原核生物的差不多,这是因为我们很小心的挑 了一条成熟 mRNA 的序列。

文档评论(0)

恬淡虚无 + 关注
实名认证
内容提供者

学高为师,身正为范.师者,传道授业解惑也。做一个有理想,有道德,有思想,有文化,有信念的人。 学无止境:活到老,学到老!有缘学习更多关注桃报:奉献教育,点店铺。

1亿VIP精品文档

相关文档