生物信息学_第六章.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 NCBI数据模型 前言 数据模型 什么是数据模型 生物学家大都熟悉用动物模型来研究人体疾病。尽管人体疾病有可能在动物中找不到完全相同的形式,但某种动物疾病和人体疾病有相当多的类似性质使我们可以从动物疾病中获得的数据来推断人体的疾病过程。通过将肌肉想象成弹簧和水压活塞的组合,将骨骼想象成杠杆臂,可以得到描述肌肉骨骼运动的数学模型。这样的模型可以对更多复杂的生物系统进行有意义的预测和检验。显然,如果模型与描述的实际现象可以更加接近或精致,则它对所模拟的自然现象的预测和理解就更有意义。 八年前,NCBI介绍了一种新的序列相关信息模型。这种新模型使基于Entrez系统的完整数据库GenBank的建立以及相应的软件得到快速的发展。该模型具有如下优点:它能轻而易举的从已公布的说明的DNA序列映射到编码蛋白,到基因的染色体设计,到三维蛋白质的结构(见第5章)。该模型的优点对生物学家使用Entrez有很大的帮助。但是很少有生物学家了解该模型的基础。当基因信息变得越来越丰富,越来越复杂的情况下,出现了很多符合 GenBank数据,且模型本身更好理解的实际数据模型。这一章不深入讨论细节,只介绍一些实用的索引及NCBI模型所起的作用。 模型的一些例子 GenBank数据是以DNA为中心角度的数据报告(见第2章),也就是以CDS特征为代表的一段编码蛋白质的DNA序列。限定符/translation=MLLYY描述了将CDS特征翻译成的氨基酸顺序。其它的DNA特征(例如mat-肽)有时被GenBank数据应用来描述未命名蛋白质(部分由/translation描述)的切分产物,但这不是一种令人满意的解决方法。相反,大多数蛋白质序列数据库以蛋白质为中心角度,这样可能完全失掉其与编码基因之间的联系,或者只是间接的用序列号表示其联系(这并不提供准确的对基因突变分析有重要作用的密码子--氨基酸对应关系)。 NCBI数据模型直接构造了包含DNA和蛋白质序列的模型。翻译的过程是由两种序列间的关系决定而不是由一种对另一种的解释确定。和蛋白质相关的注解(例如肽切分产物)是由蛋白质序列特征直接注释。这样,用BLAST或其他序列搜索工具去分析由CDS特征得到蛋白质序列就变容易了,尽管返回基因时可能会丢失精确的中间联系。一组DNA序列和由它翻译的蛋白质被称为核酸—蛋白质组,它是NCBI为使用这些数据的中间数据。GenBank数据格式只是人类可读的一种特殊数据形式。它失去了有联系的序列集合,而倒退回比较熟悉的那种序列(以DNA为中心的视角)。Entrez的目标是更直接的反映数据的低层结构。由BLAST实现的从GenBank到蛋白质序列的翻译实际上是从蛋白质—核酸组得到蛋白质序列。 Part A: LOCUS RNKOR1 1757bp DNA ROD 25-MA-1995 DEFINITION Rattus norvegicus kappa opioid receptor gene, exon 1 and 2. ACCESSION U17993 NID g727256 KEYWORDS . SEGMENT 1 of 3 … LOCUS RNKOR2 658bp DNA ROD 25-MA-1995 DEFINITION Rattus norvegicus kappa opioid receptor gene, exon 3. ACCESSION U17994 NID g727257 KEYWORDS . SEGMENT 2 of 3 … LOCUS RNKOR3 4048bp DNA ROD 25-MA-1995 DEFINITION Rattus norvegicus kappa opioid receptor gene, exon 4 and complete cds. ACCESSION U17995 NID g727258 KEYWORDS . SEGMENT 3 of 3 Part B: LOCUS RNKOR 6463bp DNA ROD 25-MA-1995 DEFINITION Rattus norvegicus kappa opioid receptor gene. ACCESSION ZZ123456 NID g2182225 KEYWORDS . SOURCE Norway rat. ORGANISM Rattus norvegicus Eukauyotae; mitochondrial eukaryotes; Metazoa; Chordata; Vertebrata; Eutheria; Rodentia; Sciurognathi; Myomorpha; Muridae; Murinae; Rattus. REFERENCE 1 (base

文档评论(0)

一天一点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档