生物信息学 第五章.docVIP

  • 6
  • 0
  • 约1.17万字
  • 约 10页
  • 2017-08-18 发布于江西
  • 举报
生物信息学 第五章.doc

第五章 生物数据库的信息检索 Andreas D Baxevanis 国家人类基因组研究学会,基因组技术部 国家保健学会 马里兰州,Bethesda 如第二章所述,建立GenBank是为了适应人类基应组工程等科学研究产生的大量序列数据的信息爆炸。总的来说,GenBank是带有注释的公用DNA,蛋白质序列的集合。写作本书时,GenBank中有160万条链的纪录,含超过10亿个核苷酸碱基。向GenBank存入新的序列有两种方法:通过Sequin和BankIt等工具直接提交,或通过国际核苷酸序列数据库的组成部分GenBank,EMBL,和DDBJ等相互之间传递数据的共享协议。关于提交工具及这种数据协作的性质的进一步的信息参见第14章。 GenBank或其他任何有关的生物数据库必须容易查找而且查出的记录的格式便于使用??,否则就不会有很大的用处。??另外,因为总的来说生物学界还不能有效的利用隐藏在这些上百万的碱基及氨基酸之中的信息,排序的工作也没有很大的用处。为了使这些数据对于一般的使用者容易利用而做过很多努力,这些工作的结果--程序和界面是本章的重点。因为这些更通用的数据库与生物学家通常使用的那些数据库相差很远,所以本章的论述集中在如何查询NCBI数据库上,但是本章同时也注意到一些较小的较专门的数据库,它们提供的信息在GenBank中未必能找到。 检索数据库记录:检索服务器 查询NCBI

文档评论(0)

1亿VIP精品文档

相关文档