4一次数据库的查询.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4一次数据库的查询

生物信息数据库种类繁多,结构各异。如何快速、高效地对各种数据库进行查询,是数据库查询系统必须解决的问题。SRS系统采用了建立数据库索引文件的手段,较好地解决了这一问题。即使是含几百万个序列的EMBL数据库,只需几分钟即可实现整库查询,得到所需结果。此外,SRS系统具有查询结果相关处理功能,每次查询结果可作为进一步查询的子数据库,并可对其进行并、交等操作,对查询结果进行组合或筛选 2. 高效的查询功能 3. 灵活的指针链接 通过超文本指针链接实现信息资源的有机联系,是目前Internet信息服务的主要趋势。许多生物信息数据库均包含与其它相关数据库的代码,如SwissProt数据库中的蛋白质序列包含了该序列在EMBL、PDB、Prosite、Medline等其它数据库的代码。利用超文本链接,可将这些相关数据库联系在一起。SRS采用实时方式,根据查询结果产生链接指针,而不是在原始数据库中增加超文本标记,既节省了存储空间,也便于数据库管理 4. 方便的程序接口 将序列分析等常用程序整合到基本查询系统中,是SRS的另一个重要特点。用户可以对查询结果直接进行进一步分析处理。例如,查询所得的蛋白质序列,可立即用BLAST和FASTA查询程序进行数据库搜索,找出其同源序列;也可以用PrositeSearch程序,寻找功能位点;用ClustalW程序进行多序列比较 5. 开放的管理模式 在管理模式上,SRS采用了开放的方式。无论是数据库还是应用程序,均可进行扩充和更新。用户可在本地机上安装自己的SRS系统,并将自己的数据库添加到SRS系统中,并可与其它数据库实现超文本链接。也可自行编写应用程序,整合到SRS系统中 6. 统一的开发平台 SRS系统中所有数据库均以文件系统方式存放,通过预先建立索引文件实现数据库查询。因此它不依赖于Oracle、Sybase等商业数据库管理软件,便于推广使用。为建立索引文件,特别是对EMBL这样大型数据库建立索引,系统的内存和CPU资源需要满足一定的要求 Entrez由美国NCBI开发,用于对文献摘要、序列、结构和基因组等数据库进行关键词查询,找出相关的一个或几个数据库条目。该系统目前主要包括核酸序列数据库、蛋白质序列数据库、基因组数据库、蛋白质结构数据库、生物医学文献摘要数据库、系统分类数据库、人类遗传疾病和遗传缺失在线数据库,以及基因信息数据库、种群亲缘关系核酸序列比对数据库、表达序列标签数据库等。 Entrez系统 Entrez 是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。 因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。 Entrez系统  Entrez中核酸数据库为:GenBank, EMBL, DDBJ  蛋白质数据库为:Swiss-Prot, PIR, PFR, PDB  PubMed  基因组和染色体图谱资料 Entrez中的数据库包括: Entrez系统 检索领域:(Search Fields) 在WWW Entrez检索系统中,检索内容被分为许多小的领域,每一个检索领域包含以下信息: 进入(Accession): 包含进入号 相关性(Affiliation): 包括该检索领域建立时的相关信息,原作者地址,有时亦有其他作者地址 作者姓名(Author Name): 包含文章作者清单 E.C号(E.C.Number): 是酶学委员会命名的酶的编号 特征词(Feature Key): 描述DNA特征的关键词 基因符号(Gene Symbol): 基因的标准名称 杂志名(Journal Title):为检索条目第一次发表时的杂志名,该杂志名是以缩写形式储存于数据 库中,如果不清楚杂志是如何缩写的可采用List Terms来查看 关键词(Keywords):可以使用较特定的索引条目来检索以上数据库。类似于医学光盘检索 Medline UID : 是Medline对每一个条目给出的唯一识别标记 MeSH主题词(MeSH Terms): 包括 MeSH的主题词,下级主题词 MeSH主要关键词 (MeSH Major Topic):为检索条目十分重要的MeSH词目 Entrez系统 修改日期(Modification Date): 包含该条目进入Entrez的日期, 与出版日期一 样,以年/月/日形式出现 页数(Page Number): 该文章所在杂志的页码

文档评论(0)

busuanzi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档