网站大量收购独家精品文档,联系QQ:2885784924

实验报告 生物医学数据集成检索系统实验.docxVIP

实验报告 生物医学数据集成检索系统实验.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验报告 生物医学数据集成检索系统实验

生物医学数据集成检索系统实验 实验摘要 4.1 前言 4.2 技术架构 技术架构如图所示: 从整体系统大致可以分为四个层,它们分别是:基础层、数据层、应用层和接口层。系统主要接受和处理来自Oracle数据库、MYSQL数据库数据和文本文件数据,经过处理和归一后存入全文资源库。提供基因、蛋白质、疾病、药物、化合物和文献的检索与浏览功能。 4.4 检索与存储设计 知识抽取的结果是知识库的构建。通常是根据所定义的Ontology框架,从一系列文献中抽取出来的相应的实体,并且将这些文献和抽取出来的实体组织到知识库之中,实现本体的填充(Ontology Population)。所建设的知识库是进一步实现数据挖掘、知识发现的基础。 科研对象和关系的本体库构建基本上可以分为三个部分,即:本体存储、科研对象实例存储以及关系实例存储。我们设计了科研对象和关系实例存储数据库,并在mysql数据库中加以实现。 4.4.1 全文检索 系统采用SIREn作为检索引擎,此检索引擎支持NTriple方法的索引方式,可为系统提供基于RDF的三元组的复杂检索。 SIREn基于关键字的多种组合检索,同时支持关键词之间的逻辑关系和条件之间的逻辑关系检索。 SIREn是在Solr中扩展了一些接口来实现以上基于Ntriple的检索方式。Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面。 在这里我们同时也采用Solr对关键字段进行索引,该索引为检索系统提供分面、排序等更多的功能支持。 把系统需要检索的数据存储到全文检索系统中,下面是部分字段的存储配置。其中定义了字段名称、字段类型、字段的多值的约束。“string”类型主要存储基因ID等信息;“text”类型用于存储需要全文检索的类型,如基因名称等。 … … field name=id type=string indexed=true stored=true required=true/ field name=url type=string indexed=true stored=true required=true multiValued=false/ field name=proteinID type=string indexed=true stored=true required=false multiValued=false/ field name=proteinName type=text indexed=true stored=true required=false multiValued=true/ field name=geneName type=text indexed=true stored=true required=false multiValued=true/ field name=sequenceLength type=text indexed=true stored=true required=false multiValued=true/ field name=proteinLayer type=text indexed=true stored=true required=false multiValued=true/ field name=subcellularLocalization type=text indexed=true stored=true required=false multiValued=true/ field name=tissueSpecificity type=text indexed=true stored=true required=false multiValued=true/ field name=sequenceSimilarity type=text indexed=true stored=true required=false multiValued=true/ field name=sequenceCaution type=text indexed=true stored=true required=false multiValued=true/ field name=altName type=text indexed=true stored=true required=false multiValued=true/ field name=shortName type=text indexed=true stored=true required=false multiVa

文档评论(0)

zsmfjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档