基于文档搜索的油田知识库系统.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
,{2卷笫 1 (201r{_01)(仪表电气) 基于文档搜索的油田知识库系统 赵峰 胜利油田地质科学研究院 摘要:油田知识库系统整体采用B/S三层架构模式,在提取油田属性关键词并建立地质分词 词库后 ,开发了用于全文检索的搜索引擎,对历年会议、考察中产生的大量研究报告和成果总 结进行穿透文档 内容的全文检索,根据分词索引将资料中重要的勘探开发信息提取出来,并按 多维度 网状模型进行存储 ,最终形成 了一套网络化、数字化、方便查询应用的油 田知识库系 统。系统后台管理采用FTP服务器+ORACLE数据库,中间层建立地质分词词库、基于爬虫程 序的分词搜索引擎、基于Windows服务的检索服务、Web应用服务和数据服务以构建油田知识 库应用,前台采用微软CLICKONCE技术来部署发布。 关键词:知识库;数据库;模块 ;属性;搜索引擎 doi:10.3969/j.issn.1006—6896.2013.1.036 用的油田知识库系统 。系统首要解决 目前会议 、 1 系统研究必要性 考察中形成的汇报及总结文档的存放保管问题,使 胜利油田地质科学研究院作为油田的参谋部 , 文档能够在网络上按照研究人员的使用习惯查询 、 每年都要举行大量的学术会议 ,比较重要的会议包 共享;然后将资料中的勘探开发信息进行综合性分 括勘探技术座谈会、开发技术座谈会、各类课题的 类及汇总,实现各类油田描述信息的数字化处理, 立项和结题等。每次会议结束后都会产生大量的研 建立不同类型定性的油田知识库,为今后定量的油 究报告和成果总结,成果类型多种多样,包括图 田知识库研究打下基础。系统功能主要包括以下三三 片、图件、总结文档、汇报多媒体等。这些文档里 个方面 : 面的生产数据和统计数据是研究人员力求准确逐一 (1)对历年会议、方案、考察及总结文档进行 核对过的,是油田勘探开发先进技术的集中体现, 统一收集整理 ,按信息类型分类入库,建立不同类 是知识和智慧的结晶,因此具有非常重要的学习和 型的原型模型文档库。 参考价值。随着多年的累积,从2000年至今数据 (2)研究知识库的检索与存储技术 ,将复杂系 量已达到了3GB左右,但这些成果的现状令人堪 统的信息简约、细分 、抽取成可依据事务属性控制 忧。由于没有建立这类文档的存放管理规范,造成 的知识规则,利用数据库管理系统提供的存储过程 资料成果大都分散保存在研究人员个人手中,资料 技术构建一体化的知识库系统。 随意处理,成果丢失严重。由于未能进行集中统一 (3)建立实用且完善的检索、查询、对比等应 管理,历年的这一类文档都无法查阅,不能形成资 源共享 ,没有可持续利用,从而形成浪费。因此, 用功能,使研究人员能非常直观地使用油 田知识 研究院决定设计并开发一套基于文档搜索 司络 库,避免在系统中出现类 、对象

文档评论(0)

无敌 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档