基于本体的专题知识库智能检索系统研究.docVIP

基于本体的专题知识库智能检索系统研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体的专题知识库智能检索系统研究.doc

基于本体的专题知识库智能检索系统研究 [ ]以基于本体的张謇研宄知识库智能检索 系统开发为例,探讨基于本体的专题领域知识库智能 检索系统的框架结构、工作流程以及功能实现。系统 采用语义Web技术和智能Agent技术,使用RDF模型 对知识库的Web页面元数据进行描述,然后利用本体 建模语言对张謇研宄领域知识进行建模,根据所得到 的本体对元数据进行基于语义的查询,为用户提供智 能检索服务。 [关键词]本体知识检索智能检索知识库 [分类号]G250.6 1引言 从本体论的基本概念出发,哲学上把本体论定义 为“对世界上客观事物所进行的系统描述”。将本体论 引入信息科学,本体论是对概念化对象的一种表示和 描述,在计算机领域是指定义元数据及其相关关系的 “规范”。由于本体具有良好的概念层次结构和逻辑推 理的支持,因而在信息检索,特别是在基于知识的检 索中得到了广泛的应用。知识检索也称语义检索,是 把信息检索与人工智能技术、自然语言技术相结合的 检索,它从语义理解的角度分析信息对象与检索者的 检索请求,是一种基于概念及其相关关系的检索匹配 机制。知识库是事实、规则和概念的集合,从存储知 识的角度来看,以描述型方法来存储和管理知识的机 构叫做知识库。张謇是中国近代著名实业家、教育家, 他是清末最后一位状元,曾任民国政府实业总长,是 一位探索强国之路的开路先锋。他倡导实业救国的思 想,在经济、教育、文化、城市建设、社会保障、地 方自治等诸多领域创造了十多项全国第一,他创建了 中国近代第一城__南通(中国人自主规划建设的第 一座近代城市),研究张謇对于今天的城市经济、教育、 文化协调发展,实现科学可持续发展具有重要意义。 张謇研究知识库对张謇研究知识沉淀(包括南通大学 档案馆、图书馆和博物馆的张謇研究原始资料)进行数 字化语义处理并在张謇研宄领域专家的指导下进行概 念分类标注,组织到知识库中,形成张謇研宄领域概 念集,组织存储并实现Web服务功能。 2基于本体论的张謇研宄領域知识库智能检索 系统功能需求 ?实现对世界各地张謇研究领域用户的查询请求 分析本地表达化,使得要查询的概念不存在模糊不清 的地方,具体表现在用户向系统提出查询请求后,系 统能将查询请求中的本体取出来,然后进行基于本体 的语义搜索。 ?系统应能对用户如何更好地利用已建成的张謇 研宄本体知识库中的知识给予搜索提示,帮助用户更 好地使用本体进行查询。 ?系统应能找出查询本体中隐含的语义,实现智能 检索,即系统能根据用户的检索条件,进行智能语义 推理,可检索出与检索条件具有相同语义信息的知识。 3基于本体论的领域知识库智能检索系统结构 和工作流程 3.1基于本体论的领域知识库智能检索系统结 构 基于知识库的语义Web环境下,知识库的信息资 源已进行了语义标注。在此环境下,本系统应完成的 任务是:自动抽取关于领域知识内容描述的元数据, 并将这些元数据进行存储;对用户提交的关键词进行 语义匹配和语义相关性扩展,形成符合特定Ontology 语言的查询语句,通过对数据库中存储的领域知识库 元数据信息的查询,得到高效的基于语义的领域知识 检索结果。上述任务可划分为元数据收集、数据预处 理、元数据存储、基于Ontology的知识推理和用户查 询、控制调度等6个主要功能。本文将整个系统框架 划分为6个部分,每个部分的功能由一类Agent实现, 这6类Agent通过协同工作,共同完成整个检索任务。 本系统的总体结构如图I所示: 系统中除了多个Agent以外,还设置了领域知识 库、领域本体库、本地信息库、远端信息在本地索引 库以及临时文档库来存储相关信息。领域知识库除了 存储张謇研究数字化语义Web资源还存储张謇研究 領域用户ID、mail等个人信息、搜索案例(用户ID)、 搜索ID、属于的领域、关键字、返回的数据等、用户 偏好等;领域本体库存储张謇研宄领域集、张謇研宄 关键字集以及张謇研宄本体的相关知识等;本地信息 库和远端信息在本地的索引库主要存储远端搜索 Agent带回的,并经过信息处理Agent处理过的搜索信 息,临时文档库存储远端搜索Agent从远端数据源搜 索到的相关信息。 3.2基于本体论的领域知识库智能检索系统工 作流程 通过信息搜索Agent,对张謇研究知识库中描述 张謇研究领域知识内容的元数据(包括知识库存储的 描述内容信息和带描述信息的页面WEB信息)进行信 息提取和过滤,把收集到的元数据经过预处理Agent 进行处理后交由存储Agenh存储Agent接收语义元数 据,将这些元数据以合适的方式存储到数据库中,数 据库既可以是传统的关系数据库,也可以是专用的 XML / RDF数据库,利用描述领域知识的领域本体, 由推理Agent对张謇研宄用户提交的查询关键词进行 语义匹配和语

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档