基于本体专题知识库智能检索系统研究.docVIP

基于本体专题知识库智能检索系统研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体专题知识库智能检索系统研究

基于本体专题知识库智能检索系统研究   [摘要]以基于本体的张謇研究知识库智能检索系统开发为例,探讨基于本体的专题领域知识库智能检索系统的框架结构、工作流程以及功能实现。系统采用语义Web技术和智能Agent技术,使用RDF模型对知识库的Web页面元数据进行描述,然后利用本体建模语言对张謇研究领域知识进行建模,根据所得到的本体对元数据进行基于语义的查询,为用户提供智能检索服务。   [关键词]本体知识检索智能检索知识库   [分类号]G250.6      1 引 言      从本体论的基本概念出发,哲学上把本体论定义为“对世界上客观事物所进行的系统描述”。将本体论引入信息科学,本体论是对概念化对象的一种表示和描述,在计算机领域是指定义元数据及其相关关系的“规范”。由于本体具有良好的概念层次结构和逻辑推理的支持,因而在信息检索,特别是在基于知识的检索中得到了广泛的应用。知识检索也称语义检索,是把信息检索与人工智能技术、自然语言技术相结合的检索,它从语义理解的角度分析信息对象与检索者的检索请求,是一种基于概念及其相关关系的检索匹配机制。知识库是事实、规则和概念的集合,从存储知识的角度来看,以描述型方法来存储和管理知识的机构叫做知识库。张謇是中国近代著名实业家、教育家,他是清末最后一位状元,曾任民国政府实业总长,是一位探索强国之路的开路先锋。他倡导实业救国的思想,在经济、教育、文化、城市建设、社会保障、地方自治等诸多领域创造了十多项全国第一,他创建了中国近代第一城――南通(中国人自主规划建设的第一座近代城市),研究张謇对于今天的城市经济、教育、文化协调发展,实现科学可持续发展具有重要意义。张謇研究知识库对张謇研究知识沉淀(包括南通大学档案馆、图书馆和博物馆的张謇研究原始资料)进行数字化语义处理并在张謇研究领域专家的指导下进行概念分类标注,组织到知识库中,形成张謇研究领域概念集,组织存储并实现Web服务功能。      2 基于本体论的张謇研究领域知识库智能检索系统功能需求      ?实现对世界各地张謇研究领域用户的查询请求??析本地表达化,使得要查询的概念不存在模糊不清的地方,具体表现在用户向系统提出查询请求后,系统能将查询请求中的本体取出来,然后进行基于本体的语义搜索。   ?系统应能对用户如何更好地利用已建成的张謇研究本体知识库中的知识给予搜索提示,帮助用户更好地使用本体进行查询。   ?系统应能找出查询本体中隐含的语义,实现智能检索,即系统能根据用户的检索条件,进行智能语义推理,可检索出与检索条件具有相同语义信息的知识。      3 基于本体论的领域知识库智能检索系统结构和工作流程      3.1 基于本体论的领域知识库智能检索系统结构   基于知识库的语义Web环境下,知识库的信息资源已进行了语义标注。在此环境下,本系统应完成的任务是:自动抽取关于领域知识内容描述的元数据,并将这些元数据进行存储;对用户提交的关键词进行语义匹配和语义相关性扩展,形成符合特定Ontology语言的查询语句,通过对数据库中存储的领域知识库元数据信息的查询,得到高效的基于语义的领域知识检索结果。上述任务可划分为元数据收集、数据预处理、元数据存储、基于Ontology的知识推理和用户查询、控制调度等6个主要功能。本文将整个系统框架划分为6个部分,每个部分的功能由一类Agent实现,这6类Agent通过协同工作,共同完成整个检索任务。本系统的总体结构如图l所示:         系统中除了多个Agent以外,还设置了领域知识库、领域本体库、本地信息库、远端信息在本地索引库以及临时文档库来存储相关信息。领域知识库除了存储张謇研究数字化语义Web资源还存储张謇研究领域用户ID、mail等个人信息、搜索案例(用户ID)、搜索ID、属于的领域、关键字、返回的数据等、用户偏好等;领域本体库存储张謇研究领域集、张謇研究关键字集以及张謇研究本体的相关知识等;本地信息库和远端信息在本地的索引库主要存储远端搜索Agent带回的,并经过信息处理Agent处理过的搜索信息,临时文档库存储远端搜索Agent从远端数据源搜索到的相关信息。      3.2 基于本体论的领域知识库智能检索系统工作流程   通过信息搜索Agent,对张謇研究知识库中描述张謇研究领域知识内容的元数据(包括知识库存储的描述内容信息和带描述信息的页面WEB信息)进行信息提取和过滤,把收集到的元数据经过预处理Agent进行处理后交由存储Agenh存储Agent接收语义元数据,将这些元数据以合适的方式存储到数据库中,数据库既可以是传统的关系数据库,也可以是专用的XML/RDF数据库,利用描述领域知识的领域本体,由推理Agent对张謇研究用户提交的查

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档