基于本体的无线网络文献检索研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体的无线网络文献检索研究.doc

基于本体的无线网络文献检索研究   摘 要:针对无线网络文献检索的智能化发展趋势,将本体应用到检索中,结合应用领域收集重点概念和关系,构建领域本体。将本体与无线网络文献检索相结合把内容挖掘扩展到语义层次,相比传统仅仅基于关键字的匹配方式具有更高的查准率和查全率。   关键词:本体;文献检索;语义检索   中图分类号:TP391.3   随着网络技术的发展,无线网络的应用已越来越广泛,文献检索技术的应用也不再局限于有线网络,智能化检索技术开始应用在无线网络文献检索中。传统的信息检索技术基于关键字进行匹配,缺乏语义信息,容易造成信息的误检和漏检。而本体为Web信息提供了语义表示机制,是实现语义Web和智能信息检索的关键技术。基于本体的无线网络文献检索可以实现更加方便高效的信息查询和下载,查准率和查全率要高于传统仅仅基于关键字的匹配方式。   1 本体的定义   1991年在人工智能界,Neches等人最早给出了本体(Ontology)的定义。后来在信息系统、知识系统等领域,越来越多的人开始研究本体并给出不同的定义,其中最著名的是由Gruber提出的:“本体是概念化的明确的规范说明”[1]。到1998年,Studer等人提出“Ontology是共享概念模型的明确的形式化规范说明”[2],成为目前对Ontology概念的统一看法。该定义包括概念化(conceptualization)、明确(explicit)、形式化(formal)和共享(share)四个主要方面。   2 技术路线   本研究充分借鉴软件工程的研究思路,从需求分析到本体构建、从确认评价到进化完善,参照软件生命周期的实现过程进行基于本体的文献检索的研究。研究过程的流程图如下图所示:   图1 项目总体流程图   (1)需求分析。本研究以计算机专业术语为例,构建领域本体,实现无线网络文献检索,为使用者提高文献检索的准确率。   (2)实施本体建设。根据需求和计划构建本体。   1)领域信息的收集和分析。信息来源包括其它专家、书籍、网络、甚至是其它的本体;2)重点概念和关系的确定。在充分了解领域知识之后,提出该领域中的重点概念和概念之间的关系。并用精准的术语表达出来,作为领域本体的核心概念集;3)建立本体框架。选出关键性术语,摒弃不必要或超出领域范围的概念,尽可能准确而精简的表达出领域知识,形成框架体系,得到领域本体的框架结构;4)形式化的编码。用精准的术语表达出领域中的重点概念及关系,让机器可以理解;5)确认与评价。检查是否满足了刚开始提出的需求,是否满足本体的建立准则等。   (3)搭建信息检索系统平台,利用本体实现智能检索。   3 本体建设   3.1 信息收集与分析   本系统以计算机组成原理课程为例,构建课程核心术语表,实现领域本体。该本体描述了计算机组成原理课程的基本概念、核心术语及主要关系,并针对每个重要的知识点提供相应的学习文献。   图2 计算机组成原理本体层次   3.2 本体构建   本体构建阶段是整个系统中非常重要的一部分。在本体构建过程中,参照W3C的XML、RDF、OWL等技术规范,探讨和研究领域本体进化的方法,以及构建后的本体在无线网络信息检索中的应用,以提高检索的查全率和查准率。构建合理的领域本体,供参考的领域术语和相关领域研究人员的指导是必不可少的。本研究选择计算机组成原理课程为对象,参考了影响力较大的多本计算机组成原理教材、计算机组成原理考研大纲和计算机硬件相关的文献关键词,使用本体构建工具Protégé构建了计算机组成原理本体,生成OWL文件,共包含专业术语132个。结合收集与分析所得的术语以及关系构成语义元数据库。   4 检索平台实现与测试   本研究的目的是验证基于本体的检索方法相比基于关键词的检索方法能更精确表达用户的信息需求。在实现检索平台的基础上针对系统研究之初设定的目标和本体构建原则,对构建的领域本体进行确认与评价。测试过程中,选取了计算机组成原理的3个术语进行检索。从表1与表2的对比中可以看出,在基于本体的无线网络文献检索系统中,根据语义和关系的检索结果相比于传统基于关键字的匹配方式具有更高的准确率和查全率。   表1 基于本体的文献检索   用户输入的检索词 检索概念 查找文献数   指令系统 指令系统、指令集 23   带宽 带宽、吞吐率 15   全写法 全写法、写直达法 11   表2 基于关键字的文献检索   用户输入的检索词 检索概念 查找文献数   指令系统 指令系统 18   带宽 带宽 10   全写法 全写法 6   5 结束语   本文将本体与无线网络文献检索相结合,针对基于关键词进行匹配的检索方法的局限性,提出语义检索方

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档