基于本体专业文献检索.docVIP

下载本文档

2
0
约3.21千字
约 7页
2018-08-30 发布于福建
举报
版权申诉

基于本体专业文献检索.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于本体专业文献检索

基于本体专业文献检索　　摘要:通过对传统专业文献检索的基本原理和方法的分析研究,结合目前语义万维网的最新技术,提出基于本体的专业文献检索体系结构#65377;并开发基于本体的计算机网络课程文献检索系统#65377;该系统建立了描述课程知识结构的本体,并能对各知识点对应的专业文献进行同义词分析#65380;知识点的相互关联等语义检索#65377; 　　关键词:语义万维网;本体;专业文献;语义检索　　中图分类号:TP393.01 　　文献标识码:A 　　　　1绪论　　　　传统文献检索都是基于关键字的语法匹配和全文检索技术,主要借助于目录#65380;索引和关键词等方法来实现#65377;此技术的优点是简单#65380;快捷和容易实现,但由于缺乏必要的智能性,在信息快速增长的今天,难以适应时代发展的需要#65377;主要体现在:用户本意表达困难;无法准确揭示信息的实质内容;检索算法采用词形匹配而非词义匹配;容易形成“词汇孤岛”问题#65377;语义万维网是目前Internet的发展方向,是能够根据语义进行判断的网络#65377;简单地说,是一种能理解人类语言的智能网络#65377;语义万维网具有着良好的概念层次结构和对逻辑推理的支持,现已被广泛应用于知识表达#65380;知识共享及重用#65377;将语义万维网技术应用到文献检索中,即是在文献资源层上增加了能表达文献主要内容和学科结构的语义层#65377;在此基础上进行基于语义的文献检索,解决了传统文献检索技术的缺点和不足#65377; 　　　　2关键技术介绍　　　　2.1语义万维网及本　　体语义万维网的“语义”信息是蕴含在各资源节点的逻辑联系中#65377;其体系结构如图1所示#65377; 　　在其体系结构中,第一层是Unicode和URI,它是整个语义Web的基础,Unicode(统一编码)处理资源的编码,URI(统一资源定位器)负责标识资源;第二层是XML+名空间+XML模式,用于表示数据的内容和结构;第三层是RDF+RDF模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间的联系;第五层是逻辑,在下面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系#65377;其中第二#65380;三#65380;四层是语义Web的关键层,用于表示Web信息的语义,也是现在语义Web研究的热点所在#65377; 　　图1语义万维网的体系结构　　　　2.2本体　　本体层在语义万维网体系结构中,处于核心支配地位#65377;本体是概念模型的明确规范化说明,领域本体则是对具体领域中概念和关系的抽象描述,本体提供了语义交换的桥梁,能够在不同的智能体之间达成有关术语概念的共识,具体到专业文献学习中的文献检索和知识组织,本体的作用可以概括为以下几点:(1)描述文献所属学科的专业领域知识结构#65377;(2)表示文献内容与知识组织体系之间的链接#65377;(3) 利用复合(集成)本体从不同的角度对文献资源进行标引#65377;(4)利用多种模式表现和理解文献集合#65377; 　　　　3系统结构及实现　　　　3.1系统结构　　为了能具有更好的可扩展性,本系统采用三层架构,由数据服务器#65380;WEB 服务器和 WEB 终端所组成,整个系统结构如图2所示: 　　图2系统结构　　用户访问层为用户通过浏览器访问学习资源管理平台提供了一个可视化的接口#65377;开发该城所采用的主要技术包括XHTML#65380;JavaScript#65380;JSP 等#65377;其中XHTML 和JavaScript 主要在客户端,由浏览器执行;JSP 则在管理平台端,由Weblogic应用服务器执行#65377;应用服务器层主要采用Servlet 和EJB 等技术开发的应用组件构成,这些组件完成语义分析#65380;语义推理功能#65377;由于应用服务器层处理的信息主要是XML 格式的RDF/RDFS 信息,因此,采用了HP 公司开发的Jena API 来处理RDF 模型#65377;数据存储层主要包括三个部分:领域知识本体#65380;元数据库#65380;资源数据库#65377;这三个部分涉及到知识本体的建模#65380;形式化表示#65380;资源语义描述#65380;RDF 数据的存储等内容#65377; 　　　　3.2本体构建　　本系统以计算机网络课程为例,创建了领域本体#65377;该本体描述了计算机网络课程的基本概念及结构,并针对每个知识点提供相应的学习文献#65377; 　　建模工具选用 Protégé3.1,在Prot