基于本体课程资源语义检索系统.docVIP

下载本文档

0
0
约3.18千字
约 8页
2018-08-30 发布于福建
举报
版权申诉

基于本体课程资源语义检索系统.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于本体课程资源语义检索系统

基于本体课程资源语义检索系统　　摘要：构建了基于本体的课程资源语义检索模型，并设计实现了相应的语义检索原型。在综合分析相关课程资源后，建立了课程资源本体。在构建基于本体的课程资源语义检索模型过程中，研究已有的语义关联度计算方法，结合用户检索敏感度提出了查询词权重度量元。通过实例对语义检索原型进行了验证，结果表明，相比于基于关键字的检索方法，该语义检索系统在查全率和查准率上都有明显的优势。　　关键词：课程资源；相似度算法；语义关系；检索意图　　中图分类号：TP391.3 文献标识码：A DOI：10.15913/j.cnki.kjycx.2016.19.035 　　信息的增长速度的数量级为每年亿级，信息检索的难度随之增长。目前的检索方式主要是基于关键字的检索，这类检索方式忽略了词语之间的语义关系以及用户真实的检索意图，返回的信息多是无用的，无法为用户提供精准的资源。　　近年来，建立在语义网基础上的本体语义检索技术得到了人们的广泛关注。相比于传统的检索技术，其在检索精度和覆盖率上都有明显的优势。本体论最早起源于哲学领域，古希腊的亚里士多德通过对事物存在的本质进行了研究，得出了本体的概念。在较早时期，本体没有一个统一的定义，Studer等人对本体进行了一系列的深入研究后，提出了一个在当今被广泛采用的定义。对于共享概念模型而言，本体就是一种明确的形式化规范的说明。　　1 课程资源本体构建　　传统的基于关键字的搜索方法由于缺少语义，常造成检索信息的错检和漏检。由于受到了本体库的支持，基于语义的检索能很好地弥补这一缺陷。如果要进行基于本体的语义搜索，首先要构建规范的课程资源知识库本体。　　本文以课程资源知识点作为领域本体进行构建。课程资源知识点本体的构建主要分为两点，即确定规范和基于规范构建本体。以计算机网络课程为例，本体存储的是相关知识点，其中包括计算机网络性能、因特网、计算机网络体系结构、计算机网络类别、网络安全五大类。这五大类的子类分别有：①计算机网络性能。速率、宽带、吞吐率、往返率、可扩展性、时延、利用率、可靠性。②因特网。因特网发展阶段、因特网组成、下一代因特网。③计算机网络体系结构。五层协议体系结构、TCP/IP体系结构、OSI体系结构。④计算机网络类别。广域网、城域网、局域网、接入网。⑤网络安全。数字签名、密码体制、安全协议、防火墙。　　课程本体所包含的对象属性有蕴含关系、依赖关系、兄弟关系、平行关系、参考关系和游离关系。在构建完本体之后，本文采用MySQL数据库对本体文件进行存储，达到持久化。　　2 语义关联度算法　　用户在输入相关查询词进行检索后，语义检索系统对查询词进行形式化处理，并对形式化后的查询词进行语义关联度计算。语义关联度包括语义相似度和语义相关度。　　2.1 语义相似度　　本文提出元概念的定义，指在领域本体中存在的概念集合C，设其中任一概念为Cx，如果集合Q中存在可以与概念C中的Cx匹配的查询词，则称为Cx为元概念，即将元概念作为查询映射到的概念来进行资源查询。　　本文以知识点为单位构建教育资源本体，所以，从知识点的角度扩展了语义。知识点之间的关系有同义、平行、包含等，本节对本体概念之间的相似度所考虑的因素主要有以下6个。　　2.1.1 语义距离　　语义距离对语义相似度的影响可以表示成：　　/* MERGEFORMAT. （1）　　概念节点之间的距离表示为len（ei），是彼此之间相连的通路边所有对应的距离，比如父类和子类之间的距离为1. 　　2.1.2 语义重合度　　语义重合度对于语义相似度的影响主要表示为：　　/* MERGEFORMAT. （2）　　式（2）中：NodeSet（X）为节点到根节点经过的节点数目的几盒；NodeSet（X） NodeSet（Y）为X节点到根节点经过的节点数和Y节点数到根节点经过的节点数之间的交集；NodeSet（X） NodeSet（Y）为X节点到根节点经过的节点数和Y节点到根节点经过的节点数之间的并集。　　2.1.3 节点密度　　节点密度对于语义相似度的影响可以表示为：　　/* MERGEFORMAT. （3）　　式（3）中：degree（P）为概念节点X与概念节点Y之间最近的公共祖先P的度；degree（T）为概念树的度。　　2.1.4 节点深度　　两个节点X与Y之间的概念深度对于语义相似度的影响可以表示成为：　　/* MERGEFORMAT. （4）　　式（4）中：dep（X）和dep（Y）分别为概念X和概念Y的深度。　　2.1.5 层次顺序　　层次的顺序对概念相似度的影响为：　　/* MERGEFORMAT. （5）　　式（5）中：