- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义网基于本体智能信息检索系统研究
语义网基于本体智能信息检索系统研究
一、引言
随着网络信息资源的急剧增长,信息的组织形式也呈现出非规范、开放、无序、分散等特点,网络信息资源又具有高度的动态性,信息的发布有很大的随意性,故死连接或不可得到的网页连接经常出现在检索列表中。如何合理有效地对各类海量数字信息进行组织、检索、访问和利用,如何有效利用互联网的优势向用户提供高质量的数字信息服务,已成为亟待解决的问题。
虽然借助目前的网络信息检索工具?D?D搜索引擎,但是,传统的信息检索技术存在着3个深层次的问题:忠实表达问题、表达差异问题和词汇孤岛问题。因此解决问题的关键在于把信息检索从传统的基于关键词层面提高到基于知识(或概念)层面,即在检索过程中导入概念的内容表述--语义,使检索过程由原来的关键(字)词匹配进化为内容匹配,以克服仅表达形式匹配所带来的种种缺陷。在这种检索的智能化过程中,本体论扮演了一个十分重要的角色。
二、语义网的关键技术
语义网的概念是Tim Berners-Lee于2000年12月在XML 2000会议上提出的,其目标是应用有效的标准和技术使得计算机能够更多地理解网上的信息,从而进行知识发现、数据集成、信息导航等,这一概念的提出为处理网络上纷繁复杂的信息提供了一个新的方向和平台。Berners-Lee为未来Web发展提出了基于语义的体系结构,如图1所示。
如图1所示,语义网是一套包括网络信息存储、组织、表示、安全认证等各个方面的完整体系,涉及XML、Ontology、数字签名等技术和方法。其中图1中的XML、RDF和ontology三层主要用于表示Web信息的语义,因而是系统的核心和关键所在。此外,数字签名用来检测文档是否被篡改过,以证实其真实可靠性。
(一)本体
本体是概念化的明确解释或表示,这是目前比较认同的本体定义。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)或词汇之间相互关系的明确定义。一般而言,一个本体由以下几个方面构成:该领域对象类的层次体系、对象类的属性及属性的取值范围、对象之间除层次关系之外其它的语义关系、一定的推理规则即公理。本体有5个建模基元:类、关系、函数、公理和实例,以此来严格且准确地刻画所描述的对象。建立本体时必须有领域专家和知识工程师的参与,并且它是一个漫长的且枯燥乏味的手工过程。Ontology可以用表示概念的节点组成的有向图表示,将概念分成3个方面:对象、事件、属性,节点间的连线表示概念间的关联。建立本体时需要确定本体所覆盖的范围,考虑重用现有的本体;列举重要术语(概念),给出明确定义,明确概念和概念之间的关系(如基本关系is-a,part-of等),定义重要术语的属性和性质。
本体在语义检索中的作用主要体现在以下3个方面:
1、建立好的本体确定了标注中所使用的词汇、术语以及描述被标注资源之间的相互关系的词汇;
2、建立好的本体确定了检索所使用的词汇,应该说,所有可供检索的字段都来自这个本体中;
3、本体是推理的依据:当需要使用推理工具进行推理时,所有资源之间的关系以及对属性的约束等条件均出自本体。
由本体在语义检索中的作用可以看出,本体的建立是进行语义检索的前提条件。
本体的构造方法可分为以下5个步骤:
1、确定本体论应用的目的和范围:这是建立本体的第一步,也就是所研究的领域或任务,建立相应的领域本体论或过程本体,领域越大,所建本体就越大,因此需限制研究的范围。
2、本体分析:定义本体所有术语的意义及其之间的关系,该步骤需要领域专家的参与,专家对该领域了解越深入,所建本体就越完善。
3、本体表示:一般用语义模型表示本体。
4、本体检验:建立本体的基本标准是清晰性、一致性、完整性、可扩展性。清晰性是本体中的术语无歧义地定义;一致性是术语之间关系逻辑上应一致;完整性是指本体中的概念及其关系应是完整的,应包含该领域内所有概念,但往往很难达到,需不断完善;而可扩展性,即本体应该能够扩展,在该领域不断发展时能加入新的概念。
5、本体的建立:对所建立本体应按以上标准进行检验,符合要求的可以文件形式存放,否则转(2)。
(二)RDF和RDFS
RDF即资源描述框架(Resource Description Framework),是W3C组织推荐使用的用来描述资源及其之间的关系的语言规范,具有简单、易扩展、开放性、易交换和易综合等特点。一个RDF模型可以表示为一个RDF模型三元组{p, s, o},其中p、s、o分别对应于RDF语句的谓词(Predicate)、主体(Subject)、客体(Object)。然而,RD
您可能关注的文档
最近下载
- 合作协议书(15篇)(模板) .pdf VIP
- 《电动汽车充电站设计规范》GB50966-2014(完整).docx VIP
- 网御星云网闸技术宝典.pdf VIP
- 江淮CPC(D)20-30-CPC(D)30A叉车零件图册.pdf VIP
- DB32T 3610.2-2025 道路运输车辆智能监控系统技术规范 第2部分:终端及测试方法.docx VIP
- 驾驶员的夜间行车视觉与夜间驾驶技巧.pptx VIP
- 中医临床三基(医师)临床基本知识针灸推拿考试真题.docx VIP
- GB50156-2012(2014年版) 汽车加油加气站设计与施工规范.pdf VIP
- 临近既有地铁的异形深基坑支护设计与施工.pdf VIP
- 《葡萄沟》精品课件.pptx VIP
文档评论(0)