- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【期刊】语义网的主要功能及其在数字图书馆中的应用.pdf
知识组织
语义网的主要功能及其在
数字图书馆中的应用*
□ 欧石燕 胡珊 / 南京大学信息管理学院 南京 210093
摘要:语义网自诞生以来,其发展过程一直处于不断的调整变化中,新的语义网标准规范不断推出,其
功能和应用也不断向深度和广度扩展。文章首先对语义网的诞生与发展过程进行了回顾与分析,然后通过
对语义网应用的调研归纳总结出语义网的主要功能,最后对语义网功能在数字图书馆中的应用进行了分析与
阐述。
关键词:语义网,关联数据,数字图书馆
DOI :10.3772/j .issn .1673—2286.2014.03.001
1 语义网的诞生与发展 (2 )低匹配或者无匹配;(3)查询结果对查询词高度
敏感;(4)用户必须自行在检索结果中浏览和定位所需
自1991年万维网(简称Web )诞生以来,Web 已经 文档并从中抽取有用信息进行集成。虽然研究者们试
发展成为一个拥有亿级页面的巨大分布式信息空间, 图采用各种手段提高搜索引擎的智能性和精度,但是
为用户提供海量的信息服务。二十多年来,Web虽然经 上述问题仍无法从根本上得以解决,这同样归因于当
历了一系列变化与发展,但是无论是1.0 时代的只读静 前Web 非结构化、非语义化的信息表示形式,使得搜索
态网页,还是2 .0 时代的交互式信息平台,基于超文本 引擎只能通过简单的关键词匹配而非语义匹配来搜索
格式的非结构化文档之网(web of document s)的特性 相关信息,并且关键词之间只能通过简单的布尔关系
一直都没有改变,这使得当前Web还远远不能满足人 而非准确的概念关系来描述。
[1]
们对信息共享和处理的需要,主要表现在 :(1)当前 面对着当前Web在信息表达、组织、检索中存在的严
[1]
Web只能供人阅读和进行信息共享,计算机并不能“理 重缺陷与不足,有两种可能的途径来解决上述难题 :一
解”Web 的内容,并在“理解”的前提下处理和利用这 种考虑是,采用人工智能和自然语言处理技术开发出更
些信息;(2)即使目前有大量网页的内容是由来自底层 为复杂的程序来对网页上的非结构化信息进行处理。
数据库的结构化数据自动生成,但是网页一经生成,信 但是很遗憾,人工智能技术本身有着很大的局限性,再
息反而失去了在数据库中的结构化特征,而这一特征 精妙的机器(计算机程序)也无法真正像人一样进行理
对于机器理解和处理信息是非常有用的;(3)人们虽然 解和思考,这一途径无疑遇到了无法突破的瓶颈。另一
能在H TM L 网页中建立超链接关系,但是却无法在生 种考虑是,能否采用一种适于机器理解和访问的新方
成这些网页的底层数据间建立关联关系,导致Web底 式来表达Web上的内容,从而方便机器的处理?这就是
层的海量数据孤立而分散地存在着,无法进行集成和 语义网想法的最初由来。1998年,万维网的发明人伯纳
互操作,形成了一个个信息孤岛。 斯-李在他的Web设计笔记里首次提出了对语义网的设
正因如此,人类对当前Web 的利用无法得到软件 想,即“一个在某种程度上类似于全局数据库的数据
[2]
工具的很好支持。一直以来,伴随着Web诞生的搜索引 之网(web of data)” 。2001年5月,伯纳斯及其合作者
擎是人们搜索和使用Web 信息的几乎唯一的、不可或 在Scientific American 杂志上发表了题为“The Semantic
文档评论(0)