- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语义化的知识资源发现方法探析AnalysisonMethodsofSemantic
语义化的知识资源发现方法探析
王思丽 刘巍 祝忠明 姚晓娜 张旺强 李慧佳
Analysis on Methods of Semantic Knowledge Resources Discovery
Wang Sili Liu Wei Zhu Zhongming Yao Xiaona Zhang Wangqiang Li Huijia
[摘要]在对传统和语义化的知识资源发现方法进行对比分析的基础上,总结研究与深度剖
析当前几种具有代表性的语义化的知识资源发现方法及其应用场景:基于语义聚焦爬虫的
发现方法、基于领域本体的发现方法、基于 RDF 查询语言的发现方法和基于关联数据的发现
方法,并为后续构建语义化知识发现应用提供建议。
[关键词]知识资源;语义化;资源发现;关联数据
[分类号]G250
Abstract :Based on contrastive analysis of traditional and semantic knowledge resources
discovery methods, the paper depth summarizes and decomposes the several current representative
semantic knowledge resources discovery methods and their application: the discovery method
based on semantic focused crawler, the discovery method based on domain ontology, the
discovery method based on RDF query language and the discovery method based on linked data.
Then, the paper puts forward some advices for building semantic knowledge resource discovery
application.
Keywords :Knowledge resources ; Semantic; Resources discovery; Linked data
1 引言
随着互联网知识内容产出方式的不断变革,网络上存在的和用户所需求的数字知识资
源越来越广泛化综合化,类型和格式也日益复杂化多样化,为数字图书馆知识资源发现和
建设服务带来了新的难题。与此同时,语义网技术的快速发展,为实现计算机自动发现和处
理网络上异构的来自不同数据源的数据提供了便利,因而也推动了传统知识资源发现方法
与语义网相关理论技术的融合,形成了一系列语义化的知识资源发现方法。
本文在对传统的知识资源发现方法和语义化的知识资源发现方法进行对比分析的基础
上,对国内外当前几种具有代表性的语义化的知识资源发现方法和应用场景进行了深度剖
析,并提出了构建语义化知识资源发现应用的建议,旨在为进一步的研究和实践奠定基础。
2 理论基础
2.1 语义化
语义化(Semantic),是伴随语义网的概念而出现的。百度百科对其的首要定义是“指
用合理 HTML 标记以及其特有的属性去格式化文档内容”。维基百科对其的定义是“前端开
发里面的一个专用术语”。W3CSHCOOL 教程里更将其简单归结为“让机器可以读懂内容”。
个人觉得百度百科的定义过于狭义,维基百科的定义过于笼统,W3CSHCOOL 的定义倒是通
俗易解。上述定义虽然表面上各有说辞,但在内涵上却是一致的,我们可以将其分解为 2 个
方面去理解:其一,是在技术开发层面上,语义化是一种基于语义网相关标记的数据处理
技术,其二,在结果需求层面上,语义化处理的结果应当是机器可按照一定的规则自动去
理解和分析内容的结构化数据或信 。可见,语义化在本质上与语义网的终极目标“机器可
读”是一致的,它应当是语义网的技术代名词。 目前,XML 、RDF (资源描述框架) 、
Ontology (本体)被公认为实现语义化的三大底层核心技术要素。本文所研究的语义化的知
识资源发现方法正是指基于上述技术或者说融合了上述技术要素的,针对互联网上开放学
术知识资源进行发现和获取的方法和技术。
2.2 传统 VS 语义化
本文系中国科学院国家科学图书馆兰州分馆业务领域前瞻项目 “知识资源语义化组织、技术集成与开放服
务的趋势扫描”(项目编号:1500013004)和中国科学院国家科学图书馆青年人才领域前沿项目 “
文档评论(0)