语义化的知识资源发现方法探析AnalysisonMethodsofSemantic.PDF

下载文档 降价啦

4
0
约1.21万字
约 7页
2017-06-25 发布于天津
举报
版权申诉
保障服务

语义化的知识资源发现方法探析AnalysisonMethodsofSemantic.PDF

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

语义化的知识资源发现方法探析AnalysisonMethodsofSemantic

语义化的知识资源发现方法探析 王思丽刘巍祝忠明姚晓娜张旺强李慧佳 Analysis on Methods of Semantic Knowledge Resources Discovery Wang Sili Liu Wei Zhu Zhongming Yao Xiaona Zhang Wangqiang Li Huijia [摘要]在对传统和语义化的知识资源发现方法进行对比分析的基础上，总结研究与深度剖析当前几种具有代表性的语义化的知识资源发现方法及其应用场景：基于语义聚焦爬虫的发现方法、基于领域本体的发现方法、基于 RDF 查询语言的发现方法和基于关联数据的发现方法，并为后续构建语义化知识发现应用提供建议。 [关键词]知识资源;语义化;资源发现;关联数据 [分类号]G250 Abstract ：Based on contrastive analysis of traditional and semantic knowledge resources discovery methods, the paper depth summarizes and decomposes the several current representative semantic knowledge resources discovery methods and their application: the discovery method based on semantic focused crawler, the discovery method based on domain ontology, the discovery method based on RDF query language and the discovery method based on linked data. Then, the paper puts forward some advices for building semantic knowledge resource discovery application. Keywords ：Knowledge resources ; Semantic; Resources discovery; Linked data 1 引言随着互联网知识内容产出方式的不断变革，网络上存在的和用户所需求的数字知识资源越来越广泛化综合化，类型和格式也日益复杂化多样化，为数字图书馆知识资源发现和建设服务带来了新的难题。与此同时，语义网技术的快速发展，为实现计算机自动发现和处理网络上异构的来自不同数据源的数据提供了便利，因而也推动了传统知识资源发现方法与语义网相关理论技术的融合，形成了一系列语义化的知识资源发现方法。本文在对传统的知识资源发现方法和语义化的知识资源发现方法进行对比分析的基础上，对国内外当前几种具有代表性的语义化的知识资源发现方法和应用场景进行了深度剖析，并提出了构建语义化知识资源发现应用的建议，旨在为进一步的研究和实践奠定基础。 2 理论基础 2.1 语义化语义化（Semantic），是伴随语义网的概念而出现的。百度百科对其的首要定义是“指用合理 HTML 标记以及其特有的属性去格式化文档内容”。维基百科对其的定义是“前端开发里面的一个专用术语”。W3CSHCOOL 教程里更将其简单归结为“让机器可以读懂内容”。个人觉得百度百科的定义过于狭义，维基百科的定义过于笼统，W3CSHCOOL 的定义倒是通俗易解。上述定义虽然表面上各有说辞，但在内涵上却是一致的，我们可以将其分解为 2 个方面去理解：其一，是在技术开发层面上，语义化是一种基于语义网相关标记的数据处理技术，其二，在结果需求层面上，语义化处理的结果应当是机器可按照一定的规则自动去理解和分析内容的结构化数据或信。可见，语义化在本质上与语义网的终极目标“机器可读”是一致的，它应当是语义网的技术代名词。目前，XML 、RDF （资源描述框架）、 Ontology （本体）被公认为实现语义化的三大底层核心技术要素。本文所研究的语义化的知识资源发现方法正是指基于上述技术或者说融合了上述技术要素的，针对互联网上开放学术知识资源进行发现和获取的方法和技术。 2.2 传统 VS 语义化  本文系中国科学院国家科学图书馆兰州分馆业务领域前瞻项目 “知识资源语义化组织、技术集成与开放服务的趋势扫描”(项目编号：1500013004)和中国科学院国家科学图书馆青年人才领域前沿项目 “