- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用关联数据技术的知识集成方法探讨.doc
应用关联数据技术的知识集成方法探讨
摘要:知识源的异质性是知识集成的最大障碍,异质性的障碍主要存在于知识辨识、知识表示和知识传播利用的通讯三个层面。本文主要分析关联数据的特征和其解决异质知识源知识集成问题的潜力,提出关联数据基础上的知识集成模型和相关研究中的关键问题。关联数据是一个开放的研究空间,目前成为了企业、科研机构、大学和各个领域和研究团体关注和共同参与研究和应用的焦点。
关键词:关联数据 知识集成 模型
中图分类号:TB472 文献标识码:A 文章编号:1007-9416(2015)030-0221-02
异质知识源的集成是当前网络环境下知识集成活动的基础和亟待解决的问题。随着网络和信息技术的发展,数据、信息、知识以各种形式急剧增长,呈现出前所未有的海量性、广泛性、多样性。知识以文本文件、数据库、本体、规则库、知识库等多种形式存在,并且分布在不同的数据集合中。这就构成了知识的“异质性”,异质性的普遍存在,成为了知识集成的最大障碍。
关联数据是将标准、方法、工具和环境有机结合的一套“最佳实践”,所以它可以作为一个面向未来知识网络的,较为全面和可持续的知识集成方法的基础。能够真正的打破知识在物理上和逻辑上的分割和独立,为知识发现、集成和创新提供大空间。
1 知识集成
知识集成是人类的重要知识活动之一,其本质应当是一个集成知识的动态过程,最终目标在于利用其成果推动和支持创新。知识集成活动包括识别、获取、共享、综合来自组织内部和外部的知识,最终形成新的知识体系的过程。知识集成本身的目标是打破知识壁垒,满足用户对知识及知识处理系统共享和互操作的要求,增强系统的知识容量和解决问题的能力。
按照知识集成研究的深度和广度,对知识集成可以有三种概念界定,即知识管理、知识源集成和知识集合的集成。
(1)知识管理:是指对分散的知识按照特定的需求和逻辑的相关性(显性/隐性)进行集成。包括对所有的相关知识源进行集成,并建立有效的机制,使知识创造者和使用者能够参与创造、维护、应用、共享、更新知识的全过程。
(2)知识源集成:通常简称为知识集成,它是知识管理的基础和重要环节,其目标是最大限度地重用、整合已有相关知识源中的异质知识。从而为用户提供统一的数据、信息、知识接口,通过所有知识源中“知识”的联合,为问题求解和知识创新提供基础。
(3)知识集合的集成:是知识集成的底层技术,包括同构知识集合和异构知识集合的集成。以及对非结构化的知识进行重新揭示,构建结构化知识集合。
知识集成的最终目标是达到知识的高效率、高质量管理。而从知识集成的研究内容上看,计算机、信息学领域更关注于知识集合和知识源的集成模型、方法和相关技术的研究。
2 异质知识源知识集成
知识的异质性是知识集成的最大障碍,异质性使得知识源之间的共享、重用和互操作难以实现,主要存在的问题以及相应的分析如下。
2.1 异质知识源集成的问题
知识集成过程中,知识的生命周期包括知识辨识、建模、评价和确认、选择、转换、传播和利用。对应于知识的生命周期,异质性的障碍主要存在于知识辨识、知识表示和知识传播利用三个层面。
(1)知识辨识:由于不同的知识源是由不同的所有者开发和维护的,由于所涉及的领域和对象不同,他们对于概念有自己的认识,使用不同概念模型的知识源难以共享和互操作,无法正确的识别、集成和合并相关的知识。
(2)知识表示:分散的知识源采用不同的表示方法描述自己的资源,这就造成有些知识源中的知识是结构化的,有些是半结构化的,还有些则是非结构化的。不便于人们和计算机识别,也就无法有效的利用它们。
(3)知识的传播和利用:目前的知识源都大多是分布式和异构的,不仅概念模型和表示方法的异同,知识源之间的通讯也采用不同的协议,往往要通过针对特殊知识源应用开发的专用API才能进行交互,而API的开发是定制性的,应用系统的封闭性和变化性往往导致基于API的互操作性难以实现和保持稳定。
异质知识源的集成研究关注与以上问题的解决,目标是消除不同知识源的各种异质性,实现异质知识源信息的识别、整合和互操作。
2.2 异质知识源知识集成的基本问题
根据知识集成存在的问题可知,知识在不同的知识源中采取不同的辨识模式、组织表达和传播利用方式。异质性造成了知识源之间的共享、重用和互操作难以实现,成为知识集成的巨大障碍。异质知识源知识集成是多层次的集成问题,见图1:
从以上模型可见,异质知识源知识集成主要包括概念模型、描述方法、应用协议和知识网络四个集成机制,关于知识集成的研究都是围绕这几个机制的构建进行的。
3 关联数据基础上的知识集成方法
通过关联数据的理论和技术学习和分
文档评论(0)