- 53
- 0
- 约7.8千字
- 约 6页
- 2017-08-26 发布于广东
- 举报
* 建的知识库 DBpedia , YAGO , 有史以来所有印刷材料的数据总 量 (200PB )。随着互联网、物联网、 Omega , WikiTaxonomy 。除此 30 专题 第?10?卷??第?11?期??2014?年?11?月 基于维基百科等在线百科知识构 [10] [11] 之 外,一些著名的商 业网站、公 就规模而言,拥有概念最多 的知识库是 Probase,目前其核心 概念约有 270 万个,概念总量达到 千万级。它是基于概率化构建的 间的关系信息,而且规模也在随 着信息的增长不断增大。除此之 外,比较有特色的还有国内搜狗 知立方系统,侧重于基于图的逻 OpenKN的整体架构 图 1 描述了 OpenKN 作为计 近年来,互联网技术和应用 个组织建立的知识库多达 50 余种, 知识库,支持针对短文本的语义 模式的快速发展在改变人们生活 相关的应用系统更是达到了上百 理解。包含实体最多的是 Wolfra- 方式的同时也产生了巨大的数据 种。其 中,有代表性的知识库或 mAlpha,有 10 万亿个实体。近年来, [3] 70 [4] [5] [6] [7] [8] [9] 片、视频和音乐),远远超过人类 1 [12] [13] 云计算等技术的迅猛发展,网络 空间 (cyberspace) 中各类应用层出 司 和 政 府 也 发 布 了 类 似的 知 识 辑推理计算,包括利用语义网的 不穷,引发了数据规模的爆炸式 搜索和计 算平台,如 Evi 公 司的 三元组推理补充实体数据、对用 2 [1] 网络大数据中包含大量有价 fram 的知识计算平台 WolframAl- 本文将提出一种面向网络大 值的数据,根据其产生方式的不 pha、谷歌的知识图谱 Knowledge 数据的、开放的、自适应的、可演 同可分为 Web 内容数据、Web 结 Graph、脸书 (Facebook) 推出的实 化的、可计算的知识计算引擎—— 构数据、自媒体数据、日志数据等。 体搜索服务 Graph Search 等。 OpenKN。 如何从网络大数据中获得有价值 2 信息工程大学 OpenKN——网络大数据时代 的知识计算引擎 王元卓1 贾岩涛1 赵泽亚2 程学旗1 1 关键词 :网络大数据 知识计算 知识网络 的知识,并对其进行深入的计算 和分析,已成为国内外工业界和学 术界研究的热点 [2]。目前,世界各 1PB=250B。 1 。 2 cation, knowledge computation)、 知 识存储 (knowledge edge services and application)4 个模块 现了一个全生命周 31 第?10?卷??第 11?期??2014?年?11?月 知识获取、知识 融 合、知识验 证与计 算、知识 存 储到知 识服务与应用的知 识处理工作流程。 知识库的构 建 知识库的构建 从 逻 辑角度 讲,包 括知识获取和知识 融合两个 方面。其 中知识获取的主要 在线百科和核心词 表等数据中抽取概念、实例、属 性和关系。知识融合的主要目的 是实现知识的时序融合和多数据 源融合。图 2 进一步描述了知识 库构建的思路。OpenKN 构建的 知识库包含两部分 :(1) 存储众所 周知的常识性知识的通用基础库 (general foundation base),这些知 识可从维基百科等在线百科中直 接抽取获得。(2) 特定领域的知识 库,从左至右依次为领域 1 到领 域 n。基于每一个 领 域知识的特 点不同,每一个特定领域知识库 又
原创力文档

文档评论(0)