大数据下的异构知识融合方法研究.pdfVIP

大数据下的异构知识融合方法研究.pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据下的异构知识融合方法研究.pdf

信息与电脑 数据库技术 China ComputerCommunication 2016年第13期 大数据下的异构知识融合方法研究 张 曦 (国家新闻出版广电总局西安监测台,陕西 西安  710101) 摘 要:首先给出了一个多源异构知识库的模型框架,然后具体介绍了资源描述框架RDF的概念以及RDF的基本数 据的模型,并针对知识抽取分别从半结构化知识抽取和非结构化知识抽取这两方面做了深入研究,最后将抽取得到的知 识存储为RDF/XML格式作为知识库,提出了构建RDF三元组的算法,并给出了知识库中部分知识的存储实例。 关键词:大数据;知识融合;异构知识 中图分类号:TP311.13    文献标识码:A    文章编号:1003-9767(2016)13-172-02 大数据环境下,由于数据的结构差异大、数据来源广、 也是一个能对结构化的元数据进行编码、交换和重用的体系 价值密度较低、更新实时等特点,给知识服务带来了巨大挑 框架,其数据模型包含三种对象模型,即资源、属性和陈述。 战,而多源异构知识的融合为在大数据环境下进行知识获取、 1.2.2 知识抽取 知识组织和利用提供了非常有效的手段和方法。 目前,对于知识抽取的研究很大一部分是对实体关系抽 1 多源异构知识库的构建 取的研究,被广泛研究的实体关系一般都是二元实体关系, 1.1 多源异构知识库模型框架 也就是包含两个实体以及它们之间关系的三元组,本文所指 的实体关系就是二元实体关系,实体关系抽取按输入数据源 目前,大多数知识库都是针对某一特定领域构建的,由 的结构化程度可以分为结构化抽取、半结构化抽取和非结构 于大数据环境下各种知识是异构的,因此,本文是通过从不 化抽取。针对半结构化知识抽取,下面将分为两方面进行介 同的知识来源来获取知识构建知识库,主要在知识获取、知 绍。 识表示、知识存储和知识服务等方面对多源异构知识库的构 第一,HTML 树(DOM )。可以从网页中提取信息来分 建进行研究,提出多源异构知识库的构建模型,如图1 所示。 析DOM 树。这些信息可以来自文本页面,也可来自“deep- Web ”,其中数据存储在底层数据库,通过填写HTML 表单 查询。训练的分类在作为文本的情况下,除了得到DOM 树 的链接,还能够得到文本中两个实体特征。 DOM 树包含组成DOM-tree 格式的信息,无论是在网页 (如网页列表、Web 表),还是在“deep-Web ”源都能发现 这样的信息。DOM 树的结构暗示了实体之间的关系,下面 为DOM 树片断。 tr

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档