一种面向科技文献元数据增量数据规范的多模式匹配算法.docx

一种面向科技文献元数据增量数据规范的多模式匹配算法.docx

  1. 1、本文档共15页,其中可免费阅读8页,需付费100金币后方可阅读剩余内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1 引言 随着信息技术的快速发展,各个领域都产生了大量的数据,数据量呈现爆炸式增长,大数据的概念逐渐形成。大数据的HACE(Heterogeneous,Autonomous,Complex,Evolving)法则认为大数据的特征之一是异构(Heterogeneous),即相同的实体数据来源不同,具有不同的数据内容构成、格式规范以及描述规范[1]。因此,在大数据时代,科技情报分析流程中的一个重要环节就是对异构数据进行规范化等处理,构建内容干净、结构规范的目标数据集,即多源信息融合与清洗[2,3]。在文献元数据的融合过程中,很重要的一个步骤是机构信息规范化。在机构信息规范化的基础上,才能够保证机构

文档评论(0)

罗伯特之技术屋 + 关注
实名认证
内容提供者

畅游技术蓝海,八大领域技术领先解读!

1亿VIP精品文档

相关文档