- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据融合研究:问题与挑战 - wamdm - 中国人民大学
大数据融合研究:问题与挑战
孟小峰 杜治娟
中国人民大学信息学院 北京 100872
(xfmeng@)
Research on the Big Data Fusion : Issues and Challenges
Meng Xiaofeng and Du Zhijuan
School of Information, Renmin University of China, Beijing 100872
Abstract Data characteristics and realistic demands have changed because the large-scale datas linked and crossover. The main features
of the data are large scale, multi-source heterogeneous, cross domain, cross media, cross language, dynamic evolution and generalization,
which is playing an important role. And the corresponding data storage, analysis and understanding are also facing a major challenge.
The immediate problem to be solved is how to use the data association, cross and integration to achieve the maximization of the value of
big data. Our paper believes that the key to solving this problem lies in the integration of data, so we put forward the concept of large
data fusion. We use Web data, scientific data and business data fusion as a case to analyze the demand and necessity of data fusion, and
proposed a new task of large data fusion, but also summarized and analyzed the existing fusion technology. Finally, we analyze the
challenges that may be faced in the process of large data fusion and problems caused by large data fusion.
Keywords big data, data integration, data fusion, knowledge fusion, data management
摘 要 随着大规模数据的关联和交叉,数据特征和现实需求都发生了变化。以大规模、多源异构、跨领域、
跨媒体、跨语言、动态演化、普适化为主要特征的数据发挥着更重要的作用,相应的数据存储、分析和理解
也面临着重大挑战。当下亟待解决的问题是如何利用数据的关联、交叉和融合实现大数据的价值最大化。本
文认为解决这一问题的关键在于数据的融合,所以提出了大数据融合的概念。本文首先以Web 数据、科学数
据和商业数据的融合作为案例分析了大数据融合的需求和必要性,并提出了大数据融合的新任务。然后,总
结分析了现有融合技术。最后针对大数据融合问题可能面临的挑战和大数据融合带来的问题进行了分析。
关键词 大数据;数据集成;数据融合;知识融合;数据管理
中图法分类号 TP391
近20 年里,数据产生的方式不断在扩展,数据之 或早期 “大数据”(量大)的最显著特征。
间的关系变得千丝万缕,呈现出大规模数据关联、交 (2 )演化性:是指数据随时间或解释的变化而变
[1,2]
叉和融合的局面 ,数据出现了如下新的特征: 化的特性,体现了数据的动态性和知识的演化性。比
(1)多元性:当下数据不仅是类型多样,更重要 如,实体的某些属性在不同时间点可能产生变化。这
的是数
您可能关注的文档
- 多源导航电子地图数据融合更新方法研究 - 武汉大学学报·信息科学版.pdf
- 多目标柔性作业车间调度的多交叉策略元胞进化算法 - 科学技术与工程.pdf
- 多用于次要出入口.doc
- 多种少量生产方式的特征.ppt
- 多目标置换流水车间调度的改进食物链算法.pdf
- 多配送中心二级库存系统的库存策略比较研究.pdf
- 多规格一维下料问题基于满意度模拟退火算法 - 大连理工大学学报.pdf
- 多重抗侧力钢-混凝土混合结构最优刚度比研究 - 西安建筑科技大学学报.pdf
- 多非线性一般lurie 离散系统的绝对稳定性 - cact.pdf
- 多零售点环境下的供应链回购契约机制研究 - 自然科学版 - 青岛大学.pdf
文档评论(0)