基于MapReduce高效分布式数据融合系统VDB-MR研究.pdfVIP

  • 0
  • 0
  • 约2.57千字
  • 约 2页
  • 2026-01-22 发布于北京
  • 举报

基于MapReduce高效分布式数据融合系统VDB-MR研究.pdf

VDB-MR:MapReduce-baseddistributeddataintegrationusingvirtualdatabase

:在很多商业应用和科学研究中数据融合这个概念变得越来越重要。为此催生出

了一大批的算法和系统通过不同的角度来解决与之相关的各种问题。在这之中,虚拟数据库

是公认的一种高效率的数据融合解决方案,但是这类数据库中的执行模块运行效率却很低。

MapReduce是一种新的计算机并行计算的模型,并被广泛应用于海量数据的处理问题中。在这

片文章中,介绍一种基于MapReduce的新的分布式数据融合系统,名为VDB-MR,它将

能够高效率地融合异构数据。它能够从多个数据库中整合出一个统一的接口供用户使用。为了证

明其的性能,它与现有的开源的数据融合系统OGSA-DAI以及两个DBMS进行性能上

的pk,结果是VDB-MR性能有着显著优势。

ResearchonHeterogeneousDataEbasedonXML

:多的数据融合对于那些跟合作伙伴有密切电子商务的企业来说,变得越发

的重要。OLAP能够让研究人员与决策者快速地通过不同的接口数据。但是各个企业都

有自己的业务软件跑在不同的平台上。这篇介绍了一种基于XML的异构数据交换模型。

这个系统可以与不同的数据源进行数据交换和。同时也介绍了异构数据交换的具体实

现方法。

Methodologicalguidelinesforreducingthecomplexityofdatawarehouse

developmentfortransactionalbloodbanksystems

:这段时间以来,数据(DataWarehouse或DW)系统方面因为受到越来越

多的异构数据的影响,发展变得举步维艰。虽然在科学和研究领域有很多新的突破,但是

DW的项目仍然不能够在较短的时间内拿出令人满意的结果。因此我们要解决的问题如下:

如何减小DW的开发?(development)在异构信息交互系统中的数据融合的复杂度。为了解决

这个问题,我们介绍一种基于概念模型?(conceptualmodeling)与数据研究的循环的法

上的指导思想,通过它来构建一个模块化的DW系统。这些指导思想被成功应用于血液捐

赠的领域中,并成功的减少了DW开发的复杂度。

Developmentofaninteroperabletooltofacilitatespatialdataintegrationinthe

contextofSDI:

:很多空间数据的使用者目前的主要问题是如何将多个的空间异构

数据进行融合。为了促进多的空间数据的融合,出现了很多与之相关的技术,例如:

federateddatabases,featuremanipulationengines(FMEs),ontology-drivendataintegration和

spatialmediators。这些技术主要目的都是想让数据之间彼此和谐?(harmonize),建立不同数

据之间的协作性。

相反地,空间数据的融合和协作并不仅仅是纯粹的技术问题,它还包括很多非技术上的

问题,例如:,政策,,社会等。因此SpatialDataInfrastructure(SDI)框架被

用于更好地解决以上的技术与非技术难题并促进数据融合,SDI旨在为用户一个能与空

间数据进行交互的整体性的平台。

这篇文章主要讨论数据融合的各种相关难题的复杂度,并介绍一种通过多种评估多

空间数据来达到促进数据之间和谐性?(harmonization)的工具,这些对应和谐的准则,

而这些准则则基于相应的权限要求。空间数据中技术与非技术上的特息将被提取出来形成

元数据以及实际的数据?(actualdata)。然后我们的工具利用上述的来评估数据的特征,并

且识别数据的不连贯性?(inconsistency)。同时,它了一些操作和指导思想来克服数

据集合之间的不连贯性。这样的工具可以帮助使用者们规避那些耗时

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档