采用云计算技术构建大型数据仓库平台解析.docVIP

采用云计算技术构建大型数据仓库平台解析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
采用云计算技术构建大型数据仓库平台解析

采用云计算技术构建大型数据仓库平台解析   摘 要:随着我国经济和科技的不断发展,电信运营商的数据平台构建还存在着很大的缺陷,传统的技术手段已经无法适应社会发展的新要求,数据的整合难度和分类标准也愈加严格。针对这样的现象,很多企业在大型数据仓库创建的过程中都坚持应用了新技术,计算机也实现了进一步的应用,但是很多弊端仍旧无法避免。对此,采用最新的云计算措施来构建大型数据仓库平台就成为了大势所趋。本文就结合企业目前构建大型数据仓库平台的现状,简单分析一下其所面临的主要技术问题,进而结合云计算技术进行创新,提出行之有效的运用对策,发挥新技术的巨大优势,为我国大型数据仓库平台的云计算应用奠定坚实的基础。 关键词:云计算技术;大型数据仓库平台;现状;优势;对策 中图分类号:TP311.13 现如今,社会科技日益发展,世界大市场逐步开放,企业想要掌握更多的数据,在竞争中立于不败之地,了解运营的基本情况,就一定要坚持数据仓库平台的创建和创新。原有的数据平台在信息查询和处理的时候还存在很大的缺陷,无法对具体数据进行准确分析,在很大程度上阻碍了企业的进一步发展。与此同时,新技术在大型数据仓库平台上的应用也关乎着企业的整体水平,是衡量企业技术能力的重要指标。因此,坚持采用云计算技术构建大型数据仓库平台是企业和运营商所要走的必然道路。 1 大型数据仓库建设的现状 进入21世纪以来,市场经济逐步完善,企业之间的竞争日益加剧,电信运营商想要不被社会所淘汰,就一定要全面掌握企业的生产状况,了解运营成本,对具体数据能够准确给予分析。数年前,数据分析系统还称之为经营分析系统的时候就被应用于电信运营商中,它主要是对企业的业务情况进行综合分析,然后通过一系列的加工处理,再将其制作成数据报表形式。随着近年来经济的飞速发展以及分析数据的多元化,就使得企业所承载的业务功能更加复杂,传统的数据仓库建设已经无法满足精细业务的高要求,如何实现数据的准确分析,将数据收集、加工、处理等工作集合在一起已经成为了企业人员关注的焦点。 2 大型数据仓库平台中云计算技术的引入 由于云计算技术的发展,给很多企业提供了数据准确分析的能力,在电信运营商内部的信息化建设中也相应的引入了新技术,满足了资源的池化要求,形成了私有云平台。在此基础上,根据电信运营商对数据准确性和精细度的要求,引入×86分布式集群的MPP(大规模并行处理)架构,能够很好的解决上述问题,保证企业的进一步发展。 2.1 对比SMP与MPP架构 SMP是比较传统的架构模式,指的是在一台计算机上集聚了一组处理器和多个CPU,且各CPU之间能够实现内存的共享。虽然其中具有多个CPU,但是它们仍然和一台计算机一样,每个处理器都可以对内存进行访问。在许多松耦合处理单元的共同组成下则形成了MPP系统,这种系统中的CPU都有自身的私有总线、硬盘、内存等设备,其中的×86分布式集群就是典型代表。 SMP相对于MPP来说存在着很多不足,其扩展相对有限,并且在扩展的过程中需要大量资金。而MPP系统则不会对资源进行共享,资源总数却相对来说多一些,在处理能力上也比较突出。所以,在具体的应用过程中大多采用MPP系统,它的运行速度和效率都要快一些,在OLAP大数据分析上也具有更高的优势,更加有利于系统性能的充分发挥。 2.2 云计算数据仓库 在上述文章中已经分析得出了MPP系统的优点,所以在技术应用中也要配合与之相适应的技术路线,具体来说主要有两种。第一,软硬化一体化路线。它其中主要有IBM一体机Netezza、Teradata一体机等设施,它具有很高的性能,能够优化硬件,但是研发费用也相对较高;第二,软件数据库管理系统产品。这其中主要有EMC Greenplum、Hadoop以及IBM DB2系统下的HIVE或者HBASE工具设备,它可以采用比较常见的硬件产品来予以组建,没有具体的硬性要求。 2.3 MPP云化数据仓库的基本系统 这种系统主要有三个层面共同构成,其建设方案也相对比较复杂。第一,MPP能力层。它的构成相对复杂,至少有多于2个的高性能×86分布式集群主机构成,主要实施管理职能,能够实现对数据节点的任务调度,并提供计算能力池和存储能力池。另外,它还是多台×86存储服务器组成的数据节点集群,网络通信平台由多台高性能局域网交换机共同构成;第二,云计算数据库管理层面。它不仅具有普遍使用的关系型数据库的管理功能,而且对外支持SQL标准语言,能够对底层数据进行分布式管理,承载调动功能,分担底层节点设备的负载量;第三,应用层面。顾名思义,它是最具有实用功能的层面,能够根据具体情况进行应用分析,具备KPI、多维分析、报表构成等多种基础功能 2.4 比对业务数据加载

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档