大数据对数据分析的影响.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据对数据分析的影响.pdf

大数据对数据分析的影响 原文:/2012/02/the-impact-of-big-data-on-data-analytics/ 寻找新的大数据分析解决方案来提高业务灵活性和降低成本 作者:Julie Lockner 发布日期:2012 年 2 月 1 日 一直以来,数据分析都在利用电子储存信息获益方面发挥着重要作用。一些组织利用数据分 析解决方案提供可增加收入、提高市场份额、降低成本和取得科学突破的洞察。 如今,随着业务流程的日益自动化,数据分析的版图也在不断扩张。之前存储于独立在线和 离线存储库中的各种格式的信息,现在都能以数字格式进行存储,随时进行合并和分析。因 此,企业高管对数据的要求越来越高,期待更迅速、更有效的解决方案。组织也更加重视数 据分析活动,这无疑给现有的业务分析师和 IT 团队带来更大的压力 大数据的定义 从某种程度上说,大数据是数据分析的前沿技术。对“大数据 (Big Data)”这个术语的最早 引用可追溯到 A 的开源项目 Nutch。大数据是指为更新网络搜索索引需要同时 进行批量处理或分析的大量数据集,比如大小为数十到数百 TB 的博客。随着谷歌的关于 MapReduce 和 Google File System (GFS) 的发布(后者发展成了 Apache Hadoop 开源 项目),大数据不再仅仅是指大量的数据,还涵盖了处理数据的速度。随着全新的、结构化 的、非结构化和多结构化数据类型的出现,大数据还包含一个复杂性元素。 企业战略集团 (ESG) 发现,供应商理解的 “大数据”只是字面上的意思,即大量的数据。 这种趋势在提供某些解决方案的供应商中尤为明显,这些供应商提供了分布式并行文件系统 (如GPFS 和 Luster)、特定于工作负载的存储解决方案(如 EMC Isilon 和 Panasas) 和专为复杂分析而设计的数据库(包括 Teradata 的 Aster 、HP 的 Vertica 、IBM 的Netezza 和 EMC 的Greenplum )。如表 1 所示,ESG 更新了大数据的定义来反映当前使用情况。 大数据是指超出正常处理范围和大小、迫使用户采用非传统处理方法的数据集。 表 1. 大数据的定义 评估大数据对数据分析的影响 ESG 认为大数据不是市场炒作。对于许多跨多个垂直行业的组织而言,大数据是真实存在 的,而且它正在改变数据中心的架构。随着数据量,数据处理速度和数据类型的复杂度以远 超标准前端和后台数据处理能力的速度增长,大数据在不断增长,这迫使 IT 团队考虑采用 非常规的方式处理业务需求。 在缓解提高绩效的压力的同时,如何利用当前的分析平台和基础 IT 架构处理不断增长的数 据量?这是很多组织都在尝试解决的问题。为更好的理解组织如何应对大数据带来的挑战, 以及他们想通过部署新的分析平台来满足大数据需求并从中获得哪些利益,ESG 近期针对 270 位决策者和影响者展开了一项调查。(调查结果如下) 据 ESG 的调查结果显示,如果一些组织拥有大量的数据和不断增长的数据库容量,而且 这些数据源自多个来源,那么他们面临大数据挑战的可能性就更高。随着越来越多的数据源 集成到业务智能和数据处理任务中,通常的数据分析流程已经无法满足需求。这些组织认识 到,提高数据分析能力同样非常重要。 超过半数的调查对象将提高数据分析能力列为未来 12-18 个月内最重要的五个 IT 优先考 虑事项之一(参见表 2 )。另外,只有 5% 的人认为数据分析不是他们最重要的 20 个 IT 优先考虑事项之一。超过半数 (54%) 的企业(雇员超过 1000 人)认为数据分析是最重要 的五大 IT 优先考虑事项之一,而只有 42% 的大中型企业(雇员为 500-999 人)持这样 的观点。 您认为提高数据分析能力在未来 12-18 个月内相对于您组织的所有 IT 优先考 虑事项中的重要性如何?(所占百分比,总数为 270 ) 表2. 数据分析的相对重要性 目前,主导的数据分析平台尚未出现。半数以上的组织仍在使用自定义数据分析解决方案。 通用数据库针对特定工作负载进行了调优,也被广泛用于执行数据分析活动。至少需处理 100 TB 数据的组织更倾向使用基于云的数据分析服务,以及大规模并行处理 (MPP) 或对 称处理 (SMP) 分析数据库。尽管早几年就已经出现特定于工作负载

文档评论(0)

wuyouwulu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档