《大数据时代》短篇正规论文综述.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代 摘要:随着网络信息化时代的日益普遍,移动互联、社交网络、 电子商务大大拓展了互联网的疆界和应用领域,我们正处在一个数 据爆炸性增长的大数据时代,大数据在社会经济、政治、文化, 人们生活等方面产生深远的影响,大数据时代对人类的数据驾驭能 力提出了新的挑战与机遇。 关键字: 大数据  云计算  海量  发展  影响 一、大数据时代产生的背景 进入 2012 年以来,大数据(Big Data)一词越来越多地被提及 与使用,人们用它来描述和定义信息爆炸时代产生的海量数,它已 经出现过在《纽约时报》、《华尔街时报》的专栏封面,进入美国白 宫网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅 觉灵敏的国君证劵、国泰君安、银河证劵等写进了投资推荐报告, 大数据时代来临据。 有人说 21 世纪是数据信息时代,移动互联、社交网络、电子商 务大大拓展了互联网的疆界和应用领域。我们在享受便利的同时, 也无偿贡献了自己的“行踪”。现在互联网不但知道对面是一只狗, 还知道这只狗喜欢什么食物,几点出去遛弯,几点回窝睡觉。我们 不得不接受这个现实,每个人在互联网进入到大数据时代,都将是 透明性存在。各种数据正在迅速膨胀并变大,它决定着企业的未来 发展,虽然现在企业可能并没有意识到数据爆炸性增长带来问题的 隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业 的重要性。大数据时代对人类的数据驾驭能力提出了新的挑战,也 为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜 力。正如《纽约时报》2012 年 2 月的一篇专栏中所称,“大数据” 时代已经降临,在商业、经济及其他领域中,决策将日益基于数据 和分析而作出,而并非基于经验和直觉。哈佛大学社会学教授加 里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了 量化进程,无论学术界、商界还是政府,所有领域都将开始这种进 程。” 二、什么是大数据? 大数据(Big Data)是指那些超过传统数据库系统处理能力的数 据。它的数据规模和转输速度要求很高,或者其结构不适合原本的 数据库系统。为了获取大数据中的价值,我们必须选择另一种方式 来处理它。数据中隐藏着有价值的模式和信息,在以往需要相当的 时间和成本才能提取这些信息。如沃尔玛或谷歌这类领先企业都要 付高昂的代价才能从大数据中挖掘信息。而当今的各种资源,如硬 件、云架构和开源软件使得大数据的处理更为方便和廉价。即使是 在车库中创业的公司也可以用较低的价格租用云服务时间了。对于 企业组织来讲,大数据的价值体现在两个方面:分析使用和二次开 发。对大数据进行分析能揭示隐藏其中的信息。例如零售业中对门 店销售、地理和社会信息的分析能提升对客户的理解。对大数据的 二次开发则是那些成功的网络公司的长项。例如 Facebook 通过结合 大量用户信息,定制出高度个性化的用户体验,并创造出一种新的 广告模式。这种通过大数据创造出新产品和服务的商业行为并非巧 合,谷歌、雅虎、亚马逊和 Facebook 它们都是大数据时代的创新者。 (一)、大数据四个特性 海量性:企业面临着数据量的大规模增长。例如,IDC 最近的 报告预测称,到 2020 年,全球数据量将扩大 50 倍。目前,大数据 的规模尚是一个不断变化的指标,单一数据集的规模范围从几十 TB 到数 PB 不等。简而言之,存储 1PB 数据将需要两万台配备 50GB 硬盘的个人电脑。此外,各种意想不到的来源都能产生数据。 多样性:一个普遍观点认为,人们使用互联网搜索是形成数据 多样性的主要原因,这一看法部分正确。然而,数据多样性的增加 主要是由于新型多结构数据,以及包括网络日志、社交媒体、互联 网搜索、手机通话记录及传感器网络等数据类型造成。其中,部分 传感器安装在火车、汽车和飞机上,每个传感器都增加了数据的多 样性。 高速性:高速描述的是数据被创建和移动的速度。在高速网络 时代,通过基于实现软件性能优化的高速电脑处理器和服务器,创 建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数 据,还必须知道如何快速处理、分析并返回给用户,以满足他们的 实时需求。根据 IMS Research 关于数据创建速度的调查,据预测, 到 2020 年全球将拥有 220 亿部互联网连接设备。 易变性:大数据具有多层结构,这意味着大数据会呈现出多变 的形式和类型。相较传统的业务数据,大数据存在不规则和模糊不 清的特性,造成很难甚至无法使用传统的应用软件进行分析。传统 业务数据随时间演变已拥有标准的格式,能够被标准的商务智能软 件识别。目前,企业面临的挑战是处理并从各种形式呈现的复杂数 据中挖掘价值。 ( 二 )、 大 数 据三个 特 征 除了有四个特性之外,大数据时代的数据还呈现出其他三个特 征

文档评论(0)

xiaoluping2000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档