大数据-改变游戏规则技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据-改变游戏规则技术

大数据:改变游戏规则技术   摘 要:大数据既让人头疼,又是一大机遇。在数据处理方面,各机构都处在转折点上,开展业务也变得困难。如果不加以改变,数据会把你淹没,成为基础设施的沉重开支和风险负担。但如果你知道如何利用它,它就会变成一个资本。 关键词:大数据;数据规模;数据流速;云计算 不管你怎么看,大数据既让人头疼,又是一大机遇。从一大堆结构化和非结构化的数据中实时展现有用事实的能力,也许能帮助政府机构更好地决策,简化流程,细化服务。 定义 尽管关于大数据没有一个统一的定义,但大数据主要指的是规模超过一般数据库软件工具能力(捕获能力、存储能力、管理能力和分析能力)的数据集。关于大数据的定义,每个行业不尽相同,主要看使用的软件工具以及数据集的规模。 系统地认识大数据 大数据的发展主要由网络的爆炸性发展而推动。行业观察员估计,2008年,网络接入数量首次超过了全球人口;到2020年,预计网络接入数量将超过500亿。 麦肯锡对大数据进行大量研究后表示,2010年,全球所有机构硬盘上储存的新数据数量超过了7艾字节,而消费者在个人电脑和笔记本电脑上储存的新数据也达到6艾字节。1艾字节的数据量是美国国会图书馆数据量的四倍。市场研究公司IDC说,在美国联邦政府,数据量每两年就翻一番,且近期没有速度放缓的趋势。 公私行业的很多机构都面临着大数据处理的挑战。例如,如何从这些数据中获得运营价值。大数据“大”在何处是个不容易回答的问题。NIST信息技术实验室信息存取处负责人Ashit Talukder表示,大数据很难捕获、存储、搜索、分享和分析,而且增长很快。Talukder说:“大数据可能包含了百亿甚至万亿条记录,它们结构松散,甚至没有结构。” Talukder表示,这些记录大部分都是混杂的,且模式多样,分布在多个网络或云环境中。这些记录还彼此联系,数据来源多样。 同时,AIIM近期的一份调查显示,60%的IT执行官认为把结构化和非结构化的数据集联系起来 “非常有用”。调查中,超过半数的被调查者表示,他们认为对非机构性数据展开深入分析“很有价值”(56%)或“非常有价值”(18%)。 大数据的主要特点 大数据主要有如下特点(3V): ?容量(Volume)―― 超大数据规模; ?速度(Velocity)―― 数据流速快; ?种类(Variety)―― 涉及各种数据、网络和节点等。 此外,当提到方法时,大数据通常指的是数据分析的发现方法,即可用数据或使用数据的能力以独特的方式结合后产生了其他方法不可能产生的发现。当前,政府机构收集的数据中只有一小部分进行了处理和分析。Talukder表示,大数据的容量和复杂性引发了很多挑战。然而,大数据也为“知识型”分析和发现(而非“假设性”发现)提供了巨大潜能。“它有望解决以前无法解决的问题,并从以前未处理的数据中获得新的发现。” 云中的大数据 云计算为大数据提供了一个优化储存、计算、存取和虚拟的环境。根据NIST,云的互通性可以让不同云中的数据集彼此协作,增强了共享、协作和分析多个大型数据集的能力。 云计算创造了一个独一无二的作为主机、存储、处理和存取大数据的机会,这种灵活的方式可随时随地按需存取数据。政府机构很快有望利用云计算应对大数据的挑战: ?为上百万研究人员提供强大的研究工具; ?极大地缩短费时研究的周期; ?利用规模经济极大减少IT研究开支。 除了云计算能帮助政府机构分析大数据流这一潜在优势外,Talukder坚持认为,要让大数据分析的承诺变为现实,还有很多地方需要改善。例如,我们需要大数据软件、运算法则、硬件和基础设施方面更好的标准,量度和互通性。基础数学和统计学需要发展,包括大数据的机器学习,大数据的分析和类型认知,以及二次抽样和不确定性的量度标准。 Talukder还对大量复杂数据的运算法则提出了更高要求,同时还应增强大数据的虚拟化和实用性,更好的集群、分类和安全以及隐私保护。另外,大数据存储、计算和显示/虚拟化方面的网络、硬件和软件基础设施技术的技术改进也很有必要。事实上,云计算和大数据配合默契(见表1)。 表1 云计算和大数据的配合意义 云计算和大数据配合默契 云供应商 大数据需求 按需自助服务 故障容差 无处不在的网络接入 多种协议 资源共享 灵活性(存储、内存、网络等) 快速适应性 灵活性(节点分配/拆卸) 限制接入的(公私)混合云 安全数据接入 大数据分析的兴起 大数据分析可以在多个领域部署,通过数据使用得出的实验证据解决运行流程中的主要问题,挖掘新的发现,而不是利用传统的分析方法。以

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档