1.大数据相关培训教程-大数据的来源和动机.pptx

1.大数据相关培训教程-大数据的来源和动机.pptx

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.大数据相关培训教程-大数据的来源和动机.pptx

1.大数据的时代背景大数据浪潮兴起的主要脉络2008年9月,NATURE,“SPECIALS: Big Data”12月,计算社区联盟,“Big Data Computing: Creating Revolutionary Breakthroughs in Commerce, Science, and Society”2009年10月,Toy Hey, “The 4th Paradigm: Data-Intensive Science Discovery”2011年2月,SCIENCE,“SPECIALS: Dealing with Data”5月,EMC World’2011, “Cloud Meets Big Data”6月,麦肯锡,“Big Data: The Next Frontier for Innovation, competition, and productivity”6月,IDC( Sponsored by EMC ),“DIGTIAL UNIVERSE: Extracting Value from Chaos”2012年1月,达沃斯世界经济论坛,“Big Data, Big Impact: New Possibilities for International Development”3月,美国奥巴马政府,“Big Data Research and Development Initiative”5月,联合国,“Big Data for Development: Challenges and Opportunities”美国政府的大数据计划具有很强烈的宣传符号色彩3月29日:奥巴马政府以“Big Data is a Big Deal”为题发布新闻。宣布投资2亿美元启动“大数据研究和发展计划”以图增强收集海量数据、分析萃取信息的能力。与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。5月23日:在TechCrunch Disrupt大会上,透露了5项将要颁布的重要联邦举措。其核心是政府开放数据计划,将政府数据和一些企业数据公开,以图改善美国人的生活方式,进而创造工作岗位。6个首先启动大数据计划的政府部门中,国家科学基金会的研究内容提到要“形成一个包含数学、统计基础和计算机算法的独特科学”,其他大多是应对挑战的数据工程类项目,如国防部高级技术研究局多尺度异常检测项目网络内部威胁项目INSIGHT(网络威胁自动识别)Machine Reading项目Mind’s Eys(机器视觉)项目VIRAT(军事图像分析与预警)XDATA(半结构化与非结构化数据的计算技术与软件工具)Obama Election TOP Contributor麦肯锡的咨询报告比较系统的确立了大数据的概念更为深远的可能是“数据科学”的最终兴起2007年,已故图灵奖得主吉姆.格雷(Jim Gray)在他最后一次演讲中描绘了数据密集型科研“第四范式”(The 4th Paradigm)的愿景。即相对于试验科学(第一范式)、理论科学(第二范式)、计算科学(第三范式)而言。数据科学继承了统计学的很多东西。。。强调后见之明(hindsight)或预见(foresight)而非洞察(insight)强调相关关系(correlation)而非因果关系(causality)Correlation is enough and the end of theory!* “Data Science”在字眼上最早由EMC提出。。。All the models are wrong, and increasingly you can succeed without them. - From Peter Norvig, GOOGLEBigData 是什么 – 用于承载所有的概念BigData 的定义 – 盛名之下,其实难负广义的:大数据已经不再局限于技术领域。如今,大数据已成为一项业务上优先考虑的工作任务,因为它能够对全球整合经济时代的商务产生深远的影响。除了为应对长期存在的业务挑战提供解决方案之外,大数据还为流程、组织、整个行业、甚至社会本身的转型激发了许多新的方式。狭义的:BigData 泛指数据集的大小,产生的速度和数据类型超过了通常的数据库,数据管理软件在限定的时间范围内所能获取,存储,管理和分析的范畴。这是一个相对的概念,不能从绝对意义上指明某一个数值来定义,而且这个相对的标准根据所处的行业和客户的不同千差万别市场曲线2.大数据时代的典型技术以GOOGLE为代表的互联网公司是大数据发展的始作俑者HDFS是GFS的开源实现Fackbook的HayStack解决了海量小文件(如图片)的存储问题NoSQL(Not Only SQL)GOOGLE的BIG

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档