- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
清华大数据产业联合会-应用·创新-第1讲:SAS刘政20141126
大数据分析
刘政博士, SAS Institute Inc.
Copyright © 2012, SAS Institute Inc. All rights reserved.
数据分析简史与技术
Copyright © 2012, SAS Institute Inc. All rights reserved.
数据分析的发展
第二次世界大战中,美英两国率先使用运筹学的方法解决当时迫
切需要把各种稀少的资源以最有效的方式分配给各个战场和军事
单位的问题。
1962年,John W. Tukey发表了《The Future of Data Analysis》,
1977年, Tukey 出版了《Exploratory Data Analysis》,确立了数据
分析的广泛性和数据可视化探索技术。
上个世纪60年代,计算机被用来辅助决策支持。
1966年,需要统计软件分析大量农业数据,数据的采集获得了美
国农业部的授权。美国南方8所取得政府领地赠送的大学获得了
美国农业部研究基金,在国家健康研究所的支持下,开发通用目
的的统计分析软件包,用来分析采集到的农业数据。这个软件包
的名字Statistical Analysis System成为了后来SAS公司的名字和
产品的基础。
国家健康研究所(NIH) 是世界领先的医学研究中心 3
Copyright © 2012, SAS Institute Inc. All rights reserved.
1976年,数据分析大会会有300多人参加,客户数超过了100,包括政府,研究机
构和企业。这证明了70年代数据分析在美国就有了一定的规模。
当时计算机的尺寸要占有一个房子,程序是穿孔到纸卡上。30万行代码, 要装入
150个箱子里面,要堆40英尺高。把箱子排在一起有180英尺长。
4
Copyright © 2012, SAS Institute Inc. All rights reserved.
1979年,软件是运行在 IBM‘s VM/CMS系统。1980年, 出现了图形显示的软件,以及计量经
济学和时间序列软件。
当时,整个的计算机硬件和软件都在快速变化。新的操作系统出现,同时要求对应的软件开
发人员。开始支持IBM的操作系统DOS。随着更多的操作系统的出现,要求软件的兼容性,
适合于小型机。80年代中出现了个人机PC。后来又建立了PC与大型机的连接,使得运行
程序的PC可以使用存储在大型机上的数据。
5
Copyright © 2012, SAS Institute Inc. All rights reserved.
当互联网出现以后,要求支持互联网的软件,使得这种软件在商业领域更具竞
争性。
世界和市场需求驱动公司的软件发展。欧洲的巴塞尔协议和美国爱国者法案
的出现,使得商业世界要求软件能够帮助金融机构管理风险,反洗钱,和反欺
诈。这种专用的解决方案在金融领域获得了广泛的应用。
6
Copyright ©
文档评论(0)