清华大数据产业联合会-应用·创新-第1讲:SAS刘政20141126.pdf

清华大数据产业联合会-应用·创新-第1讲:SAS刘政20141126.pdf

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
清华大数据产业联合会-应用·创新-第1讲:SAS刘政20141126

大数据分析 刘政博士, SAS Institute Inc. Copyright © 2012, SAS Institute Inc. All rights reserved. 数据分析简史与技术 Copyright © 2012, SAS Institute Inc. All rights reserved. 数据分析的发展  第二次世界大战中,美英两国率先使用运筹学的方法解决当时迫 切需要把各种稀少的资源以最有效的方式分配给各个战场和军事 单位的问题。  1962年,John W. Tukey发表了《The Future of Data Analysis》, 1977年, Tukey 出版了《Exploratory Data Analysis》,确立了数据 分析的广泛性和数据可视化探索技术。  上个世纪60年代,计算机被用来辅助决策支持。  1966年,需要统计软件分析大量农业数据,数据的采集获得了美 国农业部的授权。美国南方8所取得政府领地赠送的大学获得了 美国农业部研究基金,在国家健康研究所的支持下,开发通用目 的的统计分析软件包,用来分析采集到的农业数据。这个软件包 的名字Statistical Analysis System成为了后来SAS公司的名字和 产品的基础。 国家健康研究所(NIH) 是世界领先的医学研究中心 3 Copyright © 2012, SAS Institute Inc. All rights reserved. 1976年,数据分析大会会有300多人参加,客户数超过了100,包括政府,研究机 构和企业。这证明了70年代数据分析在美国就有了一定的规模。 当时计算机的尺寸要占有一个房子,程序是穿孔到纸卡上。30万行代码, 要装入 150个箱子里面,要堆40英尺高。把箱子排在一起有180英尺长。 4 Copyright © 2012, SAS Institute Inc. All rights reserved. 1979年,软件是运行在 IBM‘s VM/CMS系统。1980年, 出现了图形显示的软件,以及计量经 济学和时间序列软件。 当时,整个的计算机硬件和软件都在快速变化。新的操作系统出现,同时要求对应的软件开 发人员。开始支持IBM的操作系统DOS。随着更多的操作系统的出现,要求软件的兼容性, 适合于小型机。80年代中出现了个人机PC。后来又建立了PC与大型机的连接,使得运行 程序的PC可以使用存储在大型机上的数据。 5 Copyright © 2012, SAS Institute Inc. All rights reserved. 当互联网出现以后,要求支持互联网的软件,使得这种软件在商业领域更具竞 争性。 世界和市场需求驱动公司的软件发展。欧洲的巴塞尔协议和美国爱国者法案 的出现,使得商业世界要求软件能够帮助金融机构管理风险,反洗钱,和反欺 诈。这种专用的解决方案在金融领域获得了广泛的应用。 6 Copyright ©

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档