统计学简史与数据科学(中南财经大学)研究.ppt

统计学简史与数据科学(中南财经大学)研究.ppt

  1. 1、本文档共99页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
国内大数据学院、研究院、研究中心情况 关于2065年数据科学的展望 统计学科在数据科学热潮中遭遇边缘化; 统计学家中的先哲早已预见到了数据科学的发展前景; 未来的数据科学有两个基本属性: 开源、可重复计算是科学的发展趋势; 数据科学的标志是:从数据中学习的科学; 什么是有价值的理论? 不是靠推证; 而是大范围的验证; 统计和机器学习有可能推动一次新的科学革命,推动工业进步的是基于证据和数据分析的科学。 25年后的统计系会是什么样? 美国科学院院士 Leo Breiman教授 1994年在加州伯克利统计系毕业典礼上的讲话 主要参考文献: 1, Timeline of Statistics, ASA RSS, 2014 2, Stephen M Stigler,Statistics on the Table-The History of Statistical Concepts and Methods, 2002 3, 陈希孺《数理统计学简史》 4,David Donoho, 50 Years of Data Science , 2015.9.18 1948-53 The Kinsey Report gathers objective data on human sexual behaviour. A large-scale survey of 5000 men and, later, 5000 women, it causes outrage. 1948-53年美国金赛报告收集了人类性行为的客观数据,先是对5000男性进行了调查,接着又对5000女性进行调查,报告公开后引起社会巨大愤怒和反响。 性学研究 1950 Richard Doll and Bradford Hill establish the link between cigarette smoking and lung cancer. Despite fierce opposition the result is conclusively proved, to huge public health benefit. 1950年英国理查德.多尔和布莱德福·希尔研究了抽烟和肺癌的关系。他们顶住反对意见的压力,最终给出了研究的结果,对公众健康有益。 抽烟与肺癌研究 1950s Genichi Taguchi’s statistical methods to improve the quality of automobile and electronics components revolutionise Japanese industry, which far overtakes western European rivals. 20世纪50年代日本田口玄一利用统计方法改善汽车和电子产品给日本工业界带来革命,使得日本远远超过欧美竞争者的质量。 田口的试验设计 1958 The Kaplan–Meier estimator gives doctors a simple statistical way of judging which treatments work best. It has saved millions of lives. 1958年美国Kaplan–Meier生存分析估计方法使得医生可以用简单的统计方法判断治疗方案的有效性,解救了数百万生命。 生存分析 1972 David Cox’s proportional hazard model and the concept of partial likelihood. 1972年英国大卫.考克斯使用比例风险模型和偏似然函数概念。 比例风险模型与偏似然函数 1977 John Tukey introduces the box-plot or box-and-whisker diagram, which shows the quartiles,medians and spread of data in a single image. 1977年美国约翰.图基介绍了箱线图和茎叶图,利用数据的四分位数、中位数和散布等简单 直观表示数据特征。 探索性数据分析 1979 Bradley Efron introduces bootstrapping, a simple way to estimate the distribution of almost any sample of data. 1979年美国斯坦福大学布拉德利. 艾佛容提出了自助法,一种可以 估计任意样本数据抽样分布的 简单方法。 自助法 1982 Edward Tufte self-publishes The Visual Display of

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档