数据分析科学的过去、现在、未来.pdfVIP

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分析科学的过去、现在、未来 --统计是数据科学 谢邦昌 教授1 朱建平教授2 1. 辅仁大学统计资 讯学系暨应用统计所教授 首都经贸大学统计学院中央财经大学统计学院博导 厦门大学计划统计系西南财经大学统计学院客座教授 中华数据挖掘协会理事长 2.厦门大学计划统计系 数据源:赵民德,「统计是数据科学」人大讲稿 • 统计学的发展,是根据数据的型态和问题的本质来 改变的,不是因为我们会做他背后的数学而发展的。 • 不要因为(统计的问题困难而去做它;也不要因为) 它难而不做。(贺吉士J.L. Hodges, Jr. , 1922-2000) • 统计学的味道,来自她的数据,因为这是她的本质。 数据源:赵民德,「统计是数据科学」人大讲稿 统计是数据科学 数学是数理统计的基础 数据源:赵民德,「统计是数据科学」人大讲稿 数据源:赵民德,「统计是数据科学」人大讲稿 统计科学还是统计工业 • 工业意味着不断改进的、有市场的产品和日益增 加的就业人口。如果统计只是在大学里或者研究 单位里面存在的话,那么这个行业的萧条,也是 可以预期的。 • 工业的另一个意涵是不再有单兵作战。工业化的 结果,除了世俗化之外,还暗示着有更高的附加 价值。 •化工厂里满墙的屏幕:每一个都在监测某一重要 生产环节的状况和反应;企业里开始有「数据价 值发展部」的编制。 •将某些统计工作专业化,不断地加上新的价值 数据源:赵民德,「统计是数据科学」人大讲稿 什么是数据挖掘? • 数据挖掘是计算机应用领域的新名词。然而 当人类还在茹毛饮血的上古时代早已进行着 数据挖掘的行为 –为了快速并准确捕获猎物,人类的祖先必 须细心观察猎物的习性,并预测猎物的行 为,才能战胜猎物、存活下去 •同样的,在讲究实时、竞争激烈的网络时代, 如果能事先破解消费者的行为模式,将会是 赢得电子商务的关键因素之一 数据源:赵民德,「统计是数据科学」人大讲稿 It is New • 资源与信息共享Information Delivery • Data mining (DM )是一个当红的专题,也 是蛮新的一个专题 • 多半的人,并不知道它能做甚么。 • 但是不能太晚上车。中研院( 赵民德) 数据源:赵民德,「统计是数据科学」人大讲稿 瞎子摸象 ?找Pattern? Trend? Relationship? 林共进 教授提供 数据源:赵民德,「统计是数据科学」人大讲稿 什么是数据挖掘 ? • 定义 – William Frawley Gregory Piatetsky Shapiro, 1991 – 从现有的大量数据中,撷取不明显的、之 前未知的、可能有用的信息 •目标 –建立起决策模型 •哪一类的用户对我的产品有兴趣 ? –根据过去的行动来预测未来的行为 数据源:赵民德,「统计是数据科学」人大讲稿 什么是 数据挖掘?

文档评论(0)

新起点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档