网站大量收购闲置独家精品文档,联系QQ:2885784924

1-1吴喜之教授-统计应用与陷阱ppt课件.pptVIP

1-1吴喜之教授-统计应用与陷阱ppt课件.ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1-1吴喜之教授-统计应用与陷阱ppt课件

统计无所不在 越来越多的人意识到统计在人类生活的各个方面所起的重大作用。 几乎所有的领域都有统计的痕迹 统计为什么这样火爆 统计被人看重的原因是供不应求 。 一是统计的巨大市场。 另一个是统计专业所需要的包括数学、统计和计算机在内的功底,绝不是通过任何速成训练就能够达到的。 人们知道,学数学的改行学什么的都有(反之不然),但即使是学纯粹数学的,改行学统计,也不象数学改行力学或物理那么容易。 统计应用与学科发展 统计专业的研究生毕竟有限。世界上各领域的多数统计工作都还是该领域的人士进行的。 目前方便而又直观的统计软件对于普及统计的应用,功不可没。 只有统计得到充分的普及,这个学科才能得到长足的发展。 统计应用与学科发展 而专业统计工作者的主要任务,则是根据各领域的需要,发展新的统计方法和理论,建立新的模型,发展新的计算方法。 统计方法(或理论)的改进和创新和统计的广泛应用是相辅相成的。 统计是什么 ? 首先必须提及似乎只有在中国才有争议的统计定义。我相信,世界上多数统计学家都会同意下面《大英百科全书》的关于统计的定义:用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。 这个定义强调了统计以归纳为主的思维方式,这使得统计显然不同于以演绎思维为主的数学。 该定义也体现了统计为各个领域进行数据分析的服务性命运。 统计不是数学 由于统计需要大量的数学,而且现代统计的基础也是数学家所奠定的,统计也被人认为是数学的一个分支。这没有什么不可,就看如何定义数学了。 但统计肯定不应属于数学(严格地说是纯粹数学)的范畴。 统计和数学都是可以为各个领域服务的。但是统计和数学有很大的区别。 统计和数学有不同的宗旨 和音乐类似,数学圈内的人士可以欣赏数学本身的美妙的境界。 以演绎为主的数学本身可以是个完美的世界。 而旨在为各个领域服务的统计如果满足于欣赏自己的“魅力”,那统计就没有存在的必要了。 以归纳为主的统计离不开现实世界。 按照著名统计学家C. R. Rao 在终极的分析下,一切知识都是历史 在抽象的意义下,一切科学都是数学 在理性的基础上,所有的判断都是统计学 统计与现实之间 作为现实世界的代表是人们按照自己的想法收集的数据(信息) 体现人们对现实世界的认识是某些用数学语言表示的模型、或一些想象的不易验证的假定 这些模型仅仅是对现实的某种近似 这种模型存在的一个必要条件是它们必须能够被人们解出来 统计与现实之间 模型的这些解可能是近似模型的精确解(一些数理统计工作者的强项) 也可能是近似模型的近似解 这些解可能有在一定概念下的“最优性” 从数学语言描述的结论和可以适用于现实世界的结论之间还有容易被忽略的但有可能是致命的鸿沟。 统计显著不一定等价于实际显著;有时差别相当大 危险和挑战无处不在 从有某些“目的”地收集数据到建立基于某些假定和猜想的模型、从寻找解的方法到计算机输出的解释,充满了危险和挑战。 这些在一般的教科书中是不会体现出来的 为了教学的目的,教科书把本来复杂的世界进行简化,对于让更多的人能够理解统计的方法和用处,是完全必要的。 哪一个学科又不是这样呢? 危险和挑战无处不在 如果已经掌握了一定的知识,无论是什么领域,就有必要认识到教科书和现实之间的差距 多数教科书倾向于把世界过于理想化,使人们,特别是缺乏实际经验的学生,有把一个人造的、(并不完全虚幻)的世界当成真实的世界的可能。 这并不是个大问题。 但如果我们这些写教科书的教师或“权威”也这么认为,问题就没这么简单了。 收集数据时的主观性 数据被认为是反映现实世界最客观的东西 但数据是人收集的,必定带有主观性 收集什么变量的数据,显然是主观的 当然,你可以说这属于模型中变量选择的问题,似乎不属于数据收集(?) 就是数据收集本身,就有很多学问,比如在抽样调查时,调查对象,调查内容,抽样方法,调查表的设计,调查人员的挑选等等都直接影响着调查结果的可信性。 收集数据时的主观性 收集数据的间隔,区间的划分等更是容易被人忽视 比如,把鼻咽癌患者的淋巴结大小,按照淋巴结的实际厘米数将病例划分为四组,0,0-3,3-6,6cm 这种等距离(3cm区间)分区的观念是出自于我们自认为均匀分区是“客观的”或“无信息的” 我们似乎永远也无法确定我们自己所感兴趣的空间是什么别的空间变换的结果 我们究竟是在什么空间中呢 从空间想到模型 我们都知道…… 地震的震级之间的能量不是等距的 患者从发病到病愈的各种变化,也不是用等距的时间来度量就合适的 药物在体内的吸收,青少年的成长,顾客量的变化,销售额的增长等等就更不是应该用等时间间隔来度量 许多统计学家在做回归之前总是试图对数据进行一些变换看来不是没有道理的。 “线性”只是数学上容易处理的一个理想状态 或者是官员制造统计数据的一个方便的模型 模型

文档评论(0)

118zhuanqian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档