统计思维与典型案例的分析1.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计思维与典型案例的分析 统计与概率是高中数学新课程的基础知识 ?统计是研究如何合理收集、整理、分析数据的学科,它可 以为人们制定决策提供依据 ?随机现象在日常生活中随处可见,概率是研究随机现象规律的学科,它为人 们认识客观世界提供了重要的思维模式和解决问题的方法,同时为统计学的发展提供了理论基础 ?统计与 概率的思想方法有助于培养学生以随机的观点来理解世界,形成正确的世界观与方法论,为以后进一步学 习和工作做好准备?在教学中,学生将通过解决实际问题,较为系统地经历数据收集与处理的全过程,体 会统计思维与确定性思维的差异;结合具体的实例,加深对随机现象以及概率意义的理解 在选修2—3这一模块中,学生将在必修课程学习的基础上, 学习计数原理、统计案例和概率?通过对 典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想, 认识统计方法在决策中的作用 统计学最关心的是:我们的数据能提供那些信息 ?具体地说,面对一个实际问题,我们关心的是( 1) 如何抽取数据;(2)如何从数据中提取信息;(3)所得结论的可靠性. 案例1回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法 我们知道,函数关系是一种确定性关系,而相关关系是一种非确定性关系 例1 :从某大学中随机选取 8名女大学生,其身高和体重数据如表: 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重. 作出散点图,得到回归方程是 ? 0.849X 85.712 所以,对于身高172cm的女大学生,由回归方程可以预报其体重为 ? 60.316(kg) 案例2 假设检验 假设检验是利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,即 在论述H不成立的前提下,有利于 H的小概率事件发生,就推断 H发生. 例2 :某地区的羊患某种病的概率是 0.4,且每只羊患病与否是彼此独立的,今研制一种新的预防药, 任选6只羊做实验,结果 6只羊服用此药后均未患病.你认为这种药是否有效? 现假设“药无效”,则事件“ 6只羊都不患病”发生的概率为 (1 0.4)6 0.0467,这是一个小概率事 件.这个小概率事件的发生,说明“药无效”的假设不合理,应该认为药是有效的 案例3独立性检验 独立性检验是对两种分类变量之间是否有关系进行检验 例3 :为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了 9965人,得到如下结果:(吸烟 与患肺癌列联表) 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否对患肺癌有影响? 由列联表可以粗略估计出:在不吸烟者中,有 0.54%患有肺癌;在吸烟者中,有 2.28%患有肺癌. 现在想要推断的论述是 H。:吸烟与患肺癌没有关系 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a b 吸烟 c d c d 总计 a c b d a b c d ,a(c d) c(a b), ad be 0 c d 构造一个随机变量 K2n(ad be) 其中 n abed 构造一个随机变量 K2 (a b)(c d )(a c)(b d) 在“吸烟与患肺癌没有关系”成立的条件下可以估算出 2 2 2 P(K 6.635) 0.01,P(K 3.841) 0.05,P(K 2.706) 0.10. 案例4 聚类分析 聚类分析是根据研究对象(个体)的某些指标的数值特征,将对象进行分类的方法 在聚类分析中,我们关心如何刻画点与点、类与类之间的“远近” ,关心聚类的基本思想.鼓励学生给 出不同的刻画“远近”的办法,并能让学生认识到不同方法会得到不同的结果 谱系聚类是一种逐次合并类的方法,最后得到一个聚类的二叉树聚类图。其想法是,对于 n个观测, 先计算其两两的距离得到一个距离矩阵,然后把离得最近的两个观测合并为一类,于是我们现在只剩了 n 1个类(每个单独的未合并的观测作为一个类) 。计算这 个类两两之间的距离,找到离得最近的两个 类将其合并,就只剩下了 n 2个类……直到剩下两个类,把它们合并为一个类为止。当然,真的合并成 一个类就失去了聚类的意义,所以上面的聚类过程应该在某个类水平数(即未合并的类数)停下来,最终 的类就取这些未合并的类。决定聚类个数是一个很复杂的问题。 例4 :如何对草莓、橙子、桃子、苹果、梨等 5种水果进行分类? 可选取的指标:大小、形状、颜色、味道、各种维生素的含量等,既可以选取一个

文档评论(0)

kunpengchaoyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档