应用统计学总复习.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《应用统计学(1)》 总复习 课程主要内容 1. 为什么要学习统计学——用数据说话 2. 描述性统计(可视化) 3. 汇总统计 (集中趋势、离散趋势) 4. 相关分析与回归分析初步 5. 时间序列分析 6. 指数 一、数据的分布中心 (集中趋势) 1. 中位数 (Median): x1  x2  …  xn 处于中间的位置观测值。 2. 众数( Mode):出现频次最多的观测值 3. 均值 (Mean): 第一章 统计数据的汇总统计 比较:均值、中位数、众数 应用建议: (1)对于名义变量,描述集中趋势的办法是: (2)对于顺序变量,描述集中趋势的最常用的办法是: (3)对于定量变量,一般使用平均值。 但当数据的直方图显示出是非对称 (偏斜)分布时,常常使用中位数。 众数 中位数 二、数据离散程度的测量 1、极差( Rang) 2、 方差 ( Variance ) 总体方差: 样本方差: 3、标准差 (Standard Deviation) Excel是用样本方差 例题: 某车间有甲、乙两人,加工某零件质量 质量数据:直径(mm) 甲: 0.7,0.7,0.8,0.8,0.8,0.8,1.0,1.1 众数 = 0.8, 中位数= 0.8, 均值 = 0.8375 乙:0.4,0.5,0.7,0.8,0.8,0.9,1.2,1.4 众数 = 0.8, 中位数 = 0.8, 均值 = 0.8375 问题: 谁是师傅? Excel 计算过程: 平均值 总体方差 样本方差 另一种方差计算方法 方差计算方法 其他扩展内容 2、离散系数 (Coefficient of Variation) 1. 四分位极差( Interquartile Rang) 3、 异众比(Variation Ratio): 四分位极差 = Q3 - Q1 定性数据离散程度的度量 三、数据的标准化处理: 1. 中心化——压缩 性质: 均值为0 方差等于1 2. 消除均值的作用 性质: 均值恒等于1 3. Max-min 标准化 离散系数 四. 数据的标准得分 (改成要求内容) Chebyshev 定理: 令c 为任意大于1的数值。对于任意分布的数据集合, 在(- c, +c) 区间内,所包含的观测值比例至少是(1- 1/c2 ) 。 当 : c=2 : (1- 1/c2 ) = 75% c=3: (1- 1/c2 ) = 89% c=4: (1- 1/c2 ) = 93% 经验规则: 对于近似钟形分布的总体或样本分布, 在(- , + )区间,有 68% 在(- 2, +2 )区间,有 95% (75%) 在(- 3, +3)区间,有 99.7% (89%) 的观测值将落入该区间内。 如果员工工资呈钟形对称分布,至少95% 的员工工资在以下的区间内: (1266.47, 1986.91) 数据的标准得分: Z score : 对于总体数据: Z= (X - )/ 例:某中学高三年级连续两次考试的平均成绩分别为78.53分和70.19分,标准差分别为9.43分和7分。某学生两次考试的成绩分别为90分和82分。问他在年级的排名退步了吗? ( 90–78.53)/ 9.43=1.22 (82 –70.19)/7=1.69 问题:如果年级共有500人,可否大致判断他的排名不低于多少? 拓展内容: 数据分布的偏度与峰度 偏态系数(coefficient of skewness): 基本思想:使用数据集合的“三阶中心矩” 峰度系数(coefficient of kurtosis) Ku: 某一数据分布与正态分布相比的尖峰程度或平坦程度 Sk = 0 对称分布 Sk 0 右偏 Sk 0 左偏 Ku = 0 正态分布 Ku 0 尖峰 Ku 0 扁平 第四章 相关分析与回归分析初步 一、Pearson 相关系数 记 (1) -1 r  1 (2) 0 r  1: 正线性相关 (3) -1 r 0: 负线性相关 (4) r = 0: 线性无关 (5) r =1: 完全正线性相关 (6) r= -1: 完全负线性相关 二、 Spearman 秩相关系数(拓展内容

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档