- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《应用统计学(1)》总复习
课程主要内容
1. 为什么要学习统计学——用数据说话
2. 描述性统计(可视化)
3. 汇总统计 (集中趋势、离散趋势)
4. 相关分析与回归分析初步
5. 时间序列分析
6. 指数
一、数据的分布中心 (集中趋势)
1. 中位数 (Median): x1 x2 … xn
处于中间的位置观测值。
2. 众数( Mode):出现频次最多的观测值
3. 均值 (Mean):
第一章 统计数据的汇总统计
比较:均值、中位数、众数
应用建议:
(1)对于名义变量,描述集中趋势的办法是:
(2)对于顺序变量,描述集中趋势的最常用的办法是:
(3)对于定量变量,一般使用平均值。
但当数据的直方图显示出是非对称
(偏斜)分布时,常常使用中位数。
众数
中位数
二、数据离散程度的测量
1、极差( Rang)
2、 方差 ( Variance )
总体方差:
样本方差:
3、标准差 (Standard Deviation)
Excel是用样本方差
例题: 某车间有甲、乙两人,加工某零件质量
质量数据:直径(mm)
甲: 0.7,0.7,0.8,0.8,0.8,0.8,1.0,1.1
众数 = 0.8, 中位数= 0.8, 均值 = 0.8375
乙:0.4,0.5,0.7,0.8,0.8,0.9,1.2,1.4
众数 = 0.8, 中位数 = 0.8, 均值 = 0.8375
问题: 谁是师傅?
Excel 计算过程:
平均值
总体方差
样本方差
另一种方差计算方法
方差计算方法
其他扩展内容
2、离散系数 (Coefficient of Variation)
1. 四分位极差( Interquartile Rang)
3、
异众比(Variation Ratio):
四分位极差 = Q3 - Q1
定性数据离散程度的度量
三、数据的标准化处理:
1. 中心化——压缩
性质:
均值为0
方差等于1
2. 消除均值的作用
性质: 均值恒等于1
3. Max-min 标准化
离散系数
四. 数据的标准得分 (改成要求内容)
Chebyshev 定理:
令c 为任意大于1的数值。对于任意分布的数据集合, 在(- c, +c) 区间内,所包含的观测值比例至少是(1- 1/c2 ) 。
当 : c=2 : (1- 1/c2 ) = 75%
c=3: (1- 1/c2 ) = 89%
c=4: (1- 1/c2 ) = 93%
经验规则:
对于近似钟形分布的总体或样本分布,
在(- , + )区间,有 68%
在(- 2, +2 )区间,有 95% (75%)
在(- 3, +3)区间,有 99.7% (89%)
的观测值将落入该区间内。
如果员工工资呈钟形对称分布,至少95% 的员工工资在以下的区间内:
(1266.47, 1986.91)
数据的标准得分:
Z score :
对于总体数据:
Z= (X - )/
例:某中学高三年级连续两次考试的平均成绩分别为78.53分和70.19分,标准差分别为9.43分和7分。某学生两次考试的成绩分别为90分和82分。问他在年级的排名退步了吗?
( 90–78.53)/ 9.43=1.22
(82 –70.19)/7=1.69
问题:如果年级共有500人,可否大致判断他的排名不低于多少?
拓展内容:数据分布的偏度与峰度
偏态系数(coefficient of skewness):
基本思想:使用数据集合的“三阶中心矩”
峰度系数(coefficient of kurtosis) Ku:
某一数据分布与正态分布相比的尖峰程度或平坦程度
Sk = 0 对称分布
Sk 0 右偏
Sk 0 左偏
Ku = 0 正态分布
Ku 0 尖峰
Ku 0 扁平
第四章 相关分析与回归分析初步
一、Pearson 相关系数
记
(1) -1 r 1
(2) 0 r 1: 正线性相关
(3) -1 r 0: 负线性相关
(4) r = 0: 线性无关
(5) r =1: 完全正线性相关
(6) r= -1: 完全负线性相关
二、 Spearman 秩相关系数(拓展内容
文档评论(0)