- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
六西格玛内训课件
基础统计
;基础统计理论;第一部分
统计目的;你看到了什么?;你需要整个图片!;数据的重要性;数据对六西格玛很重要;统计思想; ;当重复测量时,经常产生不同的结果,这就是偏差;我们是期望能够观察出偏差的,如果没有偏差那肯定会有问题
如果所有的区域的产品的销售量完全相同,我们将怀疑数据的真实性.;统计领域用下列方法处理偏差;过程偏差;第二部分
数据分类;数据的种类;连续型数据;离散型数据;数据类型比较;练习: 这是什么种类的数据 ?;第三部分
统计概述;总体
想要测量对象的全部
参数
用总体的所有数据计算出的数值(如均值,
标准差), 称为总体的参数 ;统计学基本术语;;参数和统计量符号;数据位置测量;样本均值
若样本(样本量为n)的观测值为x1,x2,…xn,则样本均值为:
类似地,一个有着大量但限个(N个)观测值的总体,其总体均值 为:;练习三
10个连接线的拉拔强度为 :
230 240 236 248
252 278 265 262
拉拔强度的均值是多少?
10个观测值的均值为:
;练习四
199X年一个行动中,战机进行了3000次战斗,总共用时6900小时。那末每次战斗平均用时多少?
每次战斗平均用时为:
;均值的计算使用了每个观测值;每个观测值对均值都有影响。
所有观测值对均值的偏差的总和为零。
均值对极端的观测值很敏感,极端值会导致均值向他偏移。; 将一组观测值按大小顺序排列,位于中心的数值即为中值
若观测值的个数为偶数,则中值为中间2个数值的平均
若观测值的个数为奇数,则位于中心的数值即中值;样本中值
假如x (1),x (2) ,…,x (n) )是按大小排序的样本值,则样本中值为:
中值的优点是不受极端大或极端小的观测值的影响。;练习五
假设一个样本观测值为 :
3 1 2 4 7 8 6
样本均值和样本中值是多少?
这2个值是测量数据中心趋势的合理指标吗?
;(b) 假如最后一个数值改变为 :
3 1 2 4 7 8 2680
则样本平均值和样本中值是多少?
据此你有何结论?
;Median vs Mean 中值与均值
因为中值不象均值对极端值敏感,因此,当有???端大或极端小值时,中值比均值更能代表数据的位置
典型的例子是一个城市居民的收入中位值
;中值有时会有欺骗性;众数是样本中出现次数最多的观测值。
众数可以是唯一的,也可以有不止一个,有时并不存在众数。
;练习六
如果样本观测值为:
(a) 6 9 13 5 8 13 4 6 13 1 10 13
6 9 13 5 8 13 4 6 13 1 10 6 2 5 6 13
4 3 7 2 6 8 1
众数是什么?
具有一个众数,两个众数或多于两个众数分布的数据分布叫什么?(单峰分布…);;均值、中值、众数的比较;四分值;练习七
以下为20个电灯泡失效期间的观测值, 已按递增顺序排列.
210 216 252 300 366 454 624 720 816 924 1216
1296 1392 1488 1542 2480 2856 3192 3528 3710
请确定三个四分值.
;答案
Q1的位置:(n+1)/4=(20+1)/4=21/4=5.25
Q2的位置:2(n+1)/4=2(20+1)/4=2*21/4=10.5
Q3的位置:3(n+1)/4=3(20+1)/4=3*21/4=15.75
则:
Q1=366+(454-366)*0.25=388
Q2=924+(1216-924)*0.5=1070
Q3=1542=(2480-1542)*0.75=2245.5
;数据散布的测量(变异);极差;试考虑以下的2个样本:
{ 10 20 50 60 70 90 } and { 10, 40, 40, 40, 90}
具有相同的极差(r= 80)
但是,第二个样本的变异只是2个极端数值的变异,而在第1个样本,中间的数值也有相当大的变异.
当样本量较小(n≤10)时,极差丢失信息的问题不是很严重;方差与标准差;方差计算;i xi xi-x (x
文档评论(0)