- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验10 数据的统计与分析
题目3
【问题描述】
某厂从一台机床生产的滚珠中随机抽取20个,测得直径(mm)如下:
14.6,14.7,15.1,14.9,14.8,15.0,15.1,15.2,14.8,14.3,15.1,14.2,14.4,14.0,14.6,15.1,14.9,14.7,14.5,14.7
试给出这些数据的均值、标准差、方差、极差,并画出直方图。
【问题求解】
利用Matlab的统计工具箱及相关命令可以得到该组数据的统计量及直方图。
在Matlab中编写代码如下:
%-------------------------------作业题10_3脚本M文件源程序-------------------------
clear all;clc;
% 输入数据
X=[14.6 14.7 15.1 14.9 14.8 15.0 15.1 15.2 14.8 14.3 15.1 14.2 14.4 14.0 14.6 15.1 14.9 14.7 14.5 14.7];
% 频数表(等分区间数10)
[N,Y]=hist(X),
% 直方图(等分区间数10)
hist(X),title(滚珠直径数据直方图(等分区间数10));
pause
% 直方图(等分区间数20)
hist(X,20),title(滚珠直径数据直方图(等分区间数20));
% 平均值
x1=mean(X)
% 中位数
x2=median(X)
% 极差
x3=range(X)
% 标准差
x4=std(X)
% 方差
var(X)
% 偏度
x5=skewness(X)
% 峰度
x6=kurtosis(X)
得到的结果如下面的表1和图1:
表1:滚珠直径数据统计量
均值
标准差
方差
极差
偏度
峰度
14.7350
0.3329
0.1108
1.2000
-0.5342
2.4817
表2:滚珠直径数据频数表
中点
14.06
14.18
14.30
14.42
14.54
14.66
14.78
14.90
15.02
15.14
频数
1
1
1
1
3
3
2
2
1
5
图1:滚珠直径数据直方图
【结果分析】
利用数据的统计量和相关统计图形可以推测出整体的某些简单性质。
平均值:利用样本的平均值,可以推测该机床生产的所有滚珠的平均直径为14.7350mm;
标准差,方差:标准差的定义为,方差是标准差的平方s2。标准差和方差都是是数据与均值偏离程度的度量,反映了数据的变异程度。本题中滚珠直径数据s=0.3329,相对来说该机床生产的滚珠直径的分散程度较小。
极差:极差是x=(x1,x2,…xn)的最大值与最小值之差。本题所取的滚珠样本中,最大的直径与最小的直径之差为1.2mm。
直方图:直方图是频数表的图形形式,可以直观地显示出数据的分布情况。由图1可见,直径在14.6mm和15.1mm附近的滚珠比例较大。
【拓展分析、思考】
①对其它一些统计量的分析
可以借助本题的滚珠直径数据对其他一些统计量,如偏度,峰度等进行一些分析,从而更好地理解它们的定义和性质等。
利用Matlab的median,skewness,kurtosis等命令可以得到数据的相关统计量如下:
表3:滚珠直径数据的其他一些统计量
中位数
偏度
峰度
14.7500
-0.5342
2.4817
中位数:中位数是将数据由小到大排序后位于中间位置的那个数值。当样本容量为奇数时,中位数唯一确定;当样本容量为偶数时,中位数为中间两个数的平均值。因而,本题样本中直径数值处在中间位置的两个滚珠的直径的平均值为14.75mm。
偏度:偏度是表示数据分布形状的统计量,其定义为,它反映数据分布的对称性,g10为右偏态,此时数据位于均值右边的比左边的多;反之,g10
峰度:峰度是分布形状的另一种度量,其定义为。若g2比3大得多,表示分布由沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可以用作衡量偏离正态分布的尺度之一。本题样本数据的峰度g2
②对直方图的等分区间个数的一些分析
改变hist(x,k)命令中的k的值可以调整等分区间的个数。对于本题的样本数据,分别令k=5,10,20,得到结果如下:
图2:等分区间个数不同时的直方图
可以看到,等分区间的个数不同,对应的直方图也不一样。当等分区间数较少时,直方图在外观上相对较为平缓,能够显示出数据的大致分布情况,但由于数据区间比较大,因而在一个区间内的数据变化得不到反映;而当等分区间较大时,直方图在外观上相对跳动比较大,能够显示出较小范围内数据的分布细节或变化情况,但如果区间过小,这些分布细节或者变化情况反而会影响或者掩盖数据的整体分布情况。因此,应当根据样本数据的实际情况以及分析的需要来确定何时的等分区间。
③利用其它方法求统
文档评论(0)