MATLAB数据分析方法 (1)解析.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
上一节中的数据直方图与QQ图等能直观初略描述数据的分布,本节进一步研究如何判定数据是否服从正态分布的问题。若不服从正态分布,那么又可能服从怎样的分布. 2.2 数据分布及检验 2.2.1 一元数据分布检验 1.经验分布函数 设来自总体X的样本为x1,x2,…,xn,对于任意实数x,定义函数 (2.2.1) 称为经验分布函数. 1933年,格里汶科(Glivenko)证明了以下的结果: 对于任一实数x, 当n??时Fn(x)以概率1一致收敛于分布函数, 即 这一结论表明:对于任一实数x,当n充分大时 F(x)?Fn(x) (2.2.2) 因此可用经验分布函数来近似代替F(x),这一点也是由样本推断总体的最基本理论依据之一. 在MATLAB中,作经验(累积)分布函数图形命令cdfplot,调用格式: ①cdfplot(X) %作样本X的经验分布函数图形 ②h = cdfplot(X) %h表示曲线的环柄 ③[h,stats] = cdfplot(X) %stats表示样本最小、大值、均值、中值与标准差 例2.2.1 生成服从标准正态分布的50个样本点,作出样本的经验分布函数图,并与理论分布函数比较. 解:%生成服从标准正态分布的50个样本点 X=normrnd (0,1,50,1); [h,stats]=cdfplot(X); %作样本的经验分布函数图 hold on %作理论分布函数图 plot(-3:0.01:3, normcdf(-3:0.01:3,0,1), r) 输出结果:h =3.0013 stats = min: -1.8740 %样本最小值 max: 1.6924 %最大值 mean: 0.0565 %平均值 median: 0.1032 %中间值 std: 0.7559 %样本标准差 图1.9 标准正态分及其50个样本点的经验分布函数图 2.总体分布的正态性检验 进行参数估计和假设检验时,通常总是假定总体服从正态分布,虽然在许多情况下这个假定是合理的,但是当要以此为前提进行重要的参数估计或假设检验,或者人们对它有较大怀疑的时候,就确有必要对这个假设进行检验,进行总体正态性检验的方法有很多种,以下针对MATLAB统计工具箱中提供的程序,简单介绍几种方法. (1)Jarque-Bera检验 Jarque-Bera检验简称JB检验,它是利用正态分布的偏度g1和峰度g2,构造一个包含g1,g2且自由度为2的卡方分布统计量JB,即 (2.2.3) 对于显著性水平?,当JB统计量小于分布的分位数时接受H0,即认为总体服从正态分布;否则拒绝H0,即认为总体不服从正态分布.这个检验适用于大样本,当样本容量n较小时需慎用. 在MATLAB中,JB检验命令jbtest,调用格式 [H,P,JBSTAT,CV] = jbtest(X,alpha) 其中alpha是检验水平,通常取0.05,0.01,缺省默认为0.05,若h=0,则无法拒绝正态分布;若h=1,则拒绝正态分布. (2)Kolmogorov-Smirnov检验 Kolmogorov-Smirnov检验简称KS检验,它是通过样本的经验分布函数与给定分布函数的比较,推断该样本是否来自给定分布函数的总体.设给定分布函数为G(x),构造统计量 (2.2.4) 即两个分布函数之差的最大值,对于假设H0:总体服从给定的分布G(x),及给定的?,根据Dn的极限分布确定统计量关于是否接受H0的数量界限. 因为这个检验需要给定G(x),所以当用于正态性检验时只能做标准正态检验,即H0:总体服从标准正态分布. 在Matlab中,KS检验命令kstest,调用格式 h = kstest(x) h = kstest(x,cdf) [h,p,ksstat,cv] = kstest(x,cdf,alpha) 把向量x中的值与标准正态分布进行比较并返回假设检验结果h.如果h=0表示不能拒绝原假设,即不能拒绝服从正太分布.假设的显著水平默认值是0.05.cdf是一个两列矩阵,矩阵的第一列包含可能的x值,第二列式假设累积分布函数G(x)的值,在可能的情况下,cdf的第一列应包含x中的值,如果第一类没有,则用插值的方法近似.指定显著水平alpha,返回p值,K-S检验统计量Ksstat;截断值cv.

您可能关注的文档

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档