多元统计分析建模知识讲稿.pptVIP

  • 6
  • 0
  • 约2.56千字
  • 约 47页
  • 2018-04-09 发布于天津
  • 举报
多元统计分析建模知识讲稿.ppt

统计与应用数学学院;目 录; Box-Cox变换是统计建模中常用的一种数据变换,用于连续的响应变量不满足正态分布的情况。比如在使用线性回归的时候,由于残差不符合正态分布而不满足建模的条件,这时候要对响应变量进行变换,把数据变成正态的。 ;在MATLAB中,上述变换的命令如下: [t,l]=boxcox(x) 其中 x是原始数据(列向量),t是变换以后的数据,l是变换公式中参数?的数值; QQ图的作用用于直观验证一组数据是否来自某个分布,或者验证某两组数据是否来自同一(族)分布。在教学和软件中常用的是检验数据是否来自于正态分布。 把已知分布的分位数标在纵轴上,样本分位数标在横轴上,从图形上可以了解到分布的信息。; 图形是直线说明是正态分布。图形中有一段是直线,在两端存在弧度,说明峰度的情况。图形是曲线图,说明不对称。 如果Q-Q图是直线,当该直线成45度角并穿过原点时,说明分布与给定的正态分布完全一样。如果是成45度角但不穿过原点,说明均值与给定的正态分布不同,如果是直线但不是45度角,说明均值与方差都与给定的分布不同。如果Q-Q图中间部分是直线,但是右边在直线下面,左边在直线上面,说明分布的峰度大于3,反之说明峰度小于3. ;从图上可以看出散点并不聚集在直线上,因此流域成灾面积(原始数据)不服从正态分布,这一点也可以通过jbtest检验来证实.但是通过变换以后的图形如图2所示,显然数据服从正态分布.;X1;例2 做出x1,x3的散点图,可否区别开?;[y3,t3]=boxcox(a(:,3));[y1,t1]=boxcox(a(:,1)); plot(y3,+),hold on, plot(y1,or),legend(y3,y1);2. 其他变换公式;模糊交集与模糊并集;二;;例3. 2007年安徽省各地市工业企业效益指标如下表所示,请利用模糊C 均值聚类方法分为三类。;b=[39.63,…] ; % 输入数据作为一个矩阵 [center,U,fcn] = fcm(b,3); %模糊C均值聚类;U = 0.8082 0.0041 0.0022 0.0003 0.0122 0.0103 0.0071 0.0080 0.0010 0.1154 0.9479 0.0248 0.0047 0.5827 0.3144 0.9579 0.8523 0.0161 0.0764 0.0480 0.9730 0.9950 0.4051 0.6753 0.0351 0.1396 0.9829 0.9861 0.0064 0.8896 0.0047 0.7069 0.0117 0.0467 0.0105 0.0091 0.1482 0.0752 0.0987 0.2046 0.0944 0.8457 0.0872 0.0048 0.8454 0.0353 0.8966 0.0885 0.8939 0.1076 0.9023;表4. 2001- 2005年灾情数据;主成分分析;1.主成分的基本思想; 求l1使var(Y1)取最大值,由此 l1所确定的随机变量Y1称为随机变量 的第一主成分 .;一般地,求第i个主成分Yi,则要求其系数及主成分满足以下条件:;① 无量纲化;;地 区;解:首先输入数据 A=[data]; % data即表中数据 R=corrcoef(A);;w=sum(d)/sum(sum(d)); % 计算贡献率 F=[A-ones(17,1)*mean(A)]*v(:,5); % 计算主成分得分 [F1,I1]=sort(F,descend); % I1给出各名次的序号 [F2,I2]=sort(I1); % I2给出各市排名;地 区;3. 因子载荷矩阵;典型相关分析;图4.7 典型相关分析示意图;1.总体典型变量的定义;根据典型相关的思想,分别考虑X,Y的线性组合;在约束条件 a1T?11a1=b1T?22b1=1下,求; 一般地,若前

文档评论(0)

1亿VIP精品文档

相关文档