初级统计及回归分析重点
数据统计分析初级统计及回归分析顾世梁2008.09 Anovan (多因素资料的方差分析) Anovan(x, group, model) 三因素 model=[1 2 3 4 5 6 7] (三因素方差分析编码表) 四因素方差分析编码表(model) 3.7 一些处理效应再分解的方差分析 1)单一自由度比较; 2)其他分解的一些实例。 Lsh.m; cg.m. 4 4 4 4 4 n 20 T2=80 20 E 31.5 D 30 T2=240 28.5 C 24.5 B 25.75 T1=206 27.875 T1=446 27 A AB vs CD ABCD vs E 平均数 处理 如例8.1(水稻N肥试验),5个处理(ABCDE)具有SSt=301.2,dft=4,可将其进一步分解: ABCD vs E df1=1, SS1=198.45;AB vs CD df2=1, SS2=72.25 A vs B df3=1, SS3=12.5; C vs D df4=1, SS4=18.0 4 回归和相关分析 4.1 一元线性回归分析 对于双变数资料的回归分析,主要有三项任务: 1)建立 Y 依 X 的量化关系,即估计回归统计数和回归方程; 2)估计离回归误差,对回归方程和回归统计数进行统计假设测验; 3)回归方程的进一步利用。 模型: 据: 对Q分别对a、b求偏导并 使其为0,得正规方程组: 解得: 4.2 回归分析的矩阵方法 回归分析是用最小二乘法(least squares method)估计回归统计数B’=(a, b),使离回归平方和(Q, RSS)最小: 实例和matlab命令集 clear; clc x=[1.58, 9.98, 9.42, 1.25, .30, 2.41, 11.01, 1.85, 6.04, 5.92] y=[180, 28, 25, 117, 165, 175, 40, 160, 120, 80] x=x(:); y=y(:); n=size(y,1); SSy=var(y)*(n-1); SSx=var(x)*(n-1); xbar=mean(x); ybar=mean(y); X=[ones(n,1),x]; A=X*X; K=X*y; SumX=A(1,2); SumY=K(1); SumX2=A(2,2); SumXY=K(2); SP=SumXY-SumX*SumY/n C=inv(A), B=A\K, B=C*K, B=X*X\X*y, b=X\y Q=y*y-B*K, U=SSy-Q, MSQ=Q/(n-2), syx=sqrt(MSQ) F=U/MSQ; p=1-fcdf(F,1,n-2); disp([F=,num2str(F), p=,num2str(p)]) sa=syx*sqrt(C(1,1)), sb=syx*sqrt(C(2,2)) ta=b(1)/sa; pa=2*tcdf(-abs(ta),n-2); disp([ta=,num2str(ta), p=,num2str(pa)]) tb=b(2)/sb; pb=2*tcdf(-abs(tb),n-2); disp([tb=,num2str(tb), p=,num2str(pb)]) r=corr(x,y), r2=SP^2/SSx/SSy sr=sqrt((1-r^2)/(n-2)), tr=r/sr 4.3 多元线性回归分析 当其中的自变数不显著时,应将其剔除。剔除的过程应采用逐步回归的方法,即每次剔除一个偏回归平方和最小且不显著的自变数,直至所有的自变数均显著(下同)。 实例和matlab命令集 clear;clc,alpha=.05; x1=[10, 9, 10, 13, 10, 10, 8, 10, 10, 10, 10, 8, 6, 8, 9]; x2=[23, 20, 22, 21, 22, 23, 23, 24, 20, 21, 23, 21, 23, 21, 22]; x3=[3.6,3.6,3.7,3.7,3.6,3.5,3.3,3.4,3.4,3.4,3.9,3.5,3.2,3.7,3.6]; x4=[113, 106,111,109,110,103,100,114,104,110,104,109,114,113,105]; y=[15.7,14.5,17.5,22.5,15.5,16.9,8.6,17,13.7,13.4,20.3,10.2,7.4,11.6,12.3]; x=[x1,x2,x3,x4]; load regm %x=rand(100,40);y
原创力文档

文档评论(0)