实验6 相关回归分析.ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验6 相关回归分析.ppt

直线回归与相关 直线回归与相关 * 如身高~体重、体重与体表面积、血压与年龄等。 此时两个变量一般以数据对(xi,yi)的形式来表示: (1)依存关系:因变量(dependent variable) Y 随自变量 (independent variable) X 变化而变化。 —— 回归分析 (2)互依关系:Y 与 X 间的彼此关系 。 —— 相关分析 * 相关分析:两个变量之间的相关分析可以利用CORR过程完成。如果两个变量服从双变量正态分布,可以做直线相关分析,计算Pearson相关系数。 回归分析:回归分析在SAS中使用的是REG过程和NLIN过程。 REG过程直接对符合线性回归的变量进行直线回归分析;NLIN过程则用于非线性回归分析。 * §1 直线相关分析 例1 随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如右表所示。据此数据如何判断这两项指标间有否相关? * 如果两变量间存在直线趋势,则利用CORR过程进行相关分析:计算Pearson相关系数并对相关系数进行假设检验。 首先绘制两变量间的散点图,利用plot语句,并且规定散点图中的点子用“*”表示。 data line; input x y@@; cards; 1.1 13 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.8 16 0.6 17 1.0 14 0.9 16 1.1 15 0.7 16 1.1 14 0.6 18 0.7 17 ; proc plot; plot y*x=*; proc corr; var x y; run; * 两变量的散点图:可以看出所有的点子基本上分布在一条狭长的带状区域内,可以认为存在线性趋势,可以进行线性相关分析。 Pearson相关系数及其假设检验结果,可以看出两变量存在线性相关关系,r=-0.93617,P0.0001。 在该结果前面SAS还会给出对两个变量的基本的统计描述指标。 * 对同一个例子进行回归分析:根据前面的散点图已经知道两变量间存在线性关系,可以进行直线回归分析。 回归分析时选用SAS中的REG过程,并需要指定模型形式为:model y=x; §2 直线回归分析 data line; input x y@@; cards; 1.1 13 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.8 16 0.6 17 1.0 14 0.9 16 1.1 15 0.7 16 1.1 14 0.6 18 0.7 17 ; proc plot; plot y*x=*; proc reg; model y=x; run; * 对整个模型的假设检验(方差分析):F=92.19,P0.0001,模型有意义。 剩余标准差 y的均数 y的变异系数 决定系数 校正决定系数 输出对截距项以及自变量的假设检验(t检验)的结果,都有统计学意义。 * 如果在model语句后面再加上其它选择项,可以得到另外一些统计量: 如果加上stb,语句为“model y=x/stb”,可以输出标准化回归系数。 如果加上p,语句为“model y=x/p”,可以输出每个观测点的因变量y的实际值、预测值和残差(实际值与预测值的差值)。 data line; input x y@@; cards; 1.1 13 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.8 16 0.6 17 1.0 14 0.9 16 1.1 15 0.7 16 1.1 14 0.6 18 0.7 17 ; proc reg; model y=x/stb p; run; * 加stb选择项后输出的自变量的标准化回归系数。 加上p选择项后输出的y的实际值、预测值和残差。 最下面三项依次为残差和、残差平方和以及预测的残差平方和。 * (1)clm:语句为“model y=x/clm”,可以输出因变量预测值均数的双侧95%可信区间。 (2)cli:语句为“model y=x/cli”,可以输出因变量预测值个体的95%容许区间。 (3)r:输出残差分析的结果。除了p选项的内容外,还包括预测值和残差的标准误、student

文档评论(0)

zzqky + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档