实验6 相关回归分析.ppt

下载文档 降价啦

14
0
约3.25千字
约 18页
2018-09-21 发布于山东
举报
版权申诉
保障服务

实验6 相关回归分析.ppt

1、本文档共18页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

实验6 相关回归分析.ppt

直线回归与相关直线回归与相关 * 如身高~体重、体重与体表面积、血压与年龄等。此时两个变量一般以数据对（xi，yi）的形式来表示：（1）依存关系：因变量(dependent variable) Y 随自变量 (independent variable) X 变化而变化。 —— 回归分析（2）互依关系：Y 与 X 间的彼此关系。 —— 相关分析 * 相关分析：两个变量之间的相关分析可以利用CORR过程完成。如果两个变量服从双变量正态分布，可以做直线相关分析，计算Pearson相关系数。回归分析：回归分析在SAS中使用的是REG过程和NLIN过程。 REG过程直接对符合线性回归的变量进行直线回归分析；NLIN过程则用于非线性回归分析。 * §1 直线相关分析例1 随机抽取15名健康成人,测定血液的凝血酶浓度（单位/毫升）及凝固时间，数据如右表所示。据此数据如何判断这两项指标间有否相关? * 如果两变量间存在直线趋势，则利用CORR过程进行相关分析：计算Pearson相关系数并对相关系数进行假设检验。首先绘制两变量间的散点图，利用plot语句，并且规定散点图中的点子用“*”表示。 data line; input x y@@; cards; 1.1 13 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.8 16 0.6 17 1.0 14 0.9 16 1.1 15 0.7 16 1.1 14 0.6 18 0.7 17 ; proc plot; plot y*x=*; proc corr; var x y; run; * 两变量的散点图：可以看出所有的点子基本上分布在一条狭长的带状区域内，可以认为存在线性趋势，可以进行线性相关分析。 Pearson相关系数及其假设检验结果，可以看出两变量存在线性相关关系，r=-0.93617，P0.0001。在该结果前面SAS还会给出对两个变量的基本的统计描述指标。 * 对同一个例子进行回归分析：根据前面的散点图已经知道两变量间存在线性关系，可以进行直线回归分析。回归分析时选用SAS中的REG过程，并需要指定模型形式为：model y=x； §2 直线回归分析 data line; input x y@@; cards; 1.1 13 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.8 16 0.6 17 1.0 14 0.9 16 1.1 15 0.7 16 1.1 14 0.6 18 0.7 17 ; proc plot; plot y*x=*; proc reg; model y=x; run; * 对整个模型的假设检验（方差分析）：F=92.19，P0.0001，模型有意义。剩余标准差 y的均数 y的变异系数决定系数校正决定系数输出对截距项以及自变量的假设检验（t检验）的结果，都有统计学意义。 * 如果在model语句后面再加上其它选择项，可以得到另外一些统计量：如果加上stb，语句为“model y=x/stb”，可以输出标准化回归系数。如果加上p，语句为“model y=x/p”，可以输出每个观测点的因变量y的实际值、预测值和残差（实际值与预测值的差值）。 data line; input x y@@; cards; 1.1 13 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.8 16 0.6 17 1.0 14 0.9 16 1.1 15 0.7 16 1.1 14 0.6 18 0.7 17 ; proc reg; model y=x/stb p; run; * 加stb选择项后输出的自变量的标准化回归系数。加上p选择项后输出的y的实际值、预测值和残差。最下面三项依次为残差和、残差平方和以及预测的残差平方和。 * （1）clm：语句为“model y=x/clm”，可以输出因变量预测值均数的双侧95%可信区间。（2）cli：语句为“model y=x/cli”，可以输出因变量预测值个体的95%容许区间。（3）r：输出残差分析的结果。除了p选项的内容外，还包括预测值和残差的标准误、student