回归分析1概要.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归分析1概要

相关与回归 问题的提出: 心率是否随血液中胆固醇的数量而改变? 广告费用的一定增加使得销售量增加多少? 当一个变量增加时另一个变量增加还是减少? 相关系数是度量变量间相关程度的数量 回归分析利用关系式来描述一个变量同另一个变量或一组变量之间的相关关系 一、相关分析 相关分析:是研究随机变量之间相互关系的统计分析方法 线性相关:两变量间的相关呈直线相关,其统计指标是Pearson相关系数r,这时要求两变量是服从二元正态分布的随机变量 非参数相关:当变量不服从正态分布时,用非参数分析法,即等级相关分析法。如Sperman、Kendall等级相关。 一、相关分析 2、用程序的方法进行相关分析 (1)程序的基本形式 Proc corr [选项]; Var 变量表; With 变量表; Partial 变量表 Run; 一、相关分析 (2)语句说明 Var 变量表;指明要分析的变量,缺省为所有数值型变量 With 变量表;指明特别配对的变量,与var 配对使用,var列出相关矩阵上部的变量,with列出相关矩阵左侧的变量 Partial 变量表;指明求偏相关分析时要固定的偏变量名 一、相关分析 (3)选项说明 Data=数据集名 指出作相关分析时的数据来源 Pearson 计算Pearson相关,是缺省值 Kendall 计算kendall 相关系数 Spearman 计算Spearman等级相关系数 一、相关分析 [例]对儿童体检数据集class3中身高与体重进行pearson 相关分析 proc corr data=temp.class3; var height weight; run; 结果:H0假设:相关系数为0(不相关) 相关系数r=0.56838,p=0.0538 不能拒绝不相关 一、相关分析 结果分析: H0假设:相关系数为0(绝对不相关) 结论:检验概率0.05则拒绝H0假设,检验的变量之间具有显著相关,相关系数在结果的相关矩阵中 一、相关分析 2、用分析家进行相关分析 进入分析家环境,打开数据集 统计/描述性统计/相关 将要分析的变量==correlate 点击options可选分析方法 点击plots可绘图 点击Variables可选频数变量、分组变量、偏变量等 OK 一、相关分析 置信椭圆 图形地说明变量间的相关。它显示数据以设定的百分率落入的区域,落入预测置信椭圆的观测值的百分率应接近于设定的置信水平。 观察方法:若两变量不相关,椭圆应为圆;拉长的椭圆为相关;椭圆的长短轴之比可衡量相关的强度 菜单:在上述第2步中按下PLOTS可加散点图和置信椭圆 一、相关分析 3、用ASSIST进行相关分析 (1)菜单: 进入ASSIST Data Analysis/Elementary/Correlation Table处指明数据集 Columns to be correlated指明分析变量 Select one or more correlation measures的下方选Pearson相关分析 运行 一、相关分析 (2)偏相关系数 固定某个变量,求出另外两变量的相关系数为偏相关系数,偏相关系数比较真实地反映变量之间的相关关系 菜单:在上述第2步中按下additional options并在Partial correlation columns:处偏变量名(既要固定的变量名),如固定WEIGHT求HEIGHT和BUST的偏相关系数。 相关不能回答的问题 相关只能知道两个变量存在某种关系,但不能提供两变量间的关系的形式 如下的两幅变量间关系的散点图: 回归分析 回归分析 回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 二、回归分析 三、基本回归诊断 1、残差诊断(残差=观测值-预测值) [例]某房主记录了21天中每天电表读数(kwh)以及空调使用的小时数(ac)和烘干机使用的次数(dryer),以kwh为因变量,ac和dryer为自变量拟合线性回归,用残差分析的方法进行回归诊断,判断模型中是否需要增加一些项。 进入分析家环境 并打开数据集 单击统计/回归/线性 kwh?Dependent; ac,dryer?Explanatory method/backward(选后退法) plots/Residual /plot residuals vs variables (请求绘制残

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档