北大光华陈奇志老师sas7.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
七、SAS系统与回归分析计算机统计分析软件(SAS系统9.1.2) SAS与回归分析目录1. 相关分析 2. 一元线性回归分析3. 多元线性回归分析4. 变量选择5. 非线性回归(可化为线性)6. 回归诊断SAS与回归分析 回归分析是处理多个变量间相关关系的一种数学方法. 变量间的关系有两种类型:确定性的函数关系和相关关系.回归分析方法是处理变量间相关关系的有力工具. 回归分析用于确定一个连续变量(因变量)与另一些连续变量(自变量)间的相互依赖关系.SAS与回归分析 回归分析是研究一个(或几个)因变量Y与另一些变量的相互依赖关系.具体地说,我们研究以下几方面问题: ① 建立因变量Y与x1,x2,…,xm的经验公式(回归方程) ② 对经验公式的可信度进行检验; ③ 判断每个自变量xi(i=1,…,m)对Y的影响是否显著? ④ 利用经验公式进行预报和控制,指导生产; ⑤ 诊断经验公式是否适合这组数据.相关分析散点图及变量的相关关系中学生身高与体重数据的散点图 (用INSIGHT绘制. .红色为男 生,兰色为女生. 不同符号表示不同的年龄):相关分析相关关系的类型用曲线 描述用直线描述可能有周期变化无明显关系相关分析相关关系的类型 上述四幅图分别说明了以下几种可能的关系: 1、可用直线描述变量间的关系(变量间联系中最简单的一种) ; 2、显示变量间有曲线关系; 3、可能有季节性的周期变化(在受季节影响的经济指标中常会遇到) ; 4、变量间无明显的关系.相关分析 相关系数(Correlation Coef.)线性联系是描述变量间联系中最简单和最常用的一种(Y=a1x1+a2x2+b);相关系数是描述两个变量间线性联系程度的统计指标;相关系数的计算公式:相关分析相关系数 两个区间型变量间的关系有很多种可能,在考察散点图后,可用相关统计量将两个变量的关系定量化.若两个变量间存在一个线性关系,则他们为相关的,否则,变量间的相关是不强的. 相关系数是描述变量间线性联系程度的一个统计量,统计中有多个描述相关的指标,最常用的是Pearson相关系数,简称相关系数. 相关分析相关系数相关系数的值为? -1和+ 1之间; 若两个变量间有高度线性关系其值接近 任一个极端值; 若两个变量间无线性关系其值接近于零;● 若相关系数的值大于零表示两变量有正相 关(即两变量同时增大) ;● 若相关系数的值小于零表示两变量有负相 关(即一个变量增大时另一变量减小 或反之).相关分析相关系数(Correlation Coef.)正相关:一个变量数值增加时另一个变量也增加负相关:一个变量数值增加时另一个变量减少相关分析用Insight计算相关系数 为了定量地描述变量间的线性联系程度,就需要计算他们之间的相关系数。打开CARS,选 分析(Analyze)→多元(Multivariate)(Y);(2) 选 MIDPRICE、CITYMPG、HWYMPG、EGNSIZE、RPM和PERFORM → Y,即选这些变量为分析变量,计算他们之间的相关系数, → OK。多元分析生成分析变量的单变量统计量和这些变量间的相关系数矩阵; 相关分析用Insight计算相关系数 为了得到检验相关系数是否为零的原假设的p值,可选: 表(Tables)→相关系数P值(CORR P-Values);则在输出结果的窗口下方又增加一张相关系数的P值表.根据表中这些p-值可知,只有RPM和MIDPRICE之间的p值(0.5518)大于0.05,这表示不能拒绝这两个变量的相关系数等于零的假设,即可接受RPM和MIDPRICE之间的相关系数等于零. 其余变量间的相关系数均显著地不等于零. 相关分析用Insight制作散点图矩阵及置信椭圆 为了利用图形来说明变量间的相关,可以在多变量窗口生成散点图矩阵和置信椭圆,生成这些椭圆时我们假定每一对变量(X,Y)是两元正态分布的。 可以生成两类椭圆:均值置信椭圆--预测两变量均值(EX,EY)分布 的置信区域;预测值置信椭圆--预测两变量单个观测值 (X,Y)分布的置信区域.相关分析用Insight制作散点图矩阵及置信椭圆 预测值的置信椭圆可以说明以下两方面问题: (1) 作为置信域,在变量为两元正态分布的假定下,置信椭圆显示数据以设定的百分率落入的区域,落入预测置信椭圆的观测值的百分率应该接近于设定的置信水平; (2) 作为相关的指标。若两个变量不相关,椭圆应该为圆;两个变量相关性越强,则椭圆越扁(即椭圆拉长),可以用椭圆长短轴之比来衡量相关的程度.相关分析用Insight制作散点图矩阵及置信椭圆 对数据集CARS,为了在散点图矩阵上生成95%预测值置信椭圆,可在多变量窗口中选: 曲线(CURVES)→散点图置信椭园(Scatter

文档评论(0)

zhiliao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档