SAS的相关与回归、多元回归(正式).ppt

SAS的相关与回归、多元回归(正式).ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS的相关与回归、多元回归(正式).ppt

应用直线回归的注意事项 回归直线不要外延。直线回归的适用范围一般以自变量取值范围为限,在此范围内求出的估计值称为内插;超过自变量取值范围所计算的称为外延。若无充足理由证明,超出自变量取值范围后直线回归关系仍成立时,应该避免随意外延。 直线回归分析的SAS程序 REG过程涉及到较多的语句和选项, PROC REG 选项列表 ; MODEL 应变量列表=自变量列表 / 选项列表 ; BY 变量名列表 ; VAR 变量名列表 ; WEIGHT 变量名 ; ADD 变量名列表 ; DELETE 变量名列表 ; MTEST 方程式, ... , 方程式 / 选项列表 ; OUTPUT OUT=数据集名 keyword=变量名列表 ... keyword=变量名列表 ; PLOT y变量名*x变量名 =符号 ? ...y变量名*x变量名 =符号 / 选项列表 ; 直线回归分析的SAS程序 MODEL语句:用以指定所要拟合的回归模型。其最前面的标签为可选项,可以是不超过8个字符的字符串,用来对定义的模型进行标识,以便于在结果中分辨不同的模型,一般情况下系统会以默认的方式对模型进行标识,你可以省略此项。关键字model后所列的是模型表达式,和方差分析中anova过程的model语句相似。模型表达式中等号的左边为反应变量,等号的右边为自变量列表,自变量间以空格相分隔。这里所用到的所有变量必须存在于所分析的数据集中,而且是数值型的。如果要用到几个变量产生的综合变量,必须在数据步完成新变量的创建过程,model语句中的组合型变量将被视为非法。 直线回归分析的SAS程序 Model语句后面的选项: Stb 标准化回归系数 P 每个观测的实际值、预测值与残差 Cli 每个观测预测值的双侧95%容许区间 Clm 每个观测预测值均值的双侧95%可信区间 R 残差分析的结果,包括P选项的输出内容外,还包括预测值、残差的标准误,student残差,Cook的D统计量等。 * 直线回归分析的SAS程序 id语句:指定用以标识观测的变量。如果某一条model语句指定了cli, clm, p, r, 或者influence选项,结果中会有针对每一条观测的输出,此时用id语句指定每一条观测的标识将会使结果更易于辨认或理解。如果没有id语句,SAS则用观测的编号来标识每一条观测。 var语句:用来将那些未包括在model语句中但需要将其包含在交叉积和矩阵中的数值型变量。在随后的add语句中想交互地加入模型的变量以及要在plot语句中对其绘制散点图的变量也需在var语句中列出。另外,如果你只想利用proc reg语句后的选项执行某些特定的功能,而并不会用到model语句的话,var语句则是必需的。 直线回归分析的SAS程序 add语句:用以将自变量交互地加入模型,以考察某个变量对模型拟合的影响。此处用到的变量必须为model语句或var语句中出现的变量,你可以交互地加入某个变量到模型中或将在delete语句中剔除的变量重新包含到模型中。对add语句的每一次执行都将改变模型的标签。 mtest语句:用以在有多个应变量时进行模型的多重检验。其最前面的标签项和model语句的完全相同。语句中的方程式用以指定多重检验的假设模型,是一组以系数和变量名组成的线性方程式。此语句用在多元回归情况下,多个应变量对同一组自变量拟合线性模型时。 直线回归分析的SAS程序 output语句:用于将回归分析中产生的结果输出到指定的数据集中,它所对应的是最后一个model语句所定义的模型。新产生的数据集中,包括输入数据集(用以进行回归分析的数据集)的全部数据、回归分析过程中产生的各种统计量以及针对每一观测的回归诊断指标数据等。但如果输入数据类型为corr、cov或sscp等,output语句则会失效。 plot语句:用以对两个变量绘制散点图,表达式中位置在前(在乘号“*”之前)的变量作为散点图的y轴,位置在后的变量作为散点图的x轴。等号后的符号为散点图中表示点的图形符号,此项内容可省略,SAS会用默认方式显示图形,但如需指定,符号要用单引号括起来。 例题 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h),估计尿肌酐含量(Y)对其年龄(X)的回归方程。 加权直线回归 在某些情况下,根据一定的专业知识,考虑并结合实际数据,某些观察值对于估计回归方程显得更“重要”,而有些并不是很“重要”,可以使用加权最小二乘估计。 例题 某儿科医师测得10名婴儿的年龄(岁)与

您可能关注的文档

文档评论(0)

ganpeid + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档