SAS讲义第十二章REG过程.docx

下载文档

0
0
约6.42万字
约 64页
2024-06-30 发布于上海
举报
版权申诉
保障服务

SAS讲义第十二章REG过程.docx

1、本文档共64页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

PAGE

PAGE10

REG过程(回归过程)

REG过程是一个通用的回归过程，它采用最小二乘方法拟合线性回归模型，还提供多种“最佳”回归模型的方法，是一个应用最广泛的回归过程。

§1 REG过程简介

一、REG过程的功能

?设考察的指标(或称因变量，响应变量)为Y, ,Y

1 p

，影响这些指标的因素(或称自变量，回归变量)为

?X, ,X 。已知这些变量的n次观测数据组成的一个SAS数据集。REG过程可以完成以下几方面的计

1 m

算：

利用具有多项选择的MODEL语句来建立用户需要的线性回归模型；

提供九种选择“最佳”回归模型的方法；

允许采用交互方式修改模型及用于拟合这个模型的数据；

可建立线性约束回归模型；

检验线性假设和多变量假设；

生成原始数据和一些统计量的散点图；对散点图还有“着色”，加亮功能；

产生偏回归杠杆图，并进行共线性诊断，影响诊断；

可以输出预测值、残差、标准残差、置信区间的上下限和影响统计量等；并把它们存储到一个SAS

数据集里；

?可以使用Y, ,Y

1 p

和X, ,X

?1 m

的相关阵和离差阵作为输入数据；

可以把离差阵(叉积阵)存贮到一个输出SAS数据集里，以便将来使用；

在6．11版本，REG过程完成岭回归和不完全的主成分分析(IPC)；

在6．11版本，PROCREG语句可使用选项GRAPHICS，它使得你能够要求PLOT语句用高分辩率图形设备绘图。

二、选择最优回归模型方法

设Y和X

, ,X

的n次观测数据为?x

, ,x ,y

?tm t

??t?1,2,?,n?满足线性回归模型：

y??

t 0

1t1

? ??x

?mtm

??.

利用矩阵符号可简记为

Y?X???.

?因考察的m个自变量对Y的作用有大有小，且自变量之间一般存在相关性。为了从Y与X, ,X 的所有

1 m

可能回归模型中选出拟合这组观测数据的最优回归子集，REG过程提供了九种选择回归模型的方法，它们通过MODEL语句中的选项selection=来规定。下面介绍这些方法及其在选项SELECTION=中用于识别这些方法的关键词。

全回归模型(NONE)

没有对回归变量进行筛选，建立Y与全部自变量的回归模型。这是很多回归分析使用的方法。当省略选项SELECTION=时，表示建立全回归模型。

向前法或逐步引入法(FORWARD)

向前选择法的初始模型中没有变量。对每个自变量，向前法计算如果这个自变量包含在模型中它对模型贡献大小的F统计量，并将这些F统计量相应的p值与SLENTRY=的值(用户在MODEL语句中规定的

引入时的显著水平。如果没有规定，即缺省时，则用0.50比较．如果所有自变量对应的F统计量的显著概率(p值)都大于这个值(表示所有自变量对因变量的贡献都不显著)，向前选择过程结束。否则，就把具有

最大F值的自变量引人模型。然后对未引入模型的自变量再计算它们的的F统计量，重复上述计算步骤，变量逐个被加到模型中，直到没有变量其F值相应的p值大于SLENTRY=的值。使用向前选择法，变量

一旦选人模型，就不会被剔除。

向后法或逐步剔除法(BACKWARD)

向后删除法开始对包含所有自变量的模型计算F统计量,然后从这个模型中逐个删除变量，直到在模型中的所有变量产生的F统计量在这个MODEL语句里规定的选项SLSTAY=的值(如果缺省，则用0.10)水平上是显著的。在每一步，删除对模型贡献最小的变量。

逐步筛选法(STEPWISE)

逐步法是向前选择法的修正，和向前选择法的区别在于引入模型中的变量有可能被删除。像向前选择法一样，变量被逐个引入到模型中，而且对引入的变量其F统计量在SLENTRY=的水平上必须是显著的。引入一个变量之后，逐步法还要检验所有已经包含在模型中的变量，并删除在SLSTAY=的水平上不显著的一切变量。仅当经过检验并把所有不显著的变量删除后，才考虑是否再引入新变量。当在模型外的所有

变量在SLENTRY=的水平上都不显著，而在模型内的任一个变量的F统计量在SLSTAY=的水平上都是显著时，逐步筛选过程停止。另外，若刚被删除的变量又被引人模型时，逐步筛选过程也停止。

最大增量法(MAXR)

最大增量法不是确定唯一的一个模型。而是寻找“最优”一个变量模型，“最优”两个变量模型等等，但它对每种变量个数，并不能保证找到具有最大R2的模型。

MAXR方法首先寻找具有最大R2的单变量模型，

您可能关注的文档

文档评论（0）

mph + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体上海谭台科技有限公司

IP属地上海

统一社会信用代码/组织机构代码: 91310115MA7CY11Y3K

1亿VIP精品文档

更多 >

SAS讲义第十二章REG过程.docx