3使用reg做回归分析.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3使用reg做回归分析

1. REG过程的语法格式 REG过程的基本用法为:PROC REG DATA=输入数据集 [选项列表]; VAR 变量列表; MODEL 因变量 = 自变量表/选项; PRINT 选项列表; PLOT y变量名*x变量名 [=符号] [/选项列表];RUN;说明: MODEL语句用以指定所要拟合的回归模型,其后的选项与REG语句的选项类似。 PLOT语句用以对两个变量绘制散点图,表达式中位置在前(在乘号“*”之前)的变量作为散点图的y轴,位置在后的变量作为散点图的x轴。等号后的符号为散点图中表示点的图形符号,此项内容可省略,SAS会用默认方式显示图形,但如需指定,符号要用单引号括起来。对于同一个模型可以指定多个plot语句。 PRINT语句用于交互地显示MODEL语句中的有关选项,可以将拟合模型的有关统计量显示在结果中。【例4-7】使用REG过程对数据集Mylib.jyzk中所有6个自变量与因变量单位面积营业额Y建立多元线性回归。调用如下的REG过程就可以在输出窗口产生如图4-43所示的结果:procreg data = Mylib.jyzk;var y x1 – x6;model y = x1 – x6;run;逐步回归我们发现有些变量的作用不显著,所以使用REG提供的自动选择最优自变量子集的选项。在MODBL语句中加上“SELECTION = 选择方法”的选项就可以自动挑选自变量,选择方法有NONE(全用,这是缺省),FORWARD(向前逐步引入法),BACKWARD(向后逐步剔除法),STEPWISE(逐步筛选法),MAXR(最大R2增量法),MINR(最小R2增量法),RSQUARE(R2选择法),ADJRSQ(修正R2选择法),CP(Mallows的Cp统计量法)。比如,我们用如下程序:model y = x1 – x6 / selection=stepwise;run;可得到逐步筛选法的分析结果,如图4-44~4-47所示。图4-45 逐步筛选法第2步图4-46 逐步筛选法第3步图4-47 最终结果模型最后结果表明,只有变量x2、x3、x4进入了模型,而其它变量则不能进入模型。4. 预测 REG过程给出的缺省结果比较少。用PRINT语句和PLOT语句可以显示额外的结果。为了显示模型的预测值(拟合值)和预测值的95%置信区间,使用语句:print cli;run;得到如图4-48所示的结果。用print cli列出的是预测值的置信区间,使用如下语句还可以列出模型均值的置信区间:printclm;run;图4-48 预测值和95%置信区间5. 散点图对于自变量是一元的情况,可以在自变量和因变量的散点图上附加回归直线和均值置信界限。比如,plot y*x2/conf95;run;可以产生图4-49,在图的上方列出了回归方程,右方还给出了观测个数、R2、修正的R2、根均方误差。4.3.1 多项式回归1. 问题【例4-8】某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及同期其它厂家生产的同类牙膏的市场平均销售价格,见表4-3。表4-3 牙膏销售量与销售价格、广告费用等数据销售周期公司销售价格(元)其它厂家平均价格(元)广告费用(百万元)价格差(元)销售量(百万支)13.853.805.50-0.057.3823.754.006.750.258.5133.704.307.250.609.5243.703.705.5007.50………………273.703.656.50-0.058.27283.753.755.7507.67293.803.855.800.057.93303.704.256.800.559.26其中价格差指其它厂家平均价格与公司销售价格之差。表中数据已存放在数据表Mylib.yagao中,试根据这些数据建立一个数学模型,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据2. 分析与假设由于牙膏是生活必需品,对大多数顾客来说,在购买同类产品的牙膏时更多地会在意不同品牌之间的价格差异,而不是它们的价格本身。因此,在研究各个因素对销售量的影响时,用价格差代替公司销售价格和其它厂家平均价格更为合适。记牙膏销售量为y,其它厂家平均价格与公司销售价格之差(价格差)为x1,公司投入的广告费用为x2,其它厂家平均价格和公司销售价格分别为x3和x4,x1 = x3–x4。基

文档评论(0)

2017ll + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档