- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS软件应用之直线回归与相关PPT
本章小节 相关分析和回归分析是研究现象之间相关关系的两种基本方法。相关是解决客观事物或现象相互关系密切程度的问题,而回归则是用函数的形式表示出因果关系。有相关不一定因果关系;反之,有因果关系的,一定有相关。 所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度。按相关程度划分可分为完全相关、不完全相关、和不相关;按相关方向划分可分为正相关和负相关;按相关的形式划分可分为线形相关和非线形相关;按变量多少划分可分为单相关、复相关和偏相关。所谓相关分析,就是分析测定变量间相互依存关系的密切程度的统计方法。一般可以借助相关系数、相关表与相关图来进行相关分析。 本章小节 SAS系统中进行直线相关分析的过程步是CORR过程。CORR过程存在于SAS的base模块,可以计算Pearson积矩相关系数、Spearman秩相关系数、Kendall‘s tau-b统计量、Hoeffding’s独立性分析统计量D以及Pearson,Spearman,以及Kendall偏相关系数。 REG是用于一般目的回归分析的过程。本章详细对REG过程语句和基本格式进行了说明,并以实例演示如何利用SAS程序进行相关分析。 本章小节 直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小。这个方程称为直线回归方程,据此方程描绘的直线就是回归直线。相关关系能说明现象间有无关系,但它不能说明一个现象发生一定量的变化时,另一个变量将会发生多大量的变化。也就是说,它不能说明两个变量之间的一般数量关系值。回归分析,是指在相关分析的基础上,把变量之间的具体变动关系模型化,求出关系方程式,就是找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推算。 第10章 多元线性回归与相关 学习目标 熟悉多元线性回归模型矩阵形式; 掌握多元线性回归模型、参数估计过程及参数的解释, 标准化参数估计值; 了解多元线性回归共线性的诊断问题; 理解复相关系数与偏相关系数; 掌握多元线性回归的SAS程序(REG过程以及选项)。 熟悉计算偏相关系数的SAS程序。 多元线性回归与相关的基础理论 在许多实际问题中,还会遇到一个随机变量与多个变量的相关关系问题,需要用多元回归分析的方法来解决。前面介绍的一元回归分析是其特殊情形。但由于多元回归分析比较复杂,在此仅简要介绍多元线性回归分析。 由于经济现象的复杂性,一个被解释变量往往受多个解释变量的影响。多元回归模型就是在方程式中有两个或两个以上自变量的线性回归模型。多元线性回归预测是用多元线性回归模型,对具有线性趋势的税收问题,使用多个影响因素所作的预测。 多元线性回归 多元线性回归分析也称为复线性回归分析,它是一元线性回归分析或简单线性回归分析的推广,它研究的是一组自变量如何直接影响一个因变量。这里的自变量指的是能独立自由变化的变量,一般用x表示;因变量y指的是非独立的、受其它变量影响的变量,一般用y表示。由于多元线性回归分析(包括一元线性回归分析)仅涉及到一个因变量,所以有时也称为单变量线性回归分析。 回归变量的选择与逐步回归 在实际问题中, 人们总是希望从对因变量有影响的诸多变量中选择一些变量作为自变量, 应用多元回归分析的方法建立“最优”回归方程以便对因变量进行预报或控制,这就涉及到自变量选择的问题。所谓“最优”回归方程, 主要是指希望在回归方程中包含所有对因变量影响显著的自变量而不包含对影响不显著的自变量的回归方程。 在回归方程中若漏掉对Y影响显著的自变量,那么建立的回归式用于预测时将会产生较大的偏差。但回归方程若包含的变量太多,且其中有些对Y影响不大,显然这样的回归式不仅使用不方便,而且反而会影响预测的精度。因而选择合适的变量用于建立一个“最优”的回归方程是十分重要的问题。 回归变量的选择与逐步回归 选择“最优”回归方程的变量筛选法包括逐步回归法,向前引入法和向后剔除法。 向前引入法是从回归方程仅包括常数项开始,把自变量逐个引入回归方程。具体地说,先在m个自变量中选择一个与因变量线性关系最密切的变量,记为,然后在剩余的m-1个自变量中,再选一个,使得 联合起来二元回归效果最好,第三步在剩下的m-2个自变量中选择一个变量,使得 联合起来回归效果最好,...如此下去,直至得到“最优”回归方程为止。 回归变量的选择与逐步回归 向前引入法中的终止条件为,给定显著性水平,当某一个对将被引入变量的回归系数作显著性检查时,若p-value≥,则引入变量的过程结束,所得方程即为“最优”回归方程。 向前引入法有一个明显的缺点,就是由于各自变量可能存在着相互关系,因此后续变量的选入可能会使前面已选入的自变量变得
文档评论(0)