- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10章_回归分析
第10章 回归分析 本章主要内容 概述 Corr过程 线性相关分析 Reg过程 直线回归 多元线性回归 概述 变量之间的关系有两类: 一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。 如长方形的面积 (S)与 长(a)和 宽(b)的关系可以表达为: S=ab。 它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系,模型为机理模型。 概述 变量之间的另一类关系是不完全确定的关系,无法用精确的数学公式来表示。 如儿童生长时的身高和体重、作物的产量和肥料用量、植物病害的发生程度与气候条件之间的关系。 这类关系在生物界中大量存在,只能用统计学的方法研究变量间的相关关系,建立数值模拟模型。 概述 统计学上采用回归分析 (regression analysis)研究相关变量间的因果关系。 表示原因的变量称为自变量,表示结果的变量称为依变量。 研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析; 研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。 概述 统计学上采用相关分析(correlation analysis)研究变量之间的相关关系。 对两个变量间的直线关系进行相关分析称为简单相关分析(也叫线性相关分析); 对多个变量进行相关分析时: 研究一个变量与多个变量间的线性相关称为复相关分析; 研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析; 研究两组变量间线性相关称为典型相关分析。 概述 SAS系统中,适用回归分析的过程: 概述 概述 几种回归过程相同的输出数据 用最小二乘法所估计的参数值(如:b0,b1 ....); 误差方差的估计值; 参数估计值的标准误或方差; 有关参数的假设(如H0:β0=0) 检验; 各种预测值及其误差; 回归方程显著性的检验。 概述 相异的诊断功能 REG 程序提供共线性(Collinearity) 的诊断,这个诊断探讨自变量间相关的程度及可能造成的影响。 REG,LOGISTIC 及RSREG 三个程序提供影响度诊断以决定各观察体对参数估计值、误差的平方和(SSE) 及预测值等的影响。LOGISTIC 程序也有这种功能,不过其分析原理是采最大似然率法。 PROBIT 与RSREG 两程序提供回归模型精确度(Accuracy) 的诊断,所用的方法是比较误差的方差及其估计值。 REG 程序提供时间序列分析(Time Series Analysis) 的诊断,特别是有关时间的误差以及误差间彼此的相关。 Corr过程 Corr过程存在于SAS的base模块,可以计算: Pearson积矩相关系数; Spearman秩相关系数; Kendall‘s tau-b统计量; Hoeffding‘s独立性分析统计量D; Pearson、Spearman以及Kendall偏相关系数; 另外,它还对用于估计可靠性的Cronbach系数α进行计算。 Corr过程 Corr过程格式: PROC CORR options; BY DESCENDING var-1...DESCENDING var-n NOTSORTED; FREQ variable; PARTIAL variables; VAR variables; WEIGHT variable; WITH variables; Run; Corr过程 Corr过程 Corr过程 线性相关分析 线性相关分析: 是在(X,Y)服从正态分布(双变量正态分布)的假定下,用线性相关的统计分析方法研究两变量间数量变化关系的密切程度和方向,称为线性相关分析。 对样本的要求: 线性:linear 独立:independent 正态:normal 等方差:equal variance 线性相关分析 线性相关分析 线性相关分析 线性相关的性质可由散点图直观的说明,按图中散点的分布,可归纳为以下几种情况: 线性相关分析 公式的解释: r 的符号(方向): 当 X,Y同向变化时,一、三象限的点多于二、四象限的点, r为正,两变量正相关,0 r 1; 当 X,Y反向变化时,二、四象限的点多于一、三象限的点, r为负,两变量负相关,-1 r 0; 当点在一、三象限和二、四象限均匀分布时,正负抵消, r = 0,呈零相关,X、Y没有线性关系。 相关系数r的大小: r的绝对值越大,说明线性相关程度越好,散点越接近一条直线; 绝对值越小,说明线性相关程度越差。 线性相关分析 示例10001(李春喜,王文林等编著《生物统计学》114页): 有人研究了粘虫孵化历期平均温度(x,℃)与历期天数(y,天)之间的关系。试进行皮尔逊积差相关分析。 线性相关分析 对资料进行
文档评论(0)