第10章回归题材.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE  10-PAGE 25 第10章 回归分析 摘要:回归分析依自变量个数的多少可分为一元回归和多元回归;根据依变量和自变量之间的关系和性质可分为线性回归和非线性回归。 §10.1 回归分析概述 一、回归分析的任务和 种类 1.回归分析解决哪些问题 当人们从一组对象上获得2个或多个指标的观测值时,往往需要回答下述几个问题: ①如何实现预测,即如何由:1个或多个指标(自变量)的值去推算另1个或多个指标(因变量)的值; ②如何实现控制,即事先给出产品质量应达到的标准(因变量的取值范围),根据变量之间的数量关系去控制那些影响产品质量的因素(自变量)的变化区间; ③如何实现修匀,由于所研究的指标带有变异性,当用散布图将变量之间的关系呈现出来时,散点所形成的轨迹并非像数学中初等函数那样有规律,需要用合适的数学方法(如用直线???某种光滑曲线)对资料进行修匀,使变量之间本质联系更清楚地呈现出来。回归分析正是回答上述问题的一种最常用最有效的统计分析方法之一。 2.回归分析的种类 如果因变量是连续变量(即一般定量资料),设自变量的个数为K,当k=1时,回归分析的种类有: ①直线回归分析; ②通过直线化实现的简单曲线回归分析(以下简称为曲线拟合); ③非线性曲线拟合; ④一般多项式曲线拟合; ⑤正交多项式曲线拟合。当k≥2时,称为多元回归分析(注:前面的④、⑤两种情况实质上是用多元回归分析解决只含:个自变量时较复杂的曲线拟合问题)。当同时对多个因变量进行回归分析时,称之为多重回归分析。 在多元回归分析中,简单而又实用的则是多元线性回归分析(其中某些自变量可以是原观测指标经过某种初等变换的结果,如对数变换、开平方根变换等,因为这里所说的线性是指:函数f(X)相对于回归参数是线性的,并非相对于自变量而言)。 如果因变量是与生存时间有关的连续变量且未被离散化(如:生存时间、复发时间、死亡时间等),而自变量可以是定量的,也可以是定性的。此时需用生存分析中的半参数或参数回归分析方法。 如果因变量是有序变量,无论它取2个离散值(如:死与活、复发与未复发等)还是多个离散值(自变量可以是定性和定量的)时,都可选用logistic回归分析;如果把列联表中每个格内的理论频数的对数当作因变量,把分组变量(包含影响因素和观测结果变量两类)当作自变量,可用对数线性模型分析。 在自变量代表时间的情况下,通常不假定因变量Y的各次观察值独立,而具有某种非独立的结构,例如构成一平稳序列。这种回归模型的研究被划入统计学的另一个重要分支——时问序列统计分析的范围。 二、直线回归与相关分析的概念和要点 1.两种分析方法的异同点 研究在专业上有一定联系的两个变量之间是否存在直线关系以及如何求得直线回归方程等问题,需进行直线相关和回归分析。从研究的目的来说,若仅仅为了了解两变量之间呈直线关系的密切程度和方向,宜选用线性相关分析;若仅仅为了建立由自变量推算因变量的直线回归方程,宜选用直线回归分析。从资料所具备的条件来说,作相关分析时要求两变量都是随机变量(如:人的身高与体重、血硒与发硒);作回归分析时要求因变量是随机变量,自变量可以是随机的,也可以是一般变量(即可以事先指定变量的取值,如:用药的剂量)。 2.散布图在这两种分析中的作用 功能齐全的统计软件,会蒙骗盲目运用统计方法的人,进行直线相关和回归分析时,尤其要注意。因为统计方法只能帮助人们揭示数据之间内在的统计规律性,而不能创造规律,也就是说,资料之间是否存在本质联系要靠专业知识来解释。另外,在专业上有一定联系的2项指标之间的关系并非都是直线关系。实事上,如果2项指标之间呈一条弯曲度不大的“S”型或反“S”型曲线趋势,错误地用一条直线回归方程来描述,在统计学上往往会得到较高的显著性,即该直线回归方程是成立的,但在生物学上是解释不通的(当因变量是某种率时最易发生这种现象)。正确的做法是:将(X,Y)的n对数值绘在直角坐标系内,得到X与Y变化趋势的散布图,如果n个点形成的散布图呈一条明显的曲线趋势时,宜拟合一条曲线回归方程;如果n个点在一条不太宽的长带内随机地分布着,且不存在明显的曲线趋势,可考虑进行直线相关和回归分析;如果n个点形成的散布图近似于一个圆盘,则说明X与Y之间无确定的变化趋势,几乎是互相独立的,不必硬把它们捏合在一起分析。 §10.2 一般线性回归分析过程REG REG过程是进行一般线性回归分析通用的过程,该过程采用最小二乘法拟合线性模型,可以有多个模型(MODEL)语句,输入数据可以是原始样本数据,也可以是相关阵,可输出有关数据的描述统计量、参数估计值、预测值、残差、置信区间等,并可作线性假设测验,这些统计结果可输出到一个新的SAS数

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档