社会统计分析与数据处理技术(Stata)9 线性回归.ppt

社会统计分析与数据处理技术(Stata)9 线性回归.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章 线性回归 (Linear Regression) 导论 事物之间联系;统计分析:根据统计数据提供的资料,揭示变量之间的关系,并由此推演为事物之间内在联系的规律性 假定检验和方差分析的局限 假定检验只能分析一个或两个变量;分类变量只能有两个取值 方差分析克服了该局限,分类的自变量可以有多个取值,且同时允许分析连续性的因变量是否随多个自变量的不同取值而异。然而,方差分析本身除了提供F统计量外,并不提供更多的信息;且方差分析主要用于分类自变量与数值型因变量之间的分析。虽然它也能纳入数值型自变量于分析之中,但不能提供单个自变量对因变量作用的大小 为什么学习回归分析 回归分析探讨客观事物之间的联系,表现为变量之间的统计关系 建立在对客观事物进行大量实验和观察的基础上,用来寻找隐藏在看起来不确定的现象中的统计规律的统计方法 因因变量衡量方式的不同,回归分析可分为线性回归和非线性回归 线性回归适用于因变量为连续衡量的场合 非线性回归多适用于因变量为虚拟变量、多分类变量、计数变量等场合 即便在这两大类中,分析方法又可区分为许多不同的类型 根据处理的变量多少来看,回归分析又分为: 简单相关和一元回归:研究的是两个变量之间的关系 多元相关或多元回归:研究的是多个变量之间的关系 本章主要内容 9.1.变量间的相关关系(correlation) 9.2.线性回归概述 9.3. 一元线性回归 9.4. 多元线性回归 9.1.变量间的相关关系(correlation) 函数关系 回归分析前,首先必须掌握变量之间是否相关;只有变量之间存在关系,才有必要进行回归分析 假若x增加时,y的取值发生相应变化,则x和y之间是相关的 假若x增加时,y的取值没有确定的变化,x则y和之间是不相关的,或是没有相关关系的 变量之间的相关关系归纳起来可以分为两种:函数关系和统计关系 统计相关 现实事物之间的联系不像函数关系那样容易确定 现象之间存在关联;但无法确定具体关系,不能像函数关系那样,用一个公式将它们的关系准确地描述出来;当一个变量取一定的值时,另一个变量可能有多个取值 当一个变量的值不能由另一个变量的值唯一确定时,这种关系称为统计关系 统计关系不如函数关系直接和明确;但通过对大量数据的观察和研究,就会发现许多变量之间确实存在着某种关联,强弱各不相同 相关关系的特点 双向变化关系 一个变量的取值不能由另一个变量的取值唯一确定;当x取一定的值时,y可能有多个取值,因为还受到其他因素的影响 不确定关系难以用函数关系来衡量和描述,但这并不表示x和y之间无规律可循 类似定性描述 相关分为线性相关和非线性相关 相关分析 对两(多)个变量之间的关系进行描述,分析它们 是否相关 关系是否密切 关系的性质是什么(是正相关还是负相关) 随着x的变化,y值的变化程度就确定二者是否相关和相关的强度 当x增加(减少)时,y的取值也随之增加(减少),则x和y之间呈正相关关系;相反,当x增加(减少)时,y的取值却随之减少(增加),则和之间呈负相关关系 相关分析的方法包括散点图和相关系数 相关散点图(scatter plot) 相关系数(correlation coefficient) 图形虽然直观,但不够精确;对散点图的视觉分析带有很大的主观性;需要更精确和更客观的度量 相关系数可准确地描述变量之间的线性相关程度 线性相关系数是衡量变量之间相关程度的统计量,是描述两变量线性关系强度及方向的数值 若相关系数是根据总体数据计算的,称为总体相关系数,记为ρ;若是根据样本计算出来的,则称为样本相关系数,记为r 在统计学中,一般用样本相关系数来推断总体相关系数 相关系数:性质与方向 相关系数:程度 根据经验,可以将相关程度分为几等: 但这种解释必须建立在对相关系数进行显著性检验的基础之上 相关系数:其它特征 9.2.线性回归概述 “回归”一词来自英国学者、优生学的创始人S. F. Galton(1822-1911)。Galton在对遗传现象进行研究后发现,当高个的夫妻或矮个的夫妻有了孩子时,这些孩子的身高趋于回归到更典型的、同一性别的人的平均身高 回归分析 通过找出代表变量之间关系的直线图形或直线方程来描述变量之间的数学关系 这条直线称为回归直线 该直线方程称为回归方程 一元线性回归是回归分析中最简单、最基本的回归分析,描述两个变量之间的关系 它是根据统计资料,寻求一个变量与另一个变量关系的恰当数学表达式的经验方程,来近似地表示变量间的平均变化关系的一种统计分析方法 其中一个变量作为DV或输出变量,通常用y表示 另一个变量IV(预测变量或解释变量)通常用x表示 相关分析与回归分析之别(I) 依存关系与平等关系。回归反映两个变量的依存关系,一个变量的改变引起另一个变量的变化,是一

文档评论(0)

别样风华 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档