6 相关与回归分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6 相关与回归分析

相关分析 相关的概念 相关的概念 两个变量之间不精确、不稳定的变化关系称为相关关系。它与函数关系的区别就在于两个变量值不是一一对应得那样精确、稳定。 两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。从变化方向上看,两个变量之间有如下三种关系: 正相关(包括完全相关) 如智力和学习成绩的关系 负相关 如解决问题的能力与解决问题的时间长短的关系 不相关  从密切程度看,无论两个变量的变化方向是否一致,凡是: 密切程度高的,称为强相关或高度相关 密切程度一般的称为中度相关 密切程度低弱的称为弱相关或低度相关。 相关系数 用来描述两个变量相互之间变化方向和密切程度的数字特征量称为相关系数,r 相关系数的值仅仅是一个比值,它不等距,也不是百分比,因此不能直接进行加、减、乘、除运算。 r1=0.3,r2=0.6,r3=0.9 相关关系与因果关系 二个变量之间的关系是否因果关系,需要满足三个标准: 第一个必要条件是,在时序上,先有因后有果。在科学上,如果原因在后,根本是说不通的。这项标准看起来虽然简单,但在教育等社会科学研究中,常常会遇到数不清的问题。例如,二个变量的时序关系并不是很清楚;有时即使时序关系是清楚的,也会出现例外,如一般来说,我们假设父母的受教育水平影响到子女的受教育水平,但有些父母会因为子女受教育程度较高而又回到学校进修。 第二个必要条件是,二个变量之间具有实证的相关性。 第三个必要条件是,二个变量之间实证的相关性不因为第三个变量的存在而存在。如前一段时间有则报道说,洗澡的数量与成功存在正相关:越成功的人,洗澡越多;洗澡越多的人,越成功。我们不能把洗澡的次数与成功之间的这种相关说成是因果关系并据些推论出洗澡可以促进成功。这样做是很荒谬的。因为这二者之间的关系可能是由第三个变量,如成功人士有更好的卫生设备、良好的卫生习惯等引起的。 积差相关 当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关系数称为积差相关。 使用条件 两个变量都是由测量获得的连续数据 两个变量的总体都呈正态分布或接近正态分布 必须是成对的数据,而且每对数据之间是相互独立的 两个变量之间呈线性关系 要排除共变因素的影响 样本容量大于30 积差相关系数的计算 p255 相关系数的显著性检验 当n≥50时,相关系数的抽样分布接近于正态分布: 当n<50时,则可以用Fisher提出的近似的t分布进行检验 从总体相关系数为0的总体中随机抽取的样本,由于抽样的偶然性,计算出的相关系数可能不等于0,因此,不能仅仅根据相关系数的大小,对两个变量之间的密切程度作出判断,还要看r在总体相关系数等于0为中心的抽样分布上出现的概率大小如何。如果出现的概率较大,则r与总体相关系数等于0的差异无显著意义;如果出现的概率较小,则r与总体相关系数等于0有显著差异,这里即使r较小,也应该认为两个变量是相关的。 等级相关 当两个变量以等级次序排列或以等级次序表示时,两者之间不一定呈正态分布,样本容量也不一定大于30,这时表示两个变量之间的相关,称为等级相关 斯皮尔曼等级相关 D表示两个变量每对数据等级之差 p251 肯德尔和谐系数 当多个变量以等级次序排列或以等级次序表示,这几个变量之间的一致性程度称为肯德尔和系数 R表示K个评定者对同一事物所给予的等级之和 SSR表示R的离差平方和 K表示评定者的人数 N表示被评定事物的个数 P254 Data 12-09(1:最喜欢;2:其次;3:最差) 学习风格与学习成绩的相关分析 data 偏相关分析 回归分析 对存在相关性的两个变量,如果我们把其中一个作为自变量,另一个作为因变量,并把两者之间不十分精确、稳定的关系,用数学方程式来表示,则可以利用该方程用自变量的值来估计因变量的值,这一过程就是所谓的回归分析。 一元线性回归 精确的线性关系 不精确、不稳定的  线性关系 回归线   回归方程 一元线性回归方程的检验 估计误差的标准差 一元线性回归方程的检验 对回归方程进行方差分析 对两个变量的相关系数进行检验 对回归系数进行 测定系数 P289 多元线性回归分析 二元线性回归的例子 p303 Data7-03 我国高等教育扩展 对收入分配公平的影响  一、研究目的   库兹涅茨教授提出了著名的倒U假设:当一个国家经济发展时,收入分配的不公平程度会首先趋于扩大,然后才会趋于缩小。   人力资本理论的创立者舒尔茨教授提出,一个国家或地区人力资本投资的较快增长,将导致国民收入中源于劳动份额的相对上升与源于财产份额的相应下降,从而使得社会各阶层的收入分配趋于均等化。因此,高等教育扩展将改善收入分配的公平程度。 应用中国的数据对倒U假设和人力资本理论

文档评论(0)

shuwkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档