第二讲 相关分析与回归分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲相关分析与回归分析 第一节相关分析 1变量的相关性 变量的相关性分两种,一种是研究两个变量 X与y的相关 性。本节只研究前者,即两个变量之间的相关性;。 两个变量X与y的相关性研究,是探讨这两个变量之间的 关系密切到什么程度,能否给出一个定量的指标。这个问题的难 处在于“关系”二字,从数学角度看,两个变量 X、y之间的关 系具有无限的可能性,一个比较现实的想法是:确立一种“样板” 关系,然后把x、y的实际关系与“样板”关系比较,看它们“像” 到了什么程度,给出一个定量指标。 取什么关系做“样板”关系?线性关系。这是一种单调递增 或递减的关系,在现实生活中广为应用;另外,现实世界中大量 的变量服从正态分布,对这些变量而言,可以用线性关系或准线 性关系构建它们之间的联系。 1. 2相关性度量 .概率论中用 相关系数(correlation coefficient )度量两个变量的 相关程度。 为区别以下出现的样本相关系数,有时也把这里定义的相关 系数称为总体相关系数。可见相关系数是判断变量间线性关系的 重要指标。 .样本相关系数 我们也只能根据这个容量为n的样本来判断变量X和y的相关性 达到怎样的程度。 这个估计称为样本相关系数,或Pearson相关系数。它能够根据 样本观察值计算出两个变量相关系数的估计值。 和总体相关系数一样,如果p x/ = 0,称X和y不相关。这时 它们没有线性关系。 多数情况下,样本相关系数取区间(-1, 1)中的一个值。相 关系数的绝对值越大,表明X和y之间存在的关系越接近线性关 系。 1 ? 3相关性检验 两个变量X和y之间的相关性检验是对原假设 H0: Corr (X,Y) = 0 的显著性进行检验。检验类型为t。如果H0显著,则X和Y之间 没有线性关系。 1. 4 计算样本相关系数Correlate\Bivariate 例1数据data02,计算变量当前薪金、起始薪金、受教育年 限和工作经验之间的样本相关系数。 打开 Correlate\Bivariate 对话框,将变量 salary salbegin、educ 和prevexp输入Variables,点击pK|,即得表格: Correlations 加心苻4 工作经验 ―1 Hu 羽 1 jJz. 7-1-1 zJVI JsJz. 受教育年限 Pears on Correlation 1 .661** .633** -.252** Sig. (2-tailed) . .000 .000 .000 N 474— 474— 474— 474— 当前薪 金 Pears on Correlation .661** 1 .880** -.097* Sig. (2-tailed) .000 . .000 .034 N 474— 474— 474— 474— 起始薪 金 Pears on Correlation .633** .880** 1 .045 Sig. (2-tailed) .000 .000 . .327 N 474— 474— 474— 474— 工作经验(月) Pears on Correlation -.252** -.097* .045 1 Sig. (2-tailed) .000 .034 .327 . N 474— 474— 474— 474— -Correlation is s ignificant at the 0.01 level (2-tailed). *. Correlation is s ignificant at the 0.05 level (2-tailed). 表格中的Pearson Correlation指样本相关系数,例如起始薪金与受 教育年限的相关系数为0.633 ; Sig.为相关性检验结果,起始薪金 与受教育年限的相关性检验结果为Sig.=0.000,在0.05和0.01的水 平下,都能否定它们不相关的假设。N为观察值个数。 1. 5偏相关系数 控制变量 以上在计算变量X和K的相关系数时,并没有考 虑有其他变量的影响。例如:计算 当前薪金(salary)与起始薪金 (salbegin)的相关系数得0.890,但是当前薪金显然还受到 受教育年 限(educ)的影响,这个影响在计算相关系数时没有被扣除,因此 0.890这个数字不完全真实。如扣除educ的影响,在计算salary和 salbegin的相关系数,就更接近真实了。这个被扣除的变量就叫控 制变量,这里educ便是控制变量。控制变量可以不止一个。 偏相关系数 扣除控制变量影响后得到的相关系数称为 偏相 关系数(partial correlation ),计算命令为:Correlate\Par

文档评论(0)

ld5559789 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档