相关分析概念.docVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关分析概念

变量间的相互关系 ◆确定性的函数关系 Y=f (X)    对应回归分析 当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。 (1)是一一对应的确定关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条线上 ◆不确定性的统计关系—相关关系      对应相关分析 Y= f(X)+ε (ε为随机变量) 当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。    现象之间客观存在的不严格、不确定的数量依存关系。 (1)变量间关系不能用函数关系精确表达; (2)一个变量的取值不能由另一个变量唯一确定; (3)当变量 x 取某个值时,变量 y 的取值可能有几个; (4)各观测点分布在直线周围。 ◆没有关系 ?●从涉及的变量数量看 简单相关 多重相关(复相关) ●???? 从变量相关关系的表现形式看 线性相关——散布图接近一条直线 非线性相关——散布图接近一条曲线 ●???? 从变量相关关系变化的方向看 正相关——变量同方向变化,同增同减 负相关——变量反方向变化,一增一减 使用相关系数时应注意: ?●X和Y 都是相互对称的随机变量, ●?线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系 ●?样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是个随机变量,其统计显著性有待检验 ●?相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线 相关分析:就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。 回归分析:是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。 相关分析与回归分析的区别 1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。 2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。 3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。 相关分析与回归分析的联系 相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。 简单说:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。 相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。 简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为( 若是根据样本数据计算的,则称为样本相关系数,记为 r 总体相关系数的定义式是: ρ=      (7.1) 式中,Cov(X,Y)是变量X和Y的协方差; Var(X)和Var(Y)分别为变量X和Y的方差。 总体相关系数是反映两变量之间线性相关程度的一种特征值, 表现为一个常数。 样本相关系数的定义公式是:   (7.2) 上式中,和分别是X和Y的样本平均数。 样本相关系数是根据样本观测值计算的,抽取的样本不同, 其具体的数值也会有所差异。 容易证明,样本相关系数是总体相关系数的一致估计量。 相关系数的特点: 1.r的取值介于-1与1之间, r 的取值范围是 [-1,1] 2.在大多数情况下,0<|r|<1,即X与Y的样本观测值之间存在着一定的线性关系,当r>0时,X与Y为正相关,当r<0时,X与Y为负相关。 |r|的数值愈接近于1,表示x与y直线相关程度愈高;反之, |r|的数值愈接近于0,表示x与y直线相关程度愈低。通常判

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档