- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关分析概念
变量间的相互关系
◆确定性的函数关系 Y=f (X) 对应回归分析
当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。
(1)是一一对应的确定关系
(2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
(3)各观测点落在一条线上
◆不确定性的统计关系—相关关系 对应相关分析
Y= f(X)+ε (ε为随机变量)
当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。
现象之间客观存在的不严格、不确定的数量依存关系。
(1)变量间关系不能用函数关系精确表达;
(2)一个变量的取值不能由另一个变量唯一确定;
(3)当变量 x 取某个值时,变量 y 的取值可能有几个;
(4)各观测点分布在直线周围。
◆没有关系
?●从涉及的变量数量看
简单相关
多重相关(复相关)
●???? 从变量相关关系的表现形式看
线性相关——散布图接近一条直线
非线性相关——散布图接近一条曲线
●???? 从变量相关关系变化的方向看
正相关——变量同方向变化,同增同减
负相关——变量反方向变化,一增一减
使用相关系数时应注意:
?●X和Y 都是相互对称的随机变量,
●?线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系
●?样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是个随机变量,其统计显著性有待检验
●?相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线
相关分析:就是用一个指标来表明现象间相互依存关系的密切程度。广义的相关分析包括相关关系的分析(狭义的相关分析)和回归分析。
回归分析:是指对具有相关关系的现象,根据其相关关系的具体形态,选择一个合适的数学模型(称为回归方程式),用来近似地表达变量间的平均变化关系的一种统计分析方法。
相关分析与回归分析的区别
1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。
2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。
3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。
相关分析与回归分析的联系
相关分析和回归分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
简单说:1、相关分析是回归分析的基础和前提;2、回归分析是相关分析的深入和继续。
相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。
简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为(
若是根据样本数据计算的,则称为样本相关系数,记为 r
总体相关系数的定义式是:
ρ= (7.1)
式中,Cov(X,Y)是变量X和Y的协方差;
Var(X)和Var(Y)分别为变量X和Y的方差。
总体相关系数是反映两变量之间线性相关程度的一种特征值,
表现为一个常数。
样本相关系数的定义公式是:
(7.2)
上式中,和分别是X和Y的样本平均数。
样本相关系数是根据样本观测值计算的,抽取的样本不同,
其具体的数值也会有所差异。
容易证明,样本相关系数是总体相关系数的一致估计量。
相关系数的特点:
1.r的取值介于-1与1之间, r 的取值范围是 [-1,1]
2.在大多数情况下,0<|r|<1,即X与Y的样本观测值之间存在着一定的线性关系,当r>0时,X与Y为正相关,当r<0时,X与Y为负相关。
|r|的数值愈接近于1,表示x与y直线相关程度愈高;反之, |r|的数值愈接近于0,表示x与y直线相关程度愈低。通常判
文档评论(0)