- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 相关分析 0 一些现象 数学成绩与语文成绩 身高与性别 寿命与生长环境 课程成绩与教学方法 课程成绩与教师 化肥使用量与产出 孩子学习主动性与家长的学习 …… 1 基本概念 事物或现象之间的三种关系。 第一种是因果关系,这种关系说明的是事物之间相互依存,互为因果的关系,是事物之间存在的一种必然关系,即一种引起与被引起的关系,因在前果在后的顺序是不能颠倒的。 第二种是共变关系,例如夏天冷饮的销量和中暑人数的关系。当天气炎热时,两者都会增加,但通常我们不认为它们之间有什么因果关系。但事实上两者皆起因于天气炎热的因素,它们之间并没有直接的关系。 第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的联系,但不是前面两种关系。 另一说相关关系反映现象的共变关系。 1.1 相关 两类现象在发展变化的方向与大小方面存在一定的联系,但不是因果关系。 1.2 相关的类型 --正相关(Positive correlation)是指两列变量变动方向相同,一列变量由大到小或由小到大变化时,另一列变量亦由大到小或由小到大变化。如身高与体重,身高越长,体重就越重 正相关虽然意思明确,其实是个模糊的概念,不可以量化,只是定性说法。如果有明确的关系,例如 y=2x,这叫y与x成正比,如果只是大体上,x、y的变化方向一样,例如x上升,y也上升或者x下降,y也下降,那么,这叫正相关 。 --负相关(Nagtive correlation)是指两列变量变动方向相反,一列变量由大到小或由小到大变化时,另一列变量反而由小到大或由大到小变化。 负相关是事物之间相互“制约”,一种事物发展导致另一种事物受到限制。 特别是“替代品”。比如资源政策、环保政策出台必然导致“一次性资源”替代品的出现,象“代木代钢”发展起来的PVC塑钢。再如随着计算练习次数增加或练习时间加长,计算错误就越少等等。 零相关是指两列变量之间没有关系,即一列变量变动时,另一列变量作无规律的变动,又称为无相关或不相关。 如相貌与人的行为等现象之间的关系,都属于零相关。 1.3 相关的强度 完全相关是指两列变量的关系是一一对应,完全确立的关系。在坐标轴上描绘两列变量时会形成一条直线。 强相关又称高度相关,即当一列变量变化时,与之相应的另一列变量增大(或减少)的可能性非常大。在坐标图上则表现为散点图较为集中在某条直线的周围。 弱相关又称低度相关,即当一列变量变化时,与之相对应的另一列变量增大(或减少)的可能性较小。亦即两列变量之间虽然有一定的联系,但联系的紧密程度较低。在坐标涂上表现出散点比较分散地分布在某条直线的周围。 1.4相关的标示类型 直线相关(Linear Correlation)又称线性相关,是指两列变量中的一列变量在增加(或减少)时,而另一列变量随之而增加(或减少),或这一列变量在增加时,而另一列变量则相应地减少。它们之间存在一种直线关系。直线相关可用直线拟合。 曲线相关(Curvilinear correlation)又称非线性相关,是指两列伴随相变化的变量,未能形成直线关系。 1.4 散点图 2 直线相关系数 以∑xy衡量相关程度 正相关时∑xy为正,相关程度越高,值越大。 为什么? 负相关时∑xy为负,相关程度越高,绝对值越大。 不相关时∑xy趋近于0。 为什么? 因此,以(∑xy)/n—协方差衡量相关程度较好。 但,测量单位改变时,协方差会随之改变。 进一步,再用协方差除以变量XY 的标准差之积σx σy,得到一个指标,称为直线相关系数。 2.1 Pearson correlation coefficient 皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,xy、 分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。( 1
文档评论(0)