- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Chapter 16correlation and regression 第11周(1) 思考以下问题的统计方法 研究性别和学业成就的关系 研究高考成绩和大学学习平均GPA的关系 相关的概念 相关是度量和描述两个变量之间关系的一种统计技术. 数据要求:一定要有至少两个变量,两组分数。 相关告诉我们变量 X 和 Y之间关系的3个特征 1)关系的方向 2)关系的形式 3)关系的程度 1)关系的方向 正相关 (正数) 意味着两个变量向相同的方向变化. 亦即, 一个变量增加, 另一个变量也增加. 负相关 (负数) 意味着两个变量向相反的方向变化. 亦即, 一个变量增加, 另一个变量反而减少. 2)关系的形式 本课集中讨论线性(直线)相关, 但两变量的关系也有其他形式 3)关系的程度 相关也度量了X 和 Y间关系的强度.相关系数的值 在-1 和 +1之间. 0相关意味着没有关系. +1 意味着完全的正相关 之间 两个, -1 意味着完全的负相关. 为什么 (以及何时) 要用到相关? 预测- 如果两个变量间有强相关, 我们就可以根据一个变量的值,预测另一个变量的值。 如, 如果知道胎儿头部的超声波尺寸与婴儿出生时体重有正相关,则可预测婴儿出生时体重 效度 – 如果发明新的心理测验 (测验A), 想知道它是否测量 了X, 就需要知道测验A 是否与X相关. 如, 如果发明新的量表来预测管理潜能量表来预测晋升所需时间,这个量表分数应当与晋升所需时间相关。 信度 – 如果对同一组被试两次用相同的测验, 将两组分数做相关. 如果测验是可信的, 两次测验应当得到相似的结果, 产生高相关 理论验证 – 许多理论预测不同的变量之间存在某种关系. 然后我们收集数据, 来考察这样的关系是否存在 如何将相关的概念数量化? 相关有不同的种类, 我们主要讨论两种相关, Pearson 积差相关,Spearman等级相关. r = X 和 Y 共同变化的程度 = X 和 Y的协方差 X 和 Y各自变化的程度 X 和 Y 各自的方差 在概念上是什么意思? 共变意味着随着X 变化, Y 也变化. r = 1.0 (或 -1.0) 即完全的相关.意味着分子分数等于分母分数。 新的概念: 离差的乘积和(SP) 定义公式:SP = ∑(X-Xbar)(Y-Ybar) 对于每一点与X 和 Y的平均值的差,即离差, 求两个离差的乘积,再求和 用计算公式计算 SP 乘积和(SP)公式与和方(SS)非常相似 其区别是 SS只有一个变量 (X), SP 有 两个变量 (X 和 Y). pearson 相关 (r) 的计算 r = 分子SP是X 和 Y协方差的指标. 是 X和 Y 各自的变异 相关的解释 1) 关系的方向 --正或负2) 关系的形式 -- 线性或非线性3) 关系的程度 – 相关强度 4) 相关描述两个变量之间的关系, 但并不能解释变量相关的原因 5) 数据中的分数范围对相关有非常大的影响 6) 极端的分数对相关有非常大的影响 7) 解释关系强度应考虑 r2,不只是 r. 例2:计算以下两列数据的积差相关和等级相关 相关系数的显著性考验 总体参数 ρ , 样本统计量 r 虚无假设和备择假设 双侧: H0: ρ = 0, X和Y 之间无相关 H1: ρ≠0 单侧: 没有正相关. H0: ρ 0 H1: ρ 0 没有负相关 H0: ρ 0 H1: ρ 0 df = n - 2 查表 Spearman相关 适用的条件 原来的数据为顺序量表 从散点图上看,为非线性关系 计算方法 把两列数据分别从小到大排列 其它的计算方法和pearson相关的计算方法相同 Spearman的简单的计算方法 rs=1-6∑D2 n(n2-1) 例题 一位动物心理学家感兴趣动物的脑重和学习能力的关系,但他不知道此关系是否线性的。他选取n=10种动物得到数据如下。用适当的统计方法分析动物的脑重和学习能力的关系 因为非线性,所以用spearman相关。 R=1-6*8/10*99=0.952 alpha=0.05,查表,r的临界值=0.564 r0.564,即动物的脑重和学习能力呈正相关。 线性回归简介 r = 1.0的情况 作回归分析就是试图找到一条直线(以及线性方程)以最佳地拟合数据点. 上例中是显而易见的. 只有一条可能最佳拟合线 不完全相关的情况 此例中是最佳拟合线不是显而易见的。可能的拟合线不止一条。我们的目标是寻找最
文档评论(0)