- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章 相关与回归 第一节 相关关系及种类 第二节 定类变量的相关分析 第三节 定序变量的相关分析 第四节 定距变量的相关分析 第五节 回归分析 社会上,许多现象之间也都有相互联系,例如:身高与体重、教育程度和收入、学业成就和家庭环境、智商与父母智力等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。 有的现象之间有因果关系,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。 相关就是用于研究和解释两个变量之间相互关系的。 第一节 相关关系( Correlation)及种类 一、相关关系的种类: 1、因果关系和共变关系 因果关系中两个变量有自变量(independent Variable)和依变量(dependent Variable)之分;(1)两个变量有共变关系, (2)因变量的变化是由自变量的变化引起的。 (3)两个变量的产生和变化有明确的时间顺序,前者称为自变量,后者称为因变量。 表现为共变关系的相关关系,不能区分自变量和依变量,互为根据。可以根据研究目的自由选择。 相关关系不等于因果关系。下雪与结冰 有两个钟都很准时,当a到了整点时,b就会敲响,是a引起了b的敲响吗? 有些相关是由于机缘巧合而产生的。由于机会的存在,你或许可以通过一组数据来证明一些根本不存在的结论。 一篇医学文章曾严厉警告:喝牛奶的人中癌症的发病率在上升。文章还指出,牛奶消费量极大的英国妇女患癌症的概率是很少喝牛奶的日本妇女的18倍。(而同期英国妇女的平均寿命比日本妇女长12岁) 英国新赫布里底群岛上土著居民的信条:身上的跳蚤会带来健康的身体。因为土著居民发现,身体健康的人身上总有一些跳蚤,而身体羸弱的人身上通常没有跳蚤。 2、单相关和复相关 从变量的多少上看:单相关只涉及两个变量,二元相关;三个或三个以上变量之间的关系称为复相关,多元相关。 3、直线相关(Linear Correlation)和曲线相关 从变量变化的形式上看:如果关系近似地表现为一条直线,就称直线相关或线性相关。曲线——曲线相关 由于数学手段的局限性,统计学以阐述线性相关为主,然后通过分段处理,也可以用于处理曲线相关。 4、相关方向:正相关和负相关 自变量的增长引起依变量的相应增长,就形成正相关; 5、相关程度 完全相关、不完全相关和完全不相关 完全相关,指变量之间为函数关系;完全不相关指变量之间不存在任何依存关系,彼此独立。不完全相关介于两者之间。 样本的相关系数用r (correlation coefficient) 相关系数r的值在-1和1之间,可以是此范围内的任何值。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱. 0.80 以上 非常高(强)相关 0.60~0.80 高度(强)相关 0.40~0.60 中等相关 0.20~0.40 低(弱)相关 0.20以下 非常低(弱)相关 r=1 r=-1 r=0.8 r=0.2 r=-0.2 6、相关表和散点图 相关表:经整理后反映两变量之间对应关系的数据表。 散点图:将相关表中各个有对应关系的数据在直角坐标系上标出来,就得到散点图:直观地观察变量之间的关系 散点图表示的相关的类型 ★正相关 ★负相关 ★完全正相关 ★完全负相关 ★称零相关 53项研究归结出的三种血缘关系水平者智力测验分数的相关 三种血缘关系的家庭成员的人格相关 第二节 定类变量的相关分析 本节内容: 1、列联表 2、削减误差比例 3、λ系数 4、τ系数 1、列联表:在分组的基础上把两个变量的频数分布交互分配在一个统计表中。又称交互分类表(Cross classification)。 性别与对吸烟的态度 习惯上把要考察或预测的变量称为依变量,Y,放在表侧;另一变量为自变量,X,放在表头。 2×2列联表,最简单的交互分类表。 r×c列联表 r(row)、c(column) 用频数表示,由于基数不同不便于比较,转化成频率分布列联表。 联合分布:如果 边际分布: 条件分布: 例:试把下表所示的频数分布列联表,转化为自变量受到控制的相对频数条件分布列联表,并加以相关分析。 从上表可知,受过大学以上教育的被调查者绝大多数(占95.8%)是投票的,受教育程度在大学以下的被调查者虽多数也参与投票(占67.9%),但后者参与投票的百分比远小于前者;
文档评论(0)