统计第三章中文版解析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
阐明复杂世界中的差异 本章在前两章基础上为我们提供了一个通向数据分析更高层次的阶梯—多变量分析技术。目前为止我们讨论过的单变量或双变量分析的方法和技术已经能够使分析者在一组或两组差异中发现形式。然而,很明显世界并没有被分割成孤立的变量对。因此,如果只尝试用两个两个的形式解释差异,就不可避免地使回归分布受限制,在最坏情况下可能失真。多变量技术是通过搜集世界更复杂的部分进入一个分析框架中来帮助分析者减少这些限制或扭曲的工具。 在3.1我们检测了双变量分析被应用于三个变量或者更多变量数据分析时的基本限制。这些限制部分来源于不断增长的变量数目,还来自于有可能变得更复杂的关系模式。这种对后者的关注将会引导我们去引进不同的混淆关系,调节关系和中介关系模式。在3.2介绍了多变量数据分析的比较核心的策略,并且大概讨论了这种策略是怎么解决3.1介绍的双变量技术的限制。这种策略通过“权衡”每一个变量并且将它们纳入到 一个复合物中而形成复合变量,然后将这个复合变量又引入到另一个复合物中。这种复合和权衡的思想如此基本以至于我们要检测它们在一些细节上的意义和解释,但是这种思想总是强调概念上的而不是统计学的问题。为了保证这些中心方法是让人信服的,我们首先通过对简单回归的回顾来开始这一章的学习,并将它延伸到可以容纳更多独立变量的多元回归中,并且最后呈现多元回归方式是怎么被概括到一个广义的MDA策略中的。在3.3我们回归到细节并且尽力去得到一个更加关键的关于“复合变量数据分析必须提供什么”的一个视角。它的优势是相当明显的,但是它们很容易被夸大或者被曲解,这种事件的发生部分因为语言的使用,因为统计学术语例如“解释”和“预测”似乎代表了很多,但是事实上它们要比在一般研究论述中有更多的约束性的意义。带着这些最后的想法,我们应该做好准备用一种广阔的和平衡的方式去学习第2部分的技术。 3.1 双变量分析的限制 在第一章我们使用了简单回归去探索积极情绪方面的差异可以在多大程度上解释幸福感方面的。因为我们也拥有生活满意度方面的数据,所以我们可以重复分析去看一下生活满意度的差异是否也可以解释幸福感方面的差异。在分离的双变量分析中处理这两种关系的限制是什么呢?它们可以被分成三类:描述性的,推断性的,相关性的。 从描述性的角度我们没有发现积极情绪和生活满意度是如何共同地作用于幸福感的。我们不清楚这两种属性总共可以在多大程度上解释幸福感方面的差异。在特定的情境下这个问题的答案可以来源于双变量分析,但是正如我们看到的,这种情境太稀少了。对这种类型的描述性问题的更有力的回答来源于多变量分析。 转向统计推断,在第2章我们发现零假设的测验结果主要依赖于α,如果零假设被拒绝,那么概率值必须在临界值之外。α的价值是防止不适当地拒绝零假设(I型错误),这种错误地发生率比我们所希望的通常的5%更高。这个程序的一个特点是计算结果是依据一次性的抽样逻辑预测出来的。那时我们忽略了这一点。如果我们继续转向数据,开始测验越来越多的由共同变量相连的假设,那么α的真值无形的扩大。因此,我们可能以为一个0.05的α是恰当的,但它的真值可能更高。从另一方面来说,我们测试的相同变量的假设越多,我们就越可能错误地相信我们已经发现了一个效应。许多技术已经开始解决这种多元测验的膨胀结果,我们将在第6章探讨它们。这些是很有价值的,但是另一个能使我们一次性测试一系列假设的方法对我们也是很有帮助的。我们将会发现多变量分析可以精确地提供这种便利,例如,我们只需一次多变量测试就可以评估积极情绪、生活满意度是否与幸福感有统计学意义的关系。 尽管双变量分析在指出一系列变量的全部影响以及减少假设测验的次数方面很重要,但是考虑各种变量之间的关系远比这重要。在这儿我们要回归到我们的中心思想——世界不是由独立的变量对组成的。例如,积极情绪和生活满意度对幸福感的任何一个影响不可能都是相互独立的或者的确独立于目前还没提及的其他变量的。如果这是正确的,我们需要系统的考虑三个或者更多变量大体上是怎么联系的,然后这些模式是怎么系统分析的。很明显,根据定义,双变量分析不能完成任务,为我们转向多变量分析找到了另一个动力。 多变量关系模式通常被认为是这三种:混淆模式,调整模式,中介模式。我们可以用两个自变量和一个因变量来说明这些,但是我们必须知道这些是最简单的三变量版本。由于分析中加入了更多的变量,比之前更加复杂的关系出现的可能性以一个惊人的速度在增长。 同时,这种基本的模式列表是不详尽的,但是它包含了许多分析情境为其他可能性提供了建模。 在混淆模式中两个自变量对一个因变量的独立影响是失真的,因为自变量之间是有关联的。因此,例如,如果积极情绪和生活满意度在某些程度是相关的,那么就很难理清它们各自对幸福感的影响:它们之间很可能相互混淆。这就意味着对于混淆的研

文档评论(0)

四娘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档