第五章数卓据分析.pptVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章数卓据分析

第五章 数据分析 主讲:吴小会 成员:吴玮 吴小会 多变量描述统计 研究原因 为了充分解释某种现象。 管理研究一般会面临两个以上变量,假设检验中也要处理多个变量,因此多变量分析就变的很是必要。 探索现象的成因 两变量的间强相关不一定就是因果关系,可能两者都是由第三个变量引起的,所以多变量分析发法是管理人员离不开的方法。 (一)多变量关联表 定义:就是引入第三个变量,按此变量的属性来分析考察自变量和因变量之间的关系。 反映自变量和因变量关系的表称为零级表,“零”意味着未引入另外的控制变量。引入控制变量后得出各种细分表,如只有一个控制变量此细分表为一级细分表,一级细分表的数量和控制变量的属性值有关,每个属性值相应有一个细分表,相当于控制变量的某个属性进行一次试验的结果。 引入控制变量后可能的四种结果: 第一种无效应。一级细分表和零级细分表的结果相同或相似,这意味着引入的控制变量和自变量及因变量都无关联。 x 第二种干预效应。从时序关系来看,自变量对因变量产生作用的过程中,或者先通过控制变量,或者同时受控制变量的作用而产生影响。此时控制变量在受控的情况下,零级表和一级细分表所反映的自、因变量间的关联强度应该保持一致。 x 计算公式 Y=b1x1+b2x2+b3x3+……+bnxn+a 其中:bi表示自变量xi变化一单位时在其他自变量保持不变的情况因变量下y的变化量,α表示随即误差。 2 多元回归分析 回归方程可用来计算任何x值情况下y的观测值,以及每次观测中y的观测值和预测值之差,即残差。 多元线性回归方程一般可表述为: 多元回归分析的内容和功能与一元回归分析完全一样,只是回归方程中包含两个或更多的自变量,回归系数表示方程中其他自变量受控的情况下一个自变量与因变量的关联。多元回归分析是较为完善且普遍应用的描述多变量关联的技术,从多元回归方程 可以检验自变量和因变量关联的统计显著性,一个多元回归方程对于因变量总偏差的解释程度与一元回归方程类似,但是多元回归方程并不能反映出各个自变量的相对重要性。 (三)因子分析 定义:因子分析是一类降维的相关分析技术,用来考察一组变量之间的协方差或相关系数结构,并用以解释这些变量与为数较少的因子之间的关联。因子分析的结果体现在将原来的一组变量聚类并浓缩成较少的称为因子的新变量,而这些因子能涵盖原来变量的主要特征。 1 分析步骤 第一步是构造一个相关矩阵,在参数标注化情况下,此相关矩阵(即协方差)反映所研究变量间的关联性。 第二步是在相关矩阵的基础上抽取新变量(即因子),提取因子是因子分析的主要内容。最常用的有主成分分析法和共同因子分析法。 2 确认型和探索型因子分析 主成分分析和公共因子分析两种抽取因子的方法不同引发老师两者功能的差异。公共因子分析法用来挖掘潜在的影响所有原来变量的新变量,研究者事先并无任何关于变量和因子间关联的假设。主成分因子分析,由于因子反映变量间最优线性组合,有可能事先提出假设,设定一组变量与某个因子或因子与因子之间存在强关联,然后去检验他们之间的负荷系数。所以,主成分分析用于确认型因子分析。 (四)原因事件的辨识 1 事件的变异性 在进行细分分析之前,“变异性”准则可帮助研究者辨析何者应作为原因事件的自变量,何者作为控制变量。至于变异性的分析,要审视事件发生的情境。如判断火灾原因,可能是电路短路原因,然而还会有易燃品、报警灭火系统也会形成火灾。通常把变异最明显的因素作为原因事件,即电器短路视为火灾原因。 2 时序性 如果存在因果关系,自变量必须发生在因变量之前。实证研究属于序惯性研究,跟踪事件发生的全过程,事件的时序性应该很清楚。例如,通过经济效益指标来考核企业的绩效这并没有错,但凭这些指标的好坏来推断该企业管理者管理有方或管理不善,将经济效益指标看成是“自变量”,管理者的管理水平是“因变量”,这就违反了时序性原则。 3 呼应性 呼应性指与自变量、因变量关联的事件发生在特定的空间范围之内。自变量和因变量之间如存在因果关系,必然存在相关关系。 * y z y 第三种掩盖效应。零级表显示的并非自变量和因变量两者直接存在的关联强度,而是控制变量z对x和y作用的结果。 z 第四种抑制效应。控制变量z对x和y产生影响,同时x、y也直接相关。 z x y x y (二)偏相关分析和多元回归 1 偏相关分析 定义:在消除第三个变量的影响后,自变量和因变量的关联程度。 例如分析个人的受教育水平和工作绩效之间的关联,两者的关联又受年龄的

您可能关注的文档

文档评论(0)

135****1071 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档