网站大量收购独家精品文档,联系QQ:2885784924

correlationanalysis简介培训提纲.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
correlation analysis简介培训提纲:●相关性分析是对关系的分析 ------有无关系 ------有多大关系(在一组变量中,确定相关性程度) ------不在于由X去预测Y,这是回归分析●偏相关、复相关、简单直线相关系数的关系●定序变量相关注意点:r系数只限用于两个变量的线性关系,而绝大多数现实中的关系都不会是线性的,只能在有限范围内的近似线性;边际效益递减规律;正相关/负相关先定性猜想,再用定量分析来证实;人机料法环;定性往往只能定因素(自变量)范围,而定量可以分析因素(自变量)的影响程度;尽量采用现有的数据;尽量简化;采集数据的设计,数据要有可统计性数据的准确性及时性注意权重;发生的概率,把小概率事件原因,当成主要因素去考虑,是绝对正确,但无意义的做法。变量的定义内容(YKE有很多定义与通用的定义不同,如SMT千点数,不同部品间的折算率;直行率;标准工时等)要尽量提出变量中包含的扰动因素,如汇率对利益计算的扰动,但可以考虑利用扰动因素,如顺势炒外汇等紧扣效率和成本考虑紧扣分析的目的——改善存量/变量的概念(固定成本/变动成本)可控/不可控的区分(暂时不可控)相关性分析是一种思考方法,可以扩展应用。是在未能全部掌握内在规律、不能全部了解变量、不能全部统计数据等的条件下的简单、科学的分析手段。例:SMT效率分析表 作业:各课人工效率降低因素分析人工效率的定义(YKE的定义,计算公式)分析影响的因素确定变量确定利用的数据(是否需要重新统计)计算分析,提出结论提出改进建议参考资料:相关关系是一种非确定性的关系,例如,以X和Y分别记一个人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。分类1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。(1)正相关:如果x,y变化的方向一致,如身高与体重的关系,r0;一般地,·|r|0.95 存在显著性相关;·|r|≥0.8 高度相关;·0.5≤|r|0.8 中度相关;·0.3≤|r|0.5 低度相关;·|r|0.3 关系极弱,认为不相关(2)负相关:如果x,y变化的方向相反,如吸烟与肺功能的关系,r0;(3)无线性相关:r=0。如果变量Y与X间是函数关系,则r=1或r=-1;如果变量Y与X间是统计关系,则-1r1。(4)r的计算有三种:①Pearson相关系数:对定距连续变量的数据进行计算。②Spearman和Kendall相关系数:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩。实际上,对任何类型的变量,都可以使用相应的指标进行相关分析。也就是,有各种参数,对适合它们的变量进行分析。相关计算的其他系数:1 对于有序变量,最常用的还有Gamma统计量,取值介于1到-1之间,取值为零时候,代表完全不相关。其实,对于任何相关系数,一个万能公式就是,如果越接近零,代表越不相关,越接近1,代表越相关。在spss中,各种变量都被分到各个栏中,下面对应着各种统计量。这部分操作是:“描述统计”~“交叉表”:“统计量”子对话框中实现。需要注意的是,虽然都是复选框,但是,也不能乱选,主要看想要分析的究竟是什么类型的变量。2、偏相关分析:研究两个变量之间的线性相关关系时,控制可能对其产生影响的变量。如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系。3、距离分析:是对观测量之间或变量之间相似或不相似程度的一种测度,是一种广义的距离。分为观测量之间距离分析和变量之间距离分析。(1)不相似性测度:·a、对等间隔(定距)数据的不相似性(距离)测度可以使用的统计量有Euclid欧氏距离、欧氏距离平方等。·b、对计数数据使用卡方。·c、对二值(只有两种取值)数据,使用欧氏距离、欧氏距离平方、尺寸差异、模式差异、方差等。(2) 相似性测度:·a、等间隔数据使用统计量Pearson相关或余弦。·b、测度二元数据的相似性使用的统计量有20余种。相关关系相关分析与回归分析在实际应用中有密切关系。然而在回归分析中,所关心的是一个随机变量Y对另一个(或一组)随机变量X的依赖关系的函数形式。而在相关分析中 ,所讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。复相关研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线

文档评论(0)

dashewan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档