- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
常用数据分析方法分类介绍(注明来源)
常用数据分析方法有那些
文章来源:ECP数据分析时间:2013/6/2813:35:06发布者:常用数据分析 (关
注:554)
标签:
本文包括:
常用数据分析方法:聚类分析、因子分析、相关分析、对应分析、回归分析、方
差分析;
问卷调查常用数据分析方法:描述性统计分析、探索性因素分析、Cronbach’a
信度系数分析、结构方程模型分析(structural equations modeling) 。
数据分析常用的图表方法:柏拉图(排列图)、直方图(Histogram)、散点图
(scatter diagram)、鱼骨图 (Ishikawa)、FMEA、点图、柱状图、雷达图、趋
势图。
数据分析统计工具:SPSS、minitab、JMP。
常用数据分析方法:
1、聚类分析 (Cluster Analysis)
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分
析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中
的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探
索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能
够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不
同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。
2、因子分析 (Factor Analysis)
因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的
数据中寻找内在的联系,减少决策的困难。
因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方
法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是
以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的
共同性□2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆
法。
3、相关分析 (Correlation Analysis)
相关分析 (correlationanalysis),相关分析是研究现象之间是否存在某种依
存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是
一种非确定性的关系,例如,以X和Y分别记一个人的身高和体重,或分别记每
公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中
的一个去精确地决定另一个的程度,这就是相关关系。
4、对应分析 (Correspondence Analysis)
对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,通过分
析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个
类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想
是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表
示出来。
5、回归分析
研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统
计分析方法。回归分析 (regressionanalysis)是确定两种或两种以上变数间相
互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自
变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的
关系类型,可分为线性回归分析和非线性回归分析。
6、方差分析(ANOVA/Analysis of Variance)
又称 “变异数分析”或 “F检验”,是R.A.Fisher发明的,用于两个及两个以
上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动
状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的
对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制
变量中哪些变量是对观测变量有显著影响的变量。
数据分析常用的图表方法有:
柏拉图(排列图)
排列图是分析和寻找影响质量主原因素的一种工具,其形式用双直角坐标图,左
边纵坐标表示频数 (如件数金额等),右边纵坐标表示频率 (如百分比表示)。
分折线表示累积频率,横坐标表示影响质量的各项因素,按影响程度的大小 (即
出现频数多少)从左向右排列。通过对排列图的观察分析可抓住影响质量的主原
因素。
直方图
将一个变量的不同等级的相对频数用矩形块标绘的图表(每一矩形的面积对应于
频数)。
直方图(Histogram)又称柱状图、质量分布图。是一种统计报告图,由一系列高
度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵
轴表示分布情况。
散点图(scatter diagram)
文档评论(0)