- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析方法及软件应用;2016/9/20;4.4 多选项分析;1) 多选项分析的目的;多选项问题分析的一般步骤;一、多选项问题的分解;多选项二分法;二分法的编码;多选项分类法;分类法的编码;;1 3 6;2) 多选项分析的基本操作;1.定义变量集Define Sets:
(1) 从左边的变量中将多选变量集的变量选择到集合中的变量variables in sets框中,建立多选二分变量集或多选分类变量集。
(2) 在将变量编码为variables are coded as框中指定多选变量集中的变量是按照那种方法编码的。二分法Dichotomies表示以多选二分法编码,并在counted value中输入用哪个数值来表示选中该选项。类别categories表示以多选分类法编码,并在range框中输入变量取值的最小值和最大值。;居民储蓄调查数据.sav;(3) 为多选项变量集命名,系统会自动在该名字前加字符$。
(4) 单击添加add按钮将定义好的多选项变量集加到多响应集multi response sets框中。SPSS可以定义多个多选项变量集。
2. 频率Frequencies:对多选变量集进行频数分析。从多响应集multi response sets中把待分析的多选项变量集选择到表格tables for框中;
3. 交叉表Crosstabs:对多选变量集与其他变量集或与原基本变量进行交叉表分析。;(1) 选择列联表的行变量并定义取值范围;
(2) 选择列联表的列变量并定义取值范围;
(3) 选择列联表的控制变量并定义取值范围;
(4) 单击option按钮选择列联表的输出内容和计算方法。Match variable across response sets选项表示,如果列联表的行列变量均为多选项变量集时,第一个变量集的第一个变量与第二个变量集的第一个变量作交叉分组,依次类推。结果中:注意Pct of Responses (占总回答数的%)和Pct of Case (占总个案数%)的区别。
;3) 多选项分析的应用举例; 分析;一、定义多变量集(如前述)
二、频率分析操作(如下);频率分析输出结果;三、交叉表下的频率分析操作;交叉分组
输出结果;4.5 比率分析;1) 比率分析的目的和主要指标;通常的分析可以生成各个地区财产保险业务的保费收入占全部业务保费收入的比率变量,然后对该比率变量计算基本描述统计量(如均值、中位数、标准差、全距等),进而刻画比率变量的集中趋势和离散程度。
SPSS的比率分析除能够完成上述分析外,还提供了其他相对比描述指标,大致也属于集中趋势描述指标和离散程度描述指标的范畴,具体包括:;(1) 加权比率均值(Weighted mean):两变量均值的比,属集中趋势描述指标。;(2) AAD (Average Absolute Deviation) 平均绝对离差:是对比率变量离散程度的描述,计算公式为:
其中, 是比率数,M是比率变量的中位数,N为样本数;(3) COD (Coefficient of Dispersion) 离散系数:也是对比率变量离散程度的描述,计算公式为:
(4) PRD (Price-related Differential) 相关价格微分:是比率均值与加权比率均值的比,也是比率变量离散程度的描述。;(5) COV变异系数:用于对比率变量离散程度的描述,分为基于均值的变异系数(Mean centered COV)和中位数的变异系数(Median centered COV)。前者是通常意义下的变异系数,是标准差除以均值;后者定义为:
;2) 基本步骤与应用举例;(2) 将比率变量的分子选择到分子Numerator框中,将比率变量的分母选到分母Denominator框中。
(3) 如果做不同组间的比率比较,则将分组变量选择到组变量Group Variable框中。
(4) 单击统计量Statistics按钮指定输出哪些关于比率的描述统计量,出现如下窗口:;基本分析(各地区保险业务保费收入).sav;输出结果;4.6 探索分析;1) 探索分析的目的和方法; 分析Analyze?描述统计Descriptive Statistics?探索Explore
分析变量(Dependent List):数值型变量
分组变量(Factor List):分类变量
标识变量(Label Cases by):用某变量的值作为观察值得标识如id;选择一个或多个变量进入Dependent框作为分析变量,单击OK可获得分析变量的一系列基本统计量和图形。;输出基本统计量
均值的置信区间,可键入1—99%的任意值,根据该值算出置信区间的上下限。;箱图boxplots复选框:确定箱式图的绘
文档评论(0)