- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章 分类变量的统计描述与参数估计 6.1分类变量的统计描述概述 6.1.1分类变量的统计描述指标体系 一、频数分布情况描述 各个类别的样本数和所占比例分别称为频数(绝对频数)和百分比(构成比)。 累计频数是指本类别及较低类别出现的次数之和,累计百分比则是指本类别及较低类别出现的次数之和占总次数的百分比。 (2)构成比(Proportion) 6.1.2 分类变量的联合描述 当一共有两个分类变量时,这汇总因分类变量的各类别交叉而成的复合频数表被称为行*列表,也称列联表。 6.1.3 多选题的统计描述 多选题的描述指标体系 6.1.4 分类变量的参数估计 1 二项分布的参数估计 6.2.1使用Frequencies过程输出频数表 具体操作: Analysis Descriptive Statistics Frequencies * * 根据类别的有序性,分类变量可以分为有序分类变量(Ordinal Variable)和无序分类变量(Nominal Variable)。 当集中趋势显著时,用众数(Mode)作为总体的代表值。 二、集中趋势的描述 所谓众数,使之出现次数最多的那个数。如果只有一个众数称为单众数,多于一个的称为复众数。 (1)比(Ratio):比指的是两个有关指标之比A/B,用于反映两个指标在数量/频数上的大小关系。 三、使用相对数进行深入描述 率是一个时间概念,或者说具有速度、强度含义的指标,用于说明某个时间发生的频率或强度。 分观察对象为K部分(A1、A2、……Ak),其中某一个/多个部分的例数占总例的比例为构成比,它描述某个事物内部各构成部分所占的比重。 (3)率(Rate) 当观察的现象与两个因素有关时,如某种服装的销量受价格和居民收入影响;某种产品的生产成本受原材料价格和产量的影响等等,交叉列联表分析可以比较好的反映出两个因素之间有无关联性,两因素与现象之间的相关关系。因此,数据交叉列联表分析主要包括两个基本任务: 1、根据收集的样本数据,产生二维或多维交叉列联表; 2、在交叉列联表的基础上,对两两变量间是否存在关联性进行检验。 在多选题分析中比较特别的描述指标有: (1)应答人数:是指选择了本项人数。 (2)应答人数百分比(Percent of Cases):选择该项的人占总人数的比例。 (3)应答人次:选择本选项的人次。 (4)应答次数百分比(Percent of Responses):在作出的选择中,选择该项的人数占总次数的比例。 一、二项分布 二项分布又称为贝努里(Bernoulli)分布,是一种具有广泛应用的离散型随机变量的概率分布。二项分布研究的是试验仅有两种结果的分布(这种试验称为贝努里试验),如某产品质量合格与不合格等。其定义为:设有n 次试验,各次试验是相互独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是1-p,记为q,则对于某事件出现k(k=0,1,2,?,n)次的概率分布为: 二、二项分布的参数估计 当n较大时,p不接近0也不接近1时(一般认为n 40, np 5和nq 5),二项分布B(n,p)近似正态分布,这样可利用正态分布中的相应结果来进行参数估计。 1、Define Sets过程 该过程指定变量组成一个多重响应或多重两分数集,并应用于频数表和交叉列表。 2、Frequencies过程 该过程对定义的多重响应或多重两分数提供一个频数表。 3、Crosstabs过程 该过程提供带有另一种变量的,已定义的多重或多重两分数据集交叉表。 4、表格模块 6.2分类变量的统计描述实例 1、使用频率过程 CCSS项目中的性别和学历的交叉频数分布。 2、使用交叉表过程 CCSS项目中的学历分布。 3、多重相应过程 CCSS项目中的还贷分布。 CCSS项目中的婚姻和还贷的交叉分布。 1、打开数据,单击Analyze?Descriptive Statistics? Crosstabs对话框。 2、如果是二维列联表分析,可以将行变量选择进入Row(s)中,将列变量选择进入Column(s)框中。如进行三维以上的列联表,可以将其它变量作为控制变量选到Layer框中。多控制变量可以是同层次的也可以是逐层叠加的。 6.2.2 使用Crosstabs过程输出列联表 3、Display clustered bar chart选择项,可以指定绘制各变量交叉频数分布柱形图。Suppress table表示不输出列联表,只有在分析行列变量间关系时选择此项。此例中不选择这一项。 4、单击Cell按纽,打开Crosstabs:Cell Display对话框,如图所示。从对话框中指定列联表单元格中的输出内容。在Counts框中选择Observed 观察值(系统默认)或Expec
文档评论(0)