- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 数据预处理及基本统计分析
* 单击“添加”按钮后,在“多响应集”框内出现“$a3”,它代表一组题目(第3题的4个题目) 至此,第3题(多选题定义完成) 类似的,可以继续定义第4题(另一多选题) * * * 2.5.2 对多选题进行统计分析 基本操作:数据——多重响应——频率 * 注意:此处$a3, $a4分别代表前面定义的两个多选题。 * 频数分析输出结果 * 多选题分析的SPSS操作 * 注意:第4题上述结果的解释,例如“大公无私”的频数为11,表明,将“大公无私”重要性列在前三位的被调查者有11人。 如果想了解,将重要性列在第1位的人数,可用“描述性统计”中的频数分析,对变量a4-1进行分析。 结果如下: * 结果表明,被调查者中,认为高层管理者第一重要的素质是“大公无私”的有10人,认为高层管理者第一重要的素质是“坚持原则”的有4人,认为高层管理者第一重要的素质是“敢想敢干”的有10人,……. * 2.5.3列联表分析 * * * * * * 将年龄作为分层变量的列联表 操作:将age选入“层”框中,其余操作完全相同 * * * * * * 另外,如果需要计算各种百分比,可单击“选项”按钮,并在打开的对话框中选择相应的选项。 多选题练习 居民储蓄调查数据中,第七题为多选题,请进行频数分析。 任务五:分析储户的储蓄目的 任务六:分析不同年龄段储户的储蓄目的 注意:将结果保存到word中。 * 自学 统计图 操作 * Thank you * * 什么是分布?概率分布 2.2 计算基本描述统计量 描述对称程度的统计量 偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量. 偏度为0表示对称; 大于0表示正偏差大(右偏) 小于0表示负偏差大(左偏)。 描述陡峭程度的统计量 峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。 峭度为0表示与标准正态分布峭度相同。 大于0表示比标准正态分布陡,尖峰。 小于0表示比标准正态分布缓;平峰。 * 2.2 计算基本描述统计量 基本操作步骤: 分析——描述统计—描述 更适合于 数值型数据 * 注意: 数据类型的分类 数据类型一定要进行区分后,再针对性的展开分析 * 利用居民储蓄调查数据完成以下三个分析目标: 目标一:分析储户的户口和职业的基本情况。 目标二:分析储户一次存款金额的分布。 目标三:对城镇储户和农村储户的一次存款金额的分布进行比较。(提示:先将城镇、农村储户进行区分,采用 数据——拆分文件) 注意:将结果保存到word中。 频数分析的应用练习 分析: 目标一:分析储户的户口和职业的基本情况 (1)户口和职业两个变量都是定类型变量,可通过基本频数分析实现。 (2)职业变量的取值(分类)数目较多,为使频数分布表更一目了然,应对内容的输出顺序进行调整,单击“格式”按钮,选择频数的降序输出。 (3)单击“图表”按钮指定输出户口变量的饼图和职业变量的条形图。 目标二:分析储户一次存款金额的分布 分析思路: 由于存(取)款金额数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑数据分组功能对数据分组后再编制频数分布表。 分析过程: (1)数据分组,将存(取)款金额重新分成五组,五组区间分布为,少于500元,500-2000元,2000-3500元,3500-5000元,5000元以上。分组后进行频数分析并绘制带正态曲线的直方图。 (2)用描述性分析计算其均值、标准差、偏度、峰度系数等 目标三:对城镇储户和农村储户的一次存款金额的分布进行比较。(提示:先将城镇、农村储户进行区分,采用 数据——拆分文件) (1)进行数据拆分 (2)利用SPSS的描述分析计算城镇户口和农村户口的存(取)款金额的均值、标准差、偏度等。 2.4 列联分析—卡方检验 什么是列联表 列变量 行变量 地区 控制变量 频数 目的:在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,进而分析变量之间的相互影响和关系。 对于这种涉及两个或两个以上变量分布情况的研究通常要利用交叉分组下的频数分析来完成。 * * 上表中的职称变量称为行变量(Row),文化程度称为列变量(Column)。行标题和列标题分别是两个变量的变量值(或分组值)。表格中间是观测频数(Observed Counts)和各种百分比。16名职工中,本科、专科、高中、初中的人数分别为4,4,5,3,构成的分布称为交叉列联表的列边缘分布;高级工程师、工程师、助理工程师、无技术职称的人数分别为3,4,6,3,构成的分布称为交
您可能关注的文档
最近下载
- 《现代家政基础》 项目六 现代家庭安全.pptx
- 高考思想政治一轮总复习精品课件 选必3 逻辑与思维 第三单元 运用辩证思维方法-第九课 理解质量互变.ppt VIP
- 临床营养科建设与管理指南(试行).doc VIP
- 2025年中考复习必背外研版初中英语单词词汇(精校打印) .pdf VIP
- 年产55万吨环氧乙烷乙二醇车间环氧乙烷合成工段工艺设计.doc VIP
- 食堂食材配送采购投标方案(技术标).doc
- 临床常用200种常用中药饮片排名.docx VIP
- 德力西850W交流角磨机说明书.pdf VIP
- 2025年四川省内江市中考数学试卷.docx VIP
- 【完整升级版】电力施工组织设计施工方案.doc
文档评论(0)