- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
spss教程_4-3(基本统计分析),spss统计分析基础教程,spss统计分析高级教程,spss统计分析教程,spss统计分析实用教程,spss11统计分析教程,spss11.0统计分析教程,spss基本统计分析,spss数据分析教程,spss回归分析教程
数据的类型与列联分析 定性数据 定性变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用定类或定序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对定性数据的描述和分析通常使用列联表 可使用???检验 列联表(例题分析) 列联表(contingency table) 列联表按多个(两个或两个以上)变量的不同取值对不同情形进行划分,也即划分不同的行或列。用以分行的变量称为行(row)变量,和用以分列的变量则称为列(column)变量。 表格中间各行变量和列变量不同取值的交汇处,就是这种情形出现的频数或计数(count)。 列联表中行变量和列变量的个数称为列联表的维数。 二维的列联表又称为交叉表(cross table)。 三维或三维以上的列联表叫做高维列联表。 列联表(contingency table) 列联表中每个行变量或列变量又有两个或更多的不同取值,这些取值常称为水平(level)。每一种不同的水平组合就代表一种不同的情形。 列联表的结构(2 ? 2 列联表) 列联表的结构(r ? c 列联表的一般表示) 关于某项政策调查的结果 ?? 统计量 用于检验列联表中变量间拟合优度和独立性 用于测定两个分类变量之间的相关程度 计算公式为 ? 相关系数(correlation coefficient) 测度2?2列联表中数据相关程度 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 列联相关系数(coefficient of contingency) 用于测度大于2?2列联表中数据的相关程度 计算公式为 V 相关系数(V correlation coefficient) 计算公式为 操作步骤 按Analyze--Descriptive Statistics--Crosstabs 顺序打开 Crosstabs 主对话框。 观察值的分布 边缘分布 行边缘分布 行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人 列边缘分布 列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为100人,120人,90人,110人 条件分布与条件频数 变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布 每个具体的观察值称为条件频数 观察值的分布(图示) 百分比分布(概念要点) 条件频数反映了数据的分布,但不适合对比 为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布 行百分比:行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比:列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n ) 期望频数的分布 假定行变量和列变量是独立的 一个实际频数 fij 的期望频数 eij ,是总频数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即 ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 表4-19是统计摘要表,列出观测量有效值个数、缺失值个数和总的个数。 从表4-20列联表中可看出,吸烟人中患病者有43人,比期望值33.9大,不吸烟人中患病者只有13人,比期望值22.1小。 输出结果如表4—19: 表4—19 吸烟与患病统计摘要表 2、输出结果及分析 表4-20 吸烟与患病列联表 表4-21 卡方检验 表4-21是卡方检验表,从表4-21中可看出,Chi-Square值为7.469,显著值为0.0060.05,应否定零假设,即认为吸烟与患慢性支气管炎是不独立的。由于使用卡方检验要求每个单元格频数不少于5,当条件不满足时,还可用Fisher精确检验。其双侧检验显著值为0.007。 表4-22是对称性测量表,变量间相关关系弱, 不应拒绝原假设 表4-22 对称性检验表 420 141 279 合计 110 90 120 100 合计 33 57 三分公司 31 75 32 反对该方案 79 四分公司 75 二分公司 一分公司 68 赞成该方案 行边缘分布 列边缘分布 条件频数 1: 居民储蓄调查数据 分析储户存(取)款金额的基本描述统计量, 并对城市储户和农村储户进行比较. 使用时,直接删除本页! 精品课件,你值得拥有! 精品课件,你值得拥有! 使用时,直接删除本页! 精品课件,你值得
您可能关注的文档
- PART B - 3.ppt
- p07大比例尺地形图及其测绘.ppt
- PAL-TV Test.ppt
- Part2_802.11Frame.ppt
- part9_10.ppt
- PC-2c 程序控制系统的提升.ppt
- PCB工艺与制作(学生版).ppt
- PCI诊断卡的使用.ppt
- PCB流程简介(inner).ppt
- PDCA工作方法.ppt
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)