spss教程_4-3(基本统计分析).pptVIP

下载本文档

8
0
约 42页
2015-09-12 发布于广东
举报
版权申诉

spss教程_4-3(基本统计分析).ppt

1、本文档共42页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

spss教程_4-3(基本统计分析),spss统计分析基础教程,spss统计分析高级教程,spss统计分析教程,spss统计分析实用教程,spss11统计分析教程,spss11.0统计分析教程,spss基本统计分析,spss数据分析教程,spss回归分析教程

数据的类型与列联分析定性数据定性变量的结果表现为类别例如：性别 (男, 女) 各类别用符号或数字代码来测度使用定类或定序尺度你吸烟吗? 1.是；2.否你赞成还是反对这一改革方案? 1.赞成；2.反对对定性数据的描述和分析通常使用列联表可使用???检验列联表(例题分析) 列联表(contingency table) 列联表按多个(两个或两个以上)变量的不同取值对不同情形进行划分，也即划分不同的行或列。用以分行的变量称为行(row)变量，和用以分列的变量则称为列(column)变量。表格中间各行变量和列变量不同取值的交汇处，就是这种情形出现的频数或计数(count)。列联表中行变量和列变量的个数称为列联表的维数。二维的列联表又称为交叉表(cross table)。三维或三维以上的列联表叫做高维列联表。列联表(contingency table) 列联表中每个行变量或列变量又有两个或更多的不同取值，这些取值常称为水平(level)。每一种不同的水平组合就代表一种不同的情形。列联表的结构(2 ? 2 列联表) 列联表的结构(r ? c 列联表的一般表示) 关于某项政策调查的结果 ?? 统计量用于检验列联表中变量间拟合优度和独立性用于测定两个分类变量之间的相关程度计算公式为 ? 相关系数(correlation coefficient) 测度2?2列联表中数据相关程度对于2?2 列联表，? 系数的值在0～1之间 ? 相关系数计算公式为列联相关系数(coefficient of contingency) 用于测度大于2?2列联表中数据的相关程度计算公式为 V 相关系数(V correlation coefficient) 计算公式为操作步骤按Analyze--Descriptive Statistics--Crosstabs 顺序打开 Crosstabs 主对话框。观察值的分布边缘分布行边缘分布行观察值的合计数的分布例如，赞成改革方案的共有279人，反对改革方案的141人列边缘分布列观察值的合计数的分布例如，四个分公司接受调查的人数分别为100人，120人，90人，110人条件分布与条件频数变量 X 条件下变量 Y 的分布，或在变量 Y 条件下变量 X 的分布每个具体的观察值称为条件频数观察值的分布(图示) 百分比分布(概念要点) 条件频数反映了数据的分布，但不适合对比为在相同的基数上进行比较，可以计算相应的百分比，称为百分比分布行百分比：行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比：列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比：每一个观察值除以观察值的总个数( fij / n ) 期望频数的分布假定行变量和列变量是独立的一个实际频数 fij 的期望频数 eij ，是总频数的个数 n 乘以该实际频数 fij 落入第 i 行和第j列的概率，即 ?、C、V 的比较同一个列联表，?、C、V 的结果会不同不同的列联表，?、C、V 的结果也不同在对不同列联表变量之间的相关程度进行比较时，不同列联表中的行与行、列与列的个数要相同，并且采用同一种系数表4-19是统计摘要表，列出观测量有效值个数、缺失值个数和总的个数。从表4-20列联表中可看出，吸烟人中患病者有43人，比期望值33.9大，不吸烟人中患病者只有13人，比期望值22.1小。输出结果如表4—19：表4—19 吸烟与患病统计摘要表 2、输出结果及分析表4-20 吸烟与患病列联表表4-21 卡方检验表4-21是卡方检验表，从表4-21中可看出，Chi-Square值为7.469，显著值为0.0060.05，应否定零假设，即认为吸烟与患慢性支气管炎是不独立的。由于使用卡方检验要求每个单元格频数不少于5，当条件不满足时，还可用Fisher精确检验。其双侧检验显著值为0.007。表4－22是对称性测量表，变量间相关关系弱, 不应拒绝原假设表4－22 对称性检验表 420 141 279 合计 110 90 120 100 合计 33 57 三分公司 31 75 32 反对该方案 79 四分公司 75 二分公司一分公司 68 赞成该方案行边缘分布列边缘分布条件频数 1: 居民储蓄调查数据分析储户存(取)款金额的基本描述统计量, 并对城市储户和农村储户进行比较. 使用时，直接删除本页！精品课件，你值得拥有！精品课件，你值得拥有！使用时，直接删除本页！精品课件，你值得