43(基本统计)要点.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
43(基本统计)要点.ppt

数据的类型与列联分析 定性数据 定性变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用定类或定序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对定性数据的描述和分析通常使用列联表 可使用???检验 列联表 (例题分析) 列联表 (contingency table) 列联表按多个(两个或两个以上)变量的不同取值对不同情形进行划分,也即划分不同的行或列。用以分行的变量称为行(row)变量,和用以分列的变量则称为列(column)变量。 表格中间各行变量和列变量不同取值的交汇处,就是这种情形出现的频数或计数(count)。 列联表中行变量和列变量的个数称为列联表的维数。 二维的列联表又称为交叉表(cross table)。 三维或三维以上的列联表叫做高维列联表。 列联表 (contingency table) 列联表中每个行变量或列变量又有两个或更多的不同取值,这些取值常称为水平(level)。每一种不同的水平组合就代表一种不同的情形。 列联表的结构 (2 ? 2 列联表) 列联表的结构 (r ? c 列联表的一般表示) 关于某项政策调查的结果 观察值的分布 边缘分布 行边缘分布 行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人 列边缘分布 列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为100人,120人,90人,110人 条件分布与条件频数 变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布 每个具体的观察值称为条件频数 观察值的分布 (图示) 百分比分布 (概念要点) 条件频数反映了数据的分布,但不适合对比 为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布 行百分比:行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比:列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n ) 期望频数的分布 假定行变量和列变量是独立的 一个实际频数 fij 的期望频数 eij ,是总频数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即 ?? 统计量 用于检验列联表中变量间拟合优度和独立性 用于测定两个分类变量之间的相关程度 计算公式为 ? 相关系数 (correlation coefficient) 测度2?2列联表中数据相关程度 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 列联相关系数 (coefficient of contingency) 用于测度大于2?2列联表中数据的相关程度 计算公式为 V 相关系数 (V correlation coefficient) 计算公式为 ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 操作步骤 按Analyze--Descriptive Statistics--Crosstabs 顺序打开 Crosstabs 主对话框。 实例分析 CROSSTABS /TABLES=a13 BY a14 /FORMAT= AVALUE TABLES /CELLS= COUNT /COUNT ROUND CELL . 对居民储蓄调查数据.sav建立列联表,分析户口和职业的关系 为了探讨吸烟与慢性支气管炎有无关 系,调查了339人,情况如下: (数据为:吸烟与支气管炎.sav) 121 13 不吸烟 162 43 吸烟 未患慢性支气管炎 患慢性支气管炎 实例分析 在Data菜单中选Weight Cases…项,打开Weight Cases对话框。 Weight Cases by,再将变量x3选入Frequence Variable 框,单击OK完成加权。 按Analyze--Descriptive Statistics--Crootabs 顺序打开 Crootabs 主对话框。将x1变量 选入Row框作为行变量,将x2变量 选入Column 框作为列变量。 打开Statistics对话框,选中Chi-square、Contingency coefficient和Phi and Cramer’sV复选框,单击Continue返回。 单击Cell按钮,打开Cell display对话框,选中observed和Expected 复选框,单击Continue返回;单击OK。 1 操作步骤: 实例分析 统计摘要

文档评论(0)

三沙市的姑娘 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档