定性数据分析实验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
定性数据分析实验 案例 据记载,1912年4月15日,泰坦尼克号船上有1316名乘客和892名船员共2208人。事故发生后幸存718人,约2/3的人在海难中丧生。2208人中,按性别划分,男性1738人,女性470人;按年龄划分,成人2099人,儿童109人;按所在舱位划分,一等舱325人,二等舱285人,三等舱706人,船员舱892人。在幸存的718人中,按性别划分,男性374人,女性344人;按年龄划分,成人661人,儿童57人;按所在舱位划分,一等舱203人,二等舱118人,三等舱178人,船员舱219人。 以上都是分类数据。数据是枯燥的,但讲述的问题却是鲜活的。 死亡与性别、年龄、所在仓位是否有关? 如何解释这些关系,与当时人们的价值观念和对待死亡的态度又有什么联系? 定性数据分析(内容) 探索性分析,目的是描述样本特征 列联表分析 关联性分析 推断分析,目的是对总体的认识 多项分布检验 列联表分析 独立性检验 一致性检验 拟合优度检验 关联性检验 建模分析,目的是解释总体中变量之间变化的一般规律 定性数据分析(方法) 描述性方法 参数检验方法 非参数检验方法 模型分析方法 定性数据的探索性分析 例子 问卷调查中常常设计对某问题两个或多个不同的特征的分类。例如房地产商考虑顾客选择房子设计的类型与职业的关系,所调查的每个顾客都有两个特性,一个是选择的房子类型,另一个是职业;广告公司为了调查城市和乡村的观众对电视广告的关注情况,每位被调查者都有两个特性,一个是来自城市还是乡村,另一个是对广告的态度。 在这些例子中我们通常关心的是按照两个特性进行的分类的方法之间是否相互依赖,或者说是否相互独立。如房地产商关心的是顾客选择房子的类型是否与职业无关,或者说选择何种房子与职业独立。在观众对电视广告的关注情况的调查中,感兴趣的是每个观众对电视广告的关注情况是否与他来自城市还是农村独立。 本单元的教学目的是提高定性数据的分析水平。 一、列联表及其结构 由两个以上的变量交叉分类形成的频数分布表 行变量放表的主词栏,列变量放表的宾词栏 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组合,所以称为列联表 一个 r 行 c 列的列联表称为 r ? c 列联表 列联表实例 一个集团公司在四个不同的地区设有分公司,现该集团公司欲进行一项改革,此项改革可能涉及到各分公司的利益,故采用抽样调查方式,从四个分公司共抽取420个样本单位(人),了解职工对此项改革的看法,调查结果如下表 列联表的结构 (2 ? 2 列联表) 列联表的结构 (r ? c 列联表的一般表示) 二、列联表的分布 观测值分布 观察值的期望值分布 观察值的分布 观察值的分布(图示) 百分比分布(概念要点) 条件频数反映了数据的分布,但不适合对比 为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布(概率分布) 行百分比:行的每一个观察频数除以相应的行合计数(fij / ri) 列百分比:列的每一个观察频数除以相应的列合计数( fij / cj ) 总百分比:每一个观察值除以观察值的总个数( fij / n ) 百分比分布(图示) 观察值的期望值分布 期望值的分布 观测值与期望值频数对比分布表 三、卡方统计量 单变量情形下,卡方统计量表达式 卡方统计量的特征 值大于0 密度函数与自由度有关 与横轴围成的面积等于1 ?? 统计量(例题分析) 三、卡方统计量的分布(K.P定理) 单变量情形 设总体中的每一个个体属于且只属于A1,A2,A3,? ? ? ,AK,k各类之一。总体中属于k 各类的比重分别为p1,p2,p3, ? ? ? ,pk。现从总体中随机抽查n个,其中属于Ai类有ni个(i=1,2,…,k)。定义统计量 则当n充分大时,该统计量服从自由度为k-1 的卡方分布。 多变量情形(列联表) 则当n充分大时,该统计量近似服从自由度为 (R-1)(C-1)的卡方分布。 列联表的自由度:(R-1)(C-1) 关联性的探索性分析(1) X与Y均为定类变量 ?相关系数 列联相关系数C Cramer的V系数 Lambda相关系数(Gutman预测系数) Tau-Y系数 2X2列联表 ?相关系数 专用于2X2列联表定类数据相关程度的测量 计算公式 取值范围: 局限 在RXC列联表上, ?相关系数值无上限,因为它的值随R或C的变大而增大 ? 相关系数(原理分析) 例1 在某校随机抽取200名大学生,其中,男生150人,女生50人,调查他们对实行一年三学期这一新学制的态度,调查结果整理为

文档评论(0)

1192212 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档