- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第12章定性资料的统计解析
第十二章 定性资料的统计分析 第一节 定性变量数量化 在实际研究问题时,往往会涉及到定性变量(如名义尺度变量),如性别、职业等,这些变量只有各种状态的区别,而没有数量上的区别。定性变量不进入数学关系式,就会丢失信息;若要进入,又难以直接加以运算,从20世纪50年代开始发展了数量化理论。 如何对定性变量给以相应的数量描述,从而进行数量化分析,是数量化理论所研究的主要内容。 例如:定性变量是性别,记为X,则: 这种赋值并没有任何数量大小的意义,它仅仅用于说明观察单位的特征或属性,因此,不同特征或属性的观察单位应取不同的值。 又如:天气可取晴、阴、雨三类,则用两个变量表示天气: * * 推广:若某定性变量可取K类,则用K-1个变量表示,其赋值方法为: 第二节 列关联表 在实际工作中,人们常常用列联表的形式来描述属性变量(顺序尺度或名义尺度)的各种状态或相关关系。这在某些调查研究项目中运用得最为普遍。 例如:要研究吸烟与患肺癌的关系:用A表示一个人是否患肺癌,用B表示一个人是否抽烟 合计 患癌症 未患癌症 合计 吸烟 不吸烟 A B 如果两个定性变量分别要考察n和p个,则相应的列联表为n×p表 合计 A1 A2 … An 合计 B1 B2 … Bp A B 为了更为方便地表示各频数之间的关系,将列关联表中的每一个元素 都除以元素的总和n,令 得到频率意义上的列联表。 1 合计 A1 A2 … An 合计 B1 B2 … Bp A B 另 根据上表, 对于研究对象的总体,频率意义上的列联表中的元素有概率的意义, 是特性A第i状况与特性B第j状况出现的概率,而 与 表示边缘概率。考察各种特性之间的相关关系,就可以通过研究各种状况出现的概率入手。如果特性A与特性B之间是相互独立的,则对任意的i与j,有下式成立: 即如果特性A与特性B之间相互独立的话,特性A第i状况和特性B第j状况出现的概率应等于总体中第i状况出现的概率乘以第j状况出现的概率。 令 表示由样本数据得到的特性A第i状况和特性B第j状况出现的期望概率的估计值,我们可以通过研究特性A第i状况和特性B第j状况出现的实际概率 与 的差别大小来判断特性A与特性B是否独立。 如何判断属性变量是否独立?可用皮尔逊拟合优度 检验。 :属性变量A与B相互独立 若 与 的差距大,表明 为真的可能性越小 给出显著性水平,查找出临界值,可获得其拒绝域。 例:某企业想了解顾客对其产品是否满意,同时还想了解不同收入的人群对其产品的满意程度是否相同,在随机发放的1000份问卷中收回有效问卷792份,收入高低和满意回答的交叉数据如下: 792 194 598 合计 91 542 159 38 108 48 53 434 111 高收入 中等收入 低收入 合计 不满意 满意 概率意义的列联表 1 0.244949 0.755051 合计 0.200758 0.060606 0.140152 低收入 0.684343 0.136364 0.54798 中等收入 0.114899 0.04798 0.066919 高收入 合计 不满意 满意 自由度为(3-1)(2-1)=2 给定显著性水平0.05,自由度为2,查 分布表得临界值为5.991, 所以,认为收入高低和对产品的满意度是有关联的。 第三节 对数线性模型 列联表分析无法系统地评价变量间的关系,也无法估计变量间交叉作用的大小,而对数线性模型是处理这些问题的最佳方法。 对数线性模型有很多种类,常用的模型有:饱和型(当变量间相互不独立时),非饱和型(变量间相互独立)等。 下面从2×2的交叉列联表的频数表与概率表出发,介绍对数线性模型的基本理论和方法。 频数表 合计 A1 A2 合计 B1 B2 A B 1 合计 A1 A2 合计 B1
文档评论(0)