分类数据分析(Analysis of nominal data)..pptVIP

分类数据分析(Analysis of nominal data)..ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类数据分析(Analysis of nominal data).

Analysis of nominal data 分类数据分析 报 告 人:王光宇 指导教师: 刘金兰 分类数据分析简介 分类数据也称名义数据,是社会科学研究的组成部分,其数据信息仅代表数据类别。例如种族,1=白种人,2=黄种人,3=黑人。 根据每个类别的数量,可以分析它们之间的关系。 分类数据的分析要求研究者应首先决定如何分类。 分类数据分析的应用范围 政治学领域:研究政治立场是否影响政治派别。 社会学和心理学领域:分析不同类别的人不同的心理特征。 公共政策分析领域:研究不同政策在不同地区产生的效果。 文化传播领域:研究人们对媒体的看法。 分类数据分析是社会科学中最重要的课题之一。一方面因为它的用途广泛,另一方面因为它解决的是基本问题 一些简单概念的解释 分类:最理想的分类是这些类别相互区别并且没有遗漏。统计过程中都假设分类是有意义的。 自变量和因变量:区别在于是否引起另外一个变量的变化。 取样:从总体抽取的简单随机样本。 符号:I、J表示表格的行数和列数,X、Y、Z表示变量。 表1:党派和立场间的关系 表2:受党派和地区影响的立场 表3:标准I×J表格 相关程度的测量 相关程度的测量方法是用一个系数来表示变量间的相关程度。 选择何种方法要考虑三个方面: 测量方法是否对称:是否可以确定自变量和因变量。 系数如何解释:取决于不同的测量方法制定的标准。 测量方法的敏感度:尽量使用敏感度较低的方法。 表5:完全相关的三种类型 干扰因素和解决办法 边际分布不均匀(如表6): 调整数据 将表格标准化 选择对边际总数不敏感的测量方法 行列不相等: 选择可以达到最大值的测量方法。 表6:不同边际分布,相同相关程度 2×2表格的测量方法 1、百分比法 2、差额比率法 3、Yule’s Q 4、Yule’s Y 5、 6、相关系数 百分比法 如果因变量在自变量的一个分类中的百分比发生了变化,那么这两个变量就是相关的;如果不发生变化,就是独立的。 百分比法的性质: 对因变量的边际总数不敏感。 需要较大的样本容量。 百分比法 差额比率法 差额比率法的性质 差额比率法的性质 差额比率的性质 差额比率的性质 差额比率的取值范围是从0到∞,等于1.0说明独立,小于1.0表示消极相关,大于1.0表示积极相关 差额比率对边际总数不敏感。 差额比率是对称的 差额比率在弱完全相关时就达到了最大值。 差额比率的方差 当样本容量大于25时,我们可以计算出差额比率的方差。 Yule’s Q Yule’s Q是差额比率的一个函数,定义如下: Yule’s Q的性质 因为Q是差额比率的一个函数,因此基本具有和差额比率相同的性质。 Q的取值范围是从-1.0到1.0,0说明独立。 Q在弱完全相关就取到最大值。 Q是对称的。 Yule’s Y Yule’s Y也是差额比率的一个简单函数,定义如下: 基于 的测量方法 相关系数 相关系数 的性质 I×J表格的测量方法 I×J表格的测量方法大致可以分成三类: 基于差额比率的方法 基于 的方法 错误减少比例方法(PRE) I×J表格中的差额比率法 I×J表格包含着t=(I-1)(J-1)个2×2表格 ,对于每一个2×2表格都可以计算出 和 。差额比率的基本形式是: 基于 的测量方法 几种 函数的模型 错误减少比例方法(PRE) 对于样本个体,我们可以在两种情况下预测:第一种情况,不知道样本在X中的类别;第二种情况,知道样本在X中的类别。 PRE就是比较两种情况下预测错误的比例。 PRE的性质 取值范围是从0到1.0。0说明独立,1.0说明完全相关。 PRE是不对称的,即需要区分自变量和因变量。 在样本高度不均匀时,会出现不独立但是结果为0的情况。 Goodman and Kruskal’s Lambda Goodman and Kruskal’s Lambda 根据PRE的原理,我们定义: Lambda的方差 Lambda的对称形式 最常见的方法就是将个体随机地对半分给X和Y。 第一种情况下,预测Y的正确率是 ,预测X的正确率是 ,错误率是 第二种情况下,预测Y的正确率是 ,预测X的正确率是 ,错误率是 Lambda的对称形式 那么错误降低比例就是: 经过整理后: Goodman和Kruskal’s Tau 表1:党派和立场间的关系 Tau方法的算例 第一种情况:1538人中,一共有

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档