九讲属性数据列联表.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
九讲属性数据列联表

属性数据分析 属性数据分析 为了某种目的通过调查表进行社会调查得到的数据——调查数据,一般都是属性数据.即在许多调查研究中,所得到的信息是样本中个体的分类,而不是定量变量的值. 例如:在某次调查中,根据人们的性别、对颜色的喜好等,将他们分类. 在某次政府调查中,根据公司的产品类型、公司的所在地区、及产品是否出口,将这些公司分为不同组. 属性数据分析 在市场研究中,为了了解一种新产品的吸引力,根据顾客是否已看到这种新产品的广告及是否已购买该厂新产品,将顾客分为不同组. 这种类型的数据可以方便地汇总在一张表格中,用来表示每个组中的观测个数. 一、属性数据 1. 变量的类型 根据变量的取值情况可以分为以下几种: (1)名义变量 变量值是几个没有次序之分的不同状态,它给变量值赋予名称.例如,性别就是一个名义变量,用“男”和“女”作为其取值.也可以用“1”和“2”代表取值,但这二个数字只是取值的名称,它们在数值上没有任何意义. 人们驾驶的汽车类型也是名义变量的例子,可以把“Toyota”,“Chevrolet”,“Volkswagens”等作为变量值的代码;也可以用“1”代表Toyota牌,“2”代表Chevrolets牌, “3”代表Volkswagens牌等等. 但是这些数字除了把该变量的一个值与一个名称联系起来之外没有任何其他的意义.还有职业、血型、是否患病、喜爱的颜色等等都是名义变量. (2)有序变量 变量值是有严格次序的不同状态.例如民意测验中常用到以下取值的有序尺度:坚决拥护、拥护、弃权、反对、坚决反对,比如:“我认为新的税法比老税法有改进”的一种陈述,要求在有序尺度中选择代表自己意见的回答.又如按治疗效果,把病人分为治愈(1)、显效(2)、好转(3)、无效(4)等四类.把产品按质量分为:不好、一般、好、很好.文化程度分为高、中、低等.在以上几个例子中,变量的取值有内在的顺序. 同名义数据一样,你可以给这些值赋予不同数字,而你赋给变量的具体数字并不重要,但规定的这些数字与取值顺序必须相匹配.对于治疗效果的例子,既可以规定变量值为1,2,3和4,也可以规定为1,10,20和100. 如果选择的分析方法适用于该变量,那么该方法只依赖变量值的 顺序而与变量的数值无关. (3)区间变量(或间隔变量) 区间变量是有顺序大小的数值变量,且数值间的差值是有意义的. 例如考虑温度,40度比10度热30度,而40度和10度是相对于人们取定的0度而言的.这类变量对减法:两值之差是有意义的; 但对两值的比率是没有意义的。 例如由40/10=4,而认为40度比10度热3倍的说法是不合适的. 区间变量与有序变量相对比,有序变量值之差是没有什么意义,如治疗效果是有序变量,2和1之间的差与3和2之间的差不具有同样的意义. (4)比率变量(或比例变量) 比率变量也是数值变量,不仅数值之差有意义,而且要求有绝对的零点,两数值的比率也是很重要.例如,金子的重量就是一个比率变量;还有食物中的卡路里数也是比率变量,含有2000卡路里的食物是含有1000卡路里的食物的两倍;与温度相比较,我们不能说40度是20度的两倍,因为温度的0度只是一个任选的参考点. 以上这四类变量中,名义变量和有序变量也称为属性变量(或定性变量),有时也称为离散变量;而区间变量和比率变量称为定量变量,有时也称为连续变量. 2.属性数据 来自社会调查、医学、心理学等领域中,由属性变量得到的数据都是属性数据.例如问卷调查结果的分析,医药和流行病研究资料的分析等,都是对属性数据进行分析. 属性数据一般都是汇总为表格(即列联表)后再进一步地进行分析. 在方差分析和回归分析中,研究因变量与一些自变量的相关关系. 在方差分析中,自变量就是属性变量,它们都只取几个离散的值. 在回归分析中,自变量是连续变量.但方差分析和回归分析中的因变量都必须是连续变量。 当我们研究的指标是一个属性变量,并希望用其他变量来说明或预测这个属性变量的取值时,不管用以说明的变量是属性的或连续的,使用的统计方法统称为属性数据分析,所以属性数据分析是一种有着广泛实际应用的统计方法. 对属性数据进行分析,将达到以下几方面的目的: (1)产生汇总分类数据——列联表; (2)检验属性变量间的独立性(无关联性); (3)计算属性变量间的关联性统计量; (4)对高维数据进行分层分析和建模. 第九讲 列联表、c2检验和对数线性模型 例1 下面是对123人进行关于某项政策调查所得结果的一个简单的三维表,它显示了人们的收入和性别对该项政策的观点。 下表表示不同收入和不同性别人群对某项政策的观点。 三维列联表 (关于某项政策调查所得结果) 列联表 前面就是一个所谓的三维列联表(contingency table). 这些变量中每个都有两个

文档评论(0)

junzilan11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档