- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
阮敬博⼠
⾸都经济贸易⼤学研究⽣院副院⻓
⾸都经济贸易⼤学统计学院教授
©ruanjing@
列联分析与对应分析
•⼈们在研究某⼀个事物或现象的过程中,有些时候不仅只会考察单独某⼀个⽅⾯的信息,
也可以把⼏个⽅⾯的信息联合起来⼀并考察。如考察某项政策实施之后⼴⼤市⺠对该政策
的⺠意反映,可以⽤单独⼀个⺠意指标“满意状况”来考察。如果把性别指标⼀并联合起
来,考察不同性别⼈群对该项政策的满意状况,这就是⽤两个指标来衡量同⼀个事物,这
两个指标的不同表现可以通过交叉的⽅式形成若⼲种状况,如男性对该项政策的满意状况、
⼥性对该项政策的不满意状况等,把性别和满意状况这两个变量交叉联合起来,共同对所
研究的问题展开研究,这个过程就叫做“交叉分析”。本章将要讲述的列联分析和对应分析
就是交叉分析的两种典型形式。
列联分析—列联表
列联分析—列联表
•列联表⾏变量的⽔平个数⼀般⽤R表示,列变量⽔平的个数⼀般⽤C表示,那么⼀个R⾏C列的频数分布表叫
做R×C列联表,如表15-2所示。
表15-2R×C列联表
•R×C列联表中各元素fij就是⾏列变量进⾏交叉分类得到的观测值个数所形成的频数分布,⾏合计表示⾏变量每
个⽔平在列变量不同⽔平交叉分类的观测值总数;列合计表示列变量每个⽔平在⾏变量不同⽔平交叉分类的观测
值总数;⾏合计加总应当等于列合计加总,记为总计频数。
列联分析—列联表
•例15-1:某单位欲推⾏⼀套新的⼯资改⾰⽅案,为了考查该⽅案的合理性,提⾼改⾰⽅案在公司各部⻔推⾏之后
的实际效果,特抽查了市场部、客户服务部、发展战略部、综合部、研发中⼼等5个部⻔共220名员⼯了解对该
套⼯资改⾰⽅案的态度,以该例数据编制的列联表如表15-3所示。
•SAS系统中有两种数据预处理⽅式可以输出列联表:
•第1种数据预处理⽅式就是以原始调查数据作为数据集,然后利⽤前⾯章节介绍过的FREQ过程(详⻅第6.2.2
节)制表得到列联表;第2种数据预处理⽅式是输⼊形如表15-3所示的交叉分组数据,仍然利⽤FREQ过程,并
在FREQ过程中通过WEIGHT语句指定交叉分组频数作为权数,也可得到列联表。
列联分析—列联表
•第1种数据预处理⽅式的具体数据格式如图15-1所
示。
•本例所使⽤的数据值标签如下:
procformat;
valuedepartment_fmt1=发展战略部
2=客户服务部
3=市场部
4=研发中⼼
5=综合部;
valueattitude_fmt1=⽀持
2=反对;
run;
列联分析—列联表
•根据第6章中介绍过的内容,使⽤FREQ过程编制
最为常⻅的⼆维列联表的程序如下:
procfreqdata=sasuser.salary_reform;
tableattitude*department;
formatattitudeattitude_fmt.departmentdepartment_fmt.;
run;
•程序运⾏之后,可得到如图15-2所示的结果。
•图15-2中的表格⼀共有四⾏数字,表格的左上⻆标
注了每⾏数字所代表的意思。第1⾏表示交叉分类的
频数(Frequency),依次往下分别是百分⽐
(Percent,单位100%)、⾏百分⽐(Row
Pct)、列百分⽐(ColPct)。
列联分析—列联表
•第2种数据预处理格式如图15-3所
文档评论(0)