- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
列联表的对数线性模型
理堑/
壁窭对数线性模型
?孙凤
一
,问题的提出
我们在进行属性数据处理时,常常 运用列联表反映变量之间的联合分布. 当列联表中包含个变时,被称作二 维列联表;列联表中包含二个变量时, 则被称作二维列联表.__维或高维列联 表亦可称作多维列联表.
无论是简单的列联表还足复杂的列 联表,其中所自频数之间分布的关联都 町以分解为两种效应:一种反映了变量 自身的频数分布影响,称之为卞效应;另 一
种反映变量之间关联所产牛的效应, 称之为交互效应.对于两个属性变节构 成的频数列联表是一张二维列联表,其 主效应有两个,交效应只有一个.当变 最数增加时,交互的维数就会增加,相当 于多张=维列联表;同样当变鼍中的分 类数增加时,每一张?维列联表也会变 大.但是不论变_早=数怎样增加或变最中 的分类数怎样增加,仍然町以将整个频
数分布分解为主效臆和交互效应,只不 过两类效麻各自的项数有所增加而已, 尤其是交钉效应的项数会增加得更快. 常规频数表统计方法通常只分析I埘个变 量之间的联系,如受教育程度与生活满 意度的列联表,我们以直接从列联表 的分布中读取主效应和交互效应.然而, 进行多个变世的属性分析时,常规统 汁力法就尢法把握变量之间的关系了 在实际研究中,研究者通常采用一
次H分析两个变量之问的交且表,经过 多个两交互分析,氽图}=I}拼接成多个 分类变量之I1_lJ复杂关系的帑体.尽管这 种做法d土能得到?些信息,然而止如多 个简单同IJ]并能代替多元回归一样, 这种缺乏综合性的分析方式足不可能以 多个个另IJ分析叠加出整怵的多尤联系 的.特别足由于整个频数分布被分成多 张二维交互表,只能大致分析每一张二 维交互表的主效幢祠】交且效应,更多 变量之inI的联合交互效应(或岛阶交q 作)将无法分析,然而,正是联合交1f. 效嘘才真正反映变世之川的关联.IJ(】g— linear模犁是一种有效处理列联丧信息 I的统汁t万法,令文运用耍例埘该方法的由此uJ推算:
譬,和俭怯及常用F1J=点(2)的模型形式作一讨论.IH
二,L.gliar模型式(2)意味着任何单元格中的预期 l诎立性检验频数是由之相关的边际次数决定的. 首先以一个例子来理解议.logli一倘若HO为真,则表中的条件次数应是
模型的基本要素.表1是英国19721预期次数(1),但表中的实际次数却是f. 年的职业流动表,其中行变黄为父亲的这里我们把全部的f-F相加起来,取平 职业,列变量为儿子的职业.通过职业流方和,以避免正负值相互抵f肖的问题.× 动表我们町以J,解一个社会职业上下流越大,原似设正确的可能性越小,也即在 动的渠道是甭通畅,这也是考察礼会运I总体中RC越uf能是相关的,反之 1行机制足否正常的重要指标..I则反是.
我们以R表示行变量(父亲的职2.1oglinear模型的参数估计
业),C表示列变量(儿子的职).R的以组频数作为因变错,行和列的分 下标为i,j:1,2…I;C的下标为jj_l,2J类作虚拟自变龟所建立的回归模型即为 …
J.通常R代表解释变请,C代表结果jxII数线性回归模型,亦称泊松回力程: 1变量.c.代表第i行第J列的观察频数FlIlog(Fii)13o+13Rt+13R+.+B4c4
代表预期频数.所谓预期次数足指存总埘数线性模型有一套专用符号系 j体If1两个变情没有关系的前提下,表l统,上式可以表示为: 中每单元格所应有的次数10g(F?)=h+h,++(3) 独性检验统汁量为X2,对于二变其中Fii代表预期频数,i=1,2,……, 节总体来随,原假没是R-L.iC不相关;;j=1,2,……J.是总均值,是行边缘 备择假设足R与C相关,公式如下:l(r0wmargina1)效应,是列边缘(?l一 一,,
umnmargina1)效应,是行列交互作
x(1)用,交可作用反映的是行与列之间的相
自由度df_(I-1I)fJ一11关.
其巾f是实际7欠数,F是预期次数.{如何反映行边缘效应和列边缘效应{ 倘若R与c确实是不相关的,则由.个l及其交互作用呢?首先需要对变量进行i 随机样本中所得的条件次数,理应显示『虚拟化处理n对于对数线性模型,常常采 Rc足不相关的;也就是说F和F.用0总合限制,办称为方差编码,如B1十 所占的比例膻该相同,而I.12l和F所占p2=O,则p1-B2.如:
的比例也卡H同n邮:?.hill-?,.?,?.lIl:o
F
::—
;f+.n{有(卜1)个参数;有卜1个参
:岛:!数;,有(I一1)x(J-1)个参数
f+-nf.z这样我ffJ就可以运用(3)
I毫一——j:兰些堕查……——
式仙汁变,列变量交_
———
十]—_『T
文档评论(0)