对数线性模型剖析课件.pptVIP

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

一、对数线性模型简介?、对数线性模型基本思想?对数线性模型分析是把列联表资料的网格频数的对数表示为各变量及其交互效应的线性模型,然后运用类似方差分析的基本思想,以及逻辑变换来检验各变量及其交互效应的作用大小

方法分析定类变量和定类分析尺度变量(也可综合运用方差分析和引入类别变量)与二逻辑回归中的建模方分类别变量之间的因法,应用于纯粹定类变量之间,系统评价各变量间关系和交互作用大小的多元统计方法不需要确定因变量和解决了对混杂变量的可以直接分析各种类自变量。但是,卡方控制的问题,而且,型的分类变量,对于检验对三维和三维以它能将因变量与自变名义变量,也不需要上列联表资料的分析量的关系用模型表示事先建立哑变量,可有一定困难,即对混出来,清晰易理解。以直接分析变量的主但是,当模型中效应和交互效应。对自变量较多,特别是数线性模型不仅可以名义变量较多,或名解决卡方分析中常遇义变量的类别较多时,到的高维列联表的“压分析自变量之间的交缩”问题,又可以解决互效应就很繁杂,可logistic回归分析中多能需要建立很多哑变个自变量的交互效应量问题

?双向无序列联表;?单向有序列联表;

?可以快速准确进行判断

4、列联表的劣势:对于多关系变量(两个以上)研究:不能被清晰解读?失去了对多变量之间的交互联系的分析?进行两变量间关联分析时缺乏统计控制?不能准确定量描述一个变量对另一个变量的作用幅度

5、对数线性模型:多维度列联表解决之道,以及模型自身特点?饱和性:将多元频数分布分解成具体的各项主效应和各项交互效应,以及高阶效应,不会漏项。(饱和模型与不饱和模型)?定量性:以发生比的形式来表示自变量的类型不同反映在因变量频数分布上的差异。?可检验性:不仅可以对所有参数估计进行检验,使抽样数据可以推论总体,且能够通过不同模型的统计检验结果,对备选模型进行筛选和评价,进而确定具有最大解释能力且最简单的模型。?消除抽样波动所带来的明显的不规则性

6、对数线性模型的缺点?对数线性模型更强调的是变量之间的交互效应,它不能直接将因变量用自变量的函数表示出来。?对数线性模型抽象复杂,特别是高维模型,不如线性回归模型易理解

二、对数线性模型的基本原理?1、与方差分析相关的?在多元方差分析中,以二元方差为例:每一个观测值y=μ+A的效果+B的效果+(AB)交互作用+?ijijijij

?比数比是对数线性模型的基础,而比数比又是由比数计算而来。那么什么叫做比数呢?比数是一个事件发生的概率与其不发生概率之比,测量了一个事件发生的可能性。这个数值越高说明结果2相对于结果1发生的可能性就越高。

?F代表某模型f的期望值,令π代表与单元格(i,j)有ijij?上表可转化为

??1=π/π??2=π/π?同理我们可以测量两个两个类别间的比值,称作比数比。??=?1/?2=ππ/ππ=FF/FF一个大于122211221的比数比意味着行变量和列变量的第二个(或者第一个)

?比数比的不变性,不随1)总样本量2)行边缘分布3)列边缘分布的变化而变化。所以,只要关心比数比的估值,那么适用于简单随机样本的最大似然估计就可以被直接应用到分层样本中了。

3、与逻辑变换有关的:对数线性模型的出现?令R表示行,C表示列,f表示第i行第j列的观测频次。ijij?F=??RijijRC边缘效应,?RC代表R与C的二维交互效应,而交互效应实质上测量的就是R与C之间的比数比,当?RCij=1的时候就是我们熟悉的独立模型。?相乘形式的不好计算,我们将其取对数

?上两式的数学变换使各种效应项相乘的关系被转换成相加的关系,使各项效应独立化了。

?对数线性模型有一个限制条件:如果每项效应中只有一类的参数未知,那么可以由已知参数推算出来。

?通过上组式子,我们可以计算出线性模型等式右侧的所有参数值。?A因素效应是行平均值与总平均值之差?B因素效应是列平均值与总平均值之差?交互效应计算结果表示在除去所有其他分布效应之后两个因素之间的净关联。

?常数项只受样本规模和交互单元数的影响;?主效应项反映的是各因素内部类别频数分布的特征,是在总平均频数基础上的“补差”;?如果模型中所有交互效应都等于0,我们将会看到虽然每行(列)频数不同,但行(列)频数分布比例却是相同的,都等于原来分类变量的类别分布比例。

?泊松分布?多项分布?所以我们不能直接应用最小二乘法对模型、总体、参数进行估计,但幸运的是,三个抽样模型下的极大似然估计是等同的。但是可以通过迭代再加权最小二乘法,可是运算起来比较繁琐。

?参数估计通俗的来讲:根据抽样结果来合理地、科学的猜测一下总体的参数大概是什么?

您可能关注的文档

文档评论(0)

134****3971 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档