- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
catmod
一、主要目的
PROC CATMOD程序 主要用来模式类别资料(categorical data),所采用的线性模型包括变异数分析模型、对数线性分析、逻辑回归(Logistic regression)分析,以及重复性测度的实验设计。它的原理是这样的,例如 Mij 表示在在第i个样本中,反应变量的值是第j个的个数,举例而言,如范例的表,我们有四组样本(年代及肤色有四种组合),而反映有三种(很好,普通及不好), M11在给定 所有M1j的和之下,? 是一个多项式分配(Multinomial Distribution),它的参数可能与解释变量有关(例如可能跟 年代或肤色相关), 在 PROC CATMOD? 中我们假设将参数作一个函数的转换后恰为解释变量的线性函数,那么到底不同年代或不同肤色会不会影响反应, 就变成了解释变量不同会不会改变多项式分配中的参数,也就变成了检定线性函数各解释变量的系数是否为0的问题.
在此我们的重点放在类别资料分析的对数线性分析(Log-linear model)。现假设我们有两组变量X和Y,且皆为离散型,其饱合模式(Saturated model)为:
我们可以使用最大概似法(Maximum likelihood)来估计上式中的参数,并找出其最适模型,而PROC CATMOD程序即可帮我们完成上述目的。
二、引用范例
为了说明PROC CATMOD程序在对数线性分析中如何使用,我们引用了一份资料,来自Stephen E. Fienberg所着之类别资料分析(The Analysis of Cross-Classified Categorical Data)中第76页,表3-16。在一项针对美国一处大城市所作的调查中,每位受访者都被问到以下的问题:目前进行中的广播网和电视网情形如何?表中的资料是根据受访者的肤色在各种反应情形下所作的分类,而且该题曾在不同的两个年代分别调查,结果如下:
原始资料 ? ? 反应 年代 肤色 很好 普通 不好 1959 黑 81 23 4 白 325 253 54 1971 黑 224 144 24 白 600 636 158 由此份资料看来我们想知道的是:目前的广播网和电视网是否在经过一段时间之后有明显的不同,及受访者的反应与年代是否有关?亦或与收听和收看的人种有关?或者时间和人种有交互关系?而我们可以建立的对数线性模型又为何?以下我们将使用PROC CATMOD程序来帮我们解答这一切的问题。
三、使用程序
首先我们将原始数据中的变量一些字母重新命名来代替:
1.年代以Y代表;其中1959以59代表、1971以71代表。
2.肤色以C代表;其中黑以B代表、白以W代表。
3.反应以R代表;其中很好以3代表、普通以2代表、不好以1代表。
4.每一格的数量则以COUNT代表。
上述的Y、C和R皆是以字符串方式表示,而COUNT是以数值方式表示。现将使用程序行于下(Catmod1.sas):
DATA A1;?INPUT Y $ C $ R $ COUNT @@;CARDS;59 B 3? 81 59 B 2? 23 59 B 1?? 459 W 3 325 59 W 2 253 59 W 1? 5471 B 3 224 71 B 2 144 71 B 1? 2471 W 3 600 71 W 2 636 71 W 1 158;RUN;DATA A2;PROC CATMOD DATA=A1;?WEIGHT COUNT;?MODEL Y*C*R=_RESPONSE_/ML PRED=FREQ;?LOGLIN Y|C|R;QUIT;RUN;
此段程序分成两部分:一是资料集A1,其目的是读入资料;另一是资料集A2,是以资料集A1来进行PROC CATMOD程序。以下我们只就第二部分的程序来进行解说。
四、程序解说及OUTPUT
PROC CATMOD DATA=A1;
此段叙述句是宣告PROC CATMOD程序的开始,以资料集A1进行分析。
WEIGHT COUNT;
此叙述句系指明COUNT的值即代表每一格的观测次数或是加权值,在此是代表观测次数。
MODEL Y*C*R=_RESPONSE_/ML PRED=FREQ;
在PROC CATMOD程序中一定要宣告一个MODEL指令,不可省略,也不可多于一个。MODEL指令中有许多的线性模型可供我们使用,在此我们只使用了对数线性模型,亦即在MODEL后输入:Y*C*R=_RESPONSE_,表示我们将进行一对数线性模型。而在 / 之后的选项串中,包括了许多的选项,现将常用的列于下:
1.ML:要求以最大概似法来估计参数。
2
原创力文档


文档评论(0)