- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
类别数据分析第三讲
I.一般线性模型简介 (Generalized Linear Models 或 GLM)
一般线性模型GLMs 是将回归方程扩展到非常态分布或非线性的样本的一种统计方法。
● 一般线性模型GLMs的三个要素
■ 随机要素 (random component):假设被指定为应变量Y 的随机变量是属于某一种特定的概率分布型态 。
■ 系统要素(systematic component): 在方程式的右侧设定一组解释变量,属于线性的预测变量:
.
■ 连结函数(link function): 设定随机要素与系统要素之间的统计关系,也就是将 μ=E(Y) 透过方程式连结到解释变量上。
● 一般线性模型 GLMs 的某些特殊型态
■ 最小二乘法OLS模型
随机要素:常态分布与固定标准误的连续变量
连结函数:g(μ)= μ
■ logit 模型
随机要素:Y=1 or 0, 呈二项分布(binomial distribution).
系统要素:
连结函数:g(μ)=log [μ /(1- μ)] [logit]
■泊松回归模型(Poisson Regression)
随机要素:泊松分布(Poisson distribution)下的次数频率 (count frequency)
系统要素:
连结函数:g(μ)=log(μ)
在列联表( contingency tables)里的数据也是次数频率,因此, Loglinear 模型在一般线性模型GLMs的架构下,实际上是泊松回归的一种。
总之,一般线性模型GLMs 提供了一种包含了大多数连续与离散变量重要模型的统整模式。
● 最大可能性(似然)估计(Maximum Likelihood Estimation 或MLE)
此一估计所得的参数值与所观察到的数值最为一致:也就是说,运用最大似然法所估计出的参数发生的概率,将比其它的数字发生的概率更大。
步骤一:决定一个说明未知参数函数(likelihood function)。
步骤二:找出此一未知参数的观察值,使得此函数达到最大值。 (binomial formula)来计算十个被观察对象当中出现四位女性的概率。女性在总体当中出现的实际概率是?.
现在假设我们不知道总体当中的女性所占比例 (π ),但是我们的十个观察值当中确实有四位女性,我们由这个样本当中得到总体最可能的π ?
最大可能性估计MLE, 就是推估一个总体的参数值,来使得观察值最可能发生。
上述的似然函数就是:
数学上,我们希望找出的是参数值p 来达到这个似然函数L 的最大值,此时p即是 π的估计值。
在大样本的条件下,最大可能性的估计值会具有下列三个良好的统计性质 (变异的极小化minimum variance)
当样本数增加时,其统计偏误会不断缩小。
其分配型态渐近于随机抽样分布。
当总体属于随机分布时,对总体平均值的最大可能性估计即是样本的平均值,在满足此一条件 OLS 估计正等于是最大可能性估计MLE (Powers and Xie Appendix B)。
II. 二分法(Binary) Logit 模型
发生比Odds 与发生比率Odds Ratio (Agresti p.268-270):
在处理二分法的变量时,发生比Odds 就等于某事件发生的概率除以未发生的概率。
此处的 p 是指事件发生的概率, (1-p) 就是事件不发生或失败的概率。
因此,我们也可以用发生比Odds倒算出概率:
发生比 Odds 与概率 Probability 之间的关系
概率Probability 发生比Odds .10 .11 .25 .33 .50 1.00 .75 3.00 .90 9.00
发生比率(Odds ratio)是用来估计不同群体之间事件发生概率的相对比例。同一个事件的概率,
让我们参考实际的例子:1996年全国统计数据中有6090个有效样本,依据性别与党员资格来划分,可以得到下列的次数分配表:
. tab party sex
current |
party | sex of respondent
member? | Male Female | Total
++
Yes | 547 162 | 709
No | 2,541 2,840 | 5,381
++
Total | 3,088 3,002 | 6,090
男性成为党员的发生比是多少?
女性成为党员的发生比是多少?
男性对女性成
您可能关注的文档
最近下载
- DM.03 ×× U9 ERP项目-实施备忘-年月日.doc VIP
- DM.16.01 ××U9 ERP项目培训计划书.docx VIP
- DM.01 ×× U9 ERP项目-项目章程.pptx VIP
- 理论力学(第9版)(I)习题答案解析.pdf
- 公司片区经理竞聘演讲与公司物业半年工作总结合集.doc VIP
- DM.18 ×× U9 ERP项目-阶段汇报.pptx VIP
- 建筑结构抗震设计05(PPT81页).pptx VIP
- 【完整版】IATF16949-2016内审检查表(按过程方法编制).docx VIP
- 贸易公司的授信管理.pptx VIP
- 中国建筑第八工程局有限公司安全管理制度汇编 .doc VIP
原创力文档


文档评论(0)