广义线性模型(一).pptVIP

下载本文档

118
0
约2.56千字
约 30页
2017-05-05 发布于天津
举报
版权申诉

广义线性模型(一).ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

广义线性模型(一).ppt

广义线性模型(一) 陈希孺数理统计与管理　　21 卷　5 期　2002 年9 月广义线性模型是常见的正态线性模型的直接推广适用于连续数据和离散数据,特别是后者,如属性数据,计数数据在实用上,尤其是生物,医学和经济、社会数据的统计分析上,有重要的意义简介 Fisher 在1919 年曾用过它。 Logistic 模型,在20 世纪四五十年代曾由Berkson ,Dyke 和Patterson 等人使用过。 1972 年Nelder 和Wedderburn 在一篇论文中引进广义线性模型一词,自那前后以来研究工作逐渐增加 1983 年McCullagh 和Nelder 出版了系统论述此专题的专著并于1989 年再版起源 L. Fahrmeir 等《Multivariate Statistical Modeling Based on Generalized Linear Models》,Springer ,1994 及McCullagh 等的《Generalized Linear Models》,1989 年第2 版,Chapman Hill 。 L. Fahrmeir 等: Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models Ann. Statist ,1985 ,342 —368 。主要参考资料 §1. 1 　一维广义线性回归 (一) 定义设有因变量Y ,自变量x 。Y 为一维, x 一般为多维第一部分　建模 E( Y) =μ= z′( x)β(线性,线性指对β,非X) , z ( x) 为x 的已知(向量) 函数, z′表示转置(本讲义中“′”都表示转置,不是导数) , z′( x) 常简记为z′。 x , z ( x) , Y 都是取连续值的变量,如农作物的产量,人的身高体重之类。 Y 的分布为正态,或接近正态之分布。通常的线性回归 E( Y) =μ= h ( z′β) , h 为一严格单调,充分光滑的函数。h 已知, g = h - 1 ( h 的反函数) 称为联系函数(link function) 。有g (μ) = z′β。 x , z ( x) , Y 可取连续或离散值,且在应用上更多见的情况为离散值,如{0 , 1} ,{0 , 1 ,2 ⋯⋯}等例如, x 为1 维, z ( x) 可以是(1 , x) , (1 , x , x2) , (1 , ex) 等。若x = ( x1 , x2)′, z ( x) 可以是 (1 , x1 , x 2)′, (1 , x1 , x2 , x21, x22, x 1 x2) 等。广义线性回归从以下几方面推广: 3. Y 的分布属于指数型,正态是其一特例。这里考虑的Y 为一维,故属于一维指数型。其形式为: c ( y) exp (θy - b (θ) ) dμ( y) ,θ ∈Θ (参数空间) θ为参数,称为自然参数。b (θ) 为θ的已知函数。μ为一测度(不一定是概率测度) ,常见的有两种可能: a. 当Y 为连续变量时, dμ( y) 为Lebesgue 测度: dμ( y) = dy ; b. 当Y 为离散变量时, Y 取有限个值a1 , ⋯, am 或可列个值a1 , a2 , ⋯,这时μ({ ai} ) = 1 , i = 1 , ⋯, m ;或μ({ ai} ) = 1 , i = 1 ,2 ⋯ 因为两边对θ求导,有例1. 1 研究一些因素(自变量) 对“剖腹产后是否有感染”的影响。此例中z 就取为x ,引进记号 x = ( x1 , x2)′: 例1. 2 研究两种化学物质TNF 与IFN 对引发细胞癌变的影响。采用Gamma (Γ) 分布去描述: Y有密度例1. 3 　Y 是某种极值(水文、地震、材料断裂强度之类) 当Y 为1 维时,只能有1 个未知参数(此例中为μ) 。若有多个参数,剩下的为冗余,它必须已知或可由样本估计,即以估计值为已知值。在各次观察中冗余参数不变。如在此例中,相应yi 的μ值可变,为μi (与此相应,θ值则为θi = - v/μi ) ,但v 则不随i 变化。提醒两点在有些实际问题中,数据显示均值方差之间的关系不符合(1. 20) 。这时就不可能使用单参指数族的模型。在Γ和正态分布的例中包含了一个冗余参数,调整它的值有时可以解决上述问题。两点注意: 设有一个因素(自变量之一) 有k 个“状态”,我们固然可以用数字1 , ⋯,k 来标识它,但不可用于计算,因为它们无数量意义。例如农业试验中,品种是一个因素。有k 类种子,解决的