广义线性模型课程设计技巧.doc

下载文档 降价啦

16
0
约3.14千字
约 10页
2016-12-10 发布于湖北
举报
版权申诉
保障服务

广义线性模型课程设计技巧.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

广义线性模型的拟似然法论文题目:Logistic模型在公共交通调查中的应用 Logistic模型在公共交通调查中的应用摘要广义线性模型是经典线性模型的自然推广。Logistic回归属于概率型非线性回归，是分析因变量为定性变量的常用统计分析方法．由于Logistic回归模型对数据的正态性、方差齐性以及自变量类型不做要求，并且具有系数的可解释性等优点，使得其在医学、社会学、经济学等领域得到了广泛的应用本文将广义线性模型的理论用于公共交通的社会调查的统计分析中，考虑工薪族群体的年龄、月收入、性别等三个可能的影响因素，运用logistic模型对工薪族群体出行上班方式的情况进行统计建模与分析，采用极大似然估计法对所建模型的参数进行估计，公共交通的路线及其他改进提供理论基础。．关键词：logistic模型公共交通广义线性模型 1、数据介绍：在一次关于公共交通的社会调查中，调查项目为“是乘坐公共汽车上下班，还是骑自行车上下班”。因变量y=1表示乘坐公共汽车，y=0表示骑自行车。自变量是年龄，作为连续变量；是月收入(元)；是性别，=1表示男性，=0表示女性。调查对象为工薪族群体，数据如表序号年龄月收入性别交通 y 1 18 850 0 0 2 21 1200 0 0 3 23 850 0 1 4 23 950 0 1 5 28 1200 0 1 6 31 850 0 0 7 36 1500 0 1 8 42 1000 0 1 9 46 950 0 1 10 48 1200 0 0 11 55 1800 0 1 12 56 2100 0 1 13 58 1800 0 1 14 18 850 1 0 15 20 1000 1 0 16 25 1200 1 0 17 27 1300 1 0 18 28 1500 1 0 19 30 950 1 1 20 32 1000 1 0 21 33 1800 1 0 22 33 1000 1 0 23 38 1200 1 0 24 41 1500 1 0 25 45 1800 1 1 26 48 1000 1 0 27 52 1500 1 1 28 56 1800 1 1 2、 Logistic模型简介主要应用在研究某些现象发生的概率，比如股票涨还是跌，公司成功或失败的概率，以及讨论概率与那些因素有关。显然作为概率值，一定有，因此很难用线性模型描述概率与自变量的关系，另外如果接近两个极端值，此时一般方法难以较好地反映p的微小变化。为此在构建与自变量关系的模型时，变换一下思路，不直接研究，而是研究的一个严格单调函数，并要求在接近两端值时对其微小变化很敏感。于是Logit变换被提出来：（1）其中当从时，从，这个变化范围在模型数据处理上带来很大的方便，解决了上述面临的难题。另外从函数的变形可得如下等价的公式：（2）模型(2)的基本要求是，因变量是个二元变量，仅取0或1两个值，而因变量取1的概率就是模型要研究的对象。而，其中表示影响的第个因素，它可以是定性变量也可以是定量变量，。为此模型(2)可以表述成：（3）显然，故上述模型表明是的线性函数。此时我们称满足上面条件的回归方程为Logistic线性回归。 Logistic线性回归的主要问题是不能用普通的回归方式来分析模型，一方面离散变量的误差形式服从伯努利分布而非正态分布，即没有正态性假设前提；二是二值变量方差不是常数，有异方差性。不同于多元线性回归的最小二乘估计法则(残差平方和最小)，Logistic变换的非线性特征采用极大似然估计的迭代方法寻求最佳的回归系数。极大似然估计理论代入,得则有； 3、程序运行结果及数据分析： sas运行给出了自变量进入模型的次序。先是截距项 Step 0。Step 1 x1第一个进入模型，附带了很多评估它对因变量预测能力的指标。-2 Log L 和评分用来检测自变量是否显著。-2 Log L 中的L 就是 Likelihood Ratio，它的 p 值是 0.0154，得分的p 值是 0.0140，都小于0.05，因此x1是一个很显著的解释变量。还有，AIC(Akaike Information Criterion)和 SC(Schwarz Criterion)两个信息量标准用来比较不同的模型，它们数值越小，模型变现就越好。接下来输出了step2 x3 变量进入模型后的情况。我们可