- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章逻辑斯蒂
第六章 逻辑斯蒂回归 Logistic回归模型 对列联表的分析,独立性检验可以初步了解属性之间是否相互独立,或是否相关;通过列联表的相合性检验,可以进一步知道属性之间的相合情况,包括方向和程度; Logistic模型可以更进一步拟合属性变量之间的函数关系,以描述变量之间的相互影响。 列联表中的数据是以概率的形式把属性变量联系起来的,而概率p的取值在0与1之间,因此,要把 概率 与 之间直接建立起函数关系是不合适的。即 Logistic回归模型 实践中, 通常随着 连续增长或连续下降,其直观的曲线形态是S型。 Logistic回归模型 因此,人们通常把p的某个函数f(p)假设为变量的函数形式,取 称之为logit函数,也叫逻辑斯蒂变换。 因此,逻辑斯蒂变换是取列联表中优势的对数。当概率在0-1取值时,Logit可以取任意实数,避免了线性概率模型的结构缺陷。 类似的处理还有probit变换和双对数变换。 其中probit变换是将概率变换为标准正态分布的 值,形式为: Logistic回归模型 双对数变换的形式为: 以上变换中以logit变换应最为广泛。 假设响应变量Y是二分变量,令 ,影响Y的因素有k个 ,则称: 为二分数据的逻辑斯蒂回归模型,简称逻辑斯蒂回归模型。其中的k个因素称为逻辑斯蒂回归模型的协变量。 Logistic回归模型 最重要的逻辑斯蒂回归模型是logistic线性回归模型,多元logit模型的形式为: 其中, 是待估参数。根据上式可以得到优势的值: 可以看出,参数 是控制其它 时 每增加一个单位对优势产生的乘积效应。 概率p的值: Logistic回归模型 最简单的logit线性模型为: 则优势为: 以上指数关系说明: 每增加1个单位,优势变为原来的 倍; 此时的概率应为: Logistic回归模型 多元logistic模型参数的估计 采用极大似然估计方法 假设n次观测中,对应 的观测有 个,其中观测值为1的有 个,观测值为0的有 个,则参数 的似然函数: 可以使用迭代法求出参数的ML估计 由于计算的复杂性,可以利用统计软件得到。 Logistic回归模型 【例6.1】一般认为,体质指数越大(BMI≥25),表示某人越肥胖。根据3983人的体检结果有388人肥胖,肥胖组中患心血管病的数据见表6.1,试建立体质指数与患心血管病概率的logistic回归模型。 【解】根据题目知道是一元逻辑斯蒂回归问题。运用统计软件可以对参数进行估计得到: 于是logit模型为: Logistic回归模型 由得到的模型可知, 患病概率为: 当体质指数BMI变化1单位时,对数优势比将增加0.2570,优势比将增加 即: 含有名义数据的logit 前例中的协变量为定量数据,logistic回归模型的协变量可以是定性名义数据。这就需要对名义数据进行赋值。 通常某个名义数据有k个状态,则定义个变量 代表前面的k-1状态,最后令k-1变量均为0或-1来代表第k个状态。 如婚姻状况有四种状态:未婚、有配偶、丧偶和离婚,则可以定义三个指示变量M1、M2、M3,用(1,0,0)、 (0,1,0) 、(0,0,1) 、(0,0,0)或(-1,-1,-1)来对以上四种状态赋值。 含有名义数据的logit 例:某地25岁及以上人中各类婚姻状况居民的死亡情况见表6.2,试建立死亡率关于年龄和婚姻状况的logit模型。 其中,A表示年龄,M1、M2、M3表示婚姻状况 于是,估计的logit方程为: 含有有序数据的logit Logit模型的协变量也可以是有序数据 对有序数据的赋值可以按顺序用数0,1,2,3,4分别表示 【例5.8】某地某年各类文化程度的死亡人数见表5.33,试建立logit模型。 建立死亡率关于年龄和文化程度的logit模型 其中A为年龄,E为文化程度 含有有序数据的logit 于是,估计的logit方程为: 其中,年龄的系数0.124,说明年龄越大死亡率会越高; 文化程度的系数-0.164,说明文化程度与死亡率呈负相关,文化程度越高,死亡率越低。 Logistic回归的推断 效应的置信区间 指的是参数的置信区间估计 一般可以采用 的区间形式 通过上述区间端点的指数变换得到
您可能关注的文档
最近下载
- 2024年春学期部编版小学语文五年级下册教学计划附教学进度表精华版.pdf VIP
- 多因子选股系列研究之十八:成交量激增与骤降时刻的对称性与“一视同仁”因子构建.pdf
- 欣赏《月光》 示范课教学课件【人音版九年级音乐下册】.pptx
- 《眼镜镜片防雾性能测试规范(报批稿)》.pdf
- 2025年党组理论学习中心组学习计划文稿3篇.docx VIP
- 初中英语课外阅读黑布林版时光隧道中文译文.docx
- 2024年宁波象山县水务集团有限公司招聘笔试真题.docx VIP
- 经典童话故事英文绘本-灰姑娘.ppt
- 南通科技职业学院2024年提前招生校测样卷及答案(含语文、数学).pdf VIP
- 《元宵节》优质PPT课件.ppt
文档评论(0)