第15章 Probit回归(概率单位回归).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第15章 Probit回归(概率单位回归)

多元回归中的几种重要模型 第一部分:多重共线情况的处理 第10章 岭回归分析( Ridge Regression ) 第二部分:自变量中含定性变量的处理 第11章 自变量中含有定性变量的回归分析 第三部分:因变量中含有定性变量情况的处理 第12章 二项Logistic回归 第13章 多项Logistic回归 第14章 有序回归(等级回归分析) 第15章 Probit回归(概率单位回归) 第16章 最佳尺度回归 Logistic回归 第15章 Probit回归(概率单位回归) 15.1 Probit回归的基本原理 15.2 Probit回归的案例分析 15.1 Probit回归的基本原理 Probit回归即概率单位回归,主要用来测试分析刺激强度与反应比例之间关系的关系。例如,对于指定数量的病人,分析他们的给药剂量与治愈比例之间的关系。此方法应用的典型例子是分析杀虫剂浓度和杀死害虫数量之间的关系,并据此判断什么样的剂量浓度是最佳的。 Probit回归适用于对反应变量(因变量)为分类变量的资料进行统计分析,也存在反应变量为二分类、有序多分类、无序多分类三种情况,但目前最常用的是二分类的情形, SPSS 也仅能处理反应变量为二分类的资料。 15.1 Probit回归的基本原理 Probit回归与Logistic回归相似,也是拟合0-1型因变量回归的方法,即把取值分布在实数范围内的变量通过累积概率函数转换成取值分布在(0,1)区间的概率值。所得概率分布的表达式为: Probit回归常用的累积概率函数有两个: (1)logit概率函数: 通过变换可以得到另一种等价形式: 15.1 Probit回归的基本原理 (2)标准正态累计概率函数: 15.1 Probit回归的基本原理 Probit回归的数据要求 因变量(响应变量)应该是计数信息,记录在指定的自变量条件下,有响应的观测个数。 自变量(因子变量)必须是分类变量且须用整数编码。 观测量应该是独立的。如果自变量值的数量与观察值的数量相比过多,否则卡方检验和拟合优度检验是不适宜的 对Probit过程的参数估计同样采用极大似然估计法,构建Probit过程时要求样本采取随机抽取方式抽取,即要求样本分布与总体分布具有同一性。 概率回归时,最有用的是半数发生量。如收入到多少时,有一半家庭会购买。毒素浓度达到多少时,有一半的小白鼠会死亡。 15.1 Probit回归的基本原理 Probit回归与logistic回归的关系 当Probit 回归过程选择了Logit变换时,进行的统计分析过程就是Logistic 回归。 Logistic模型强调因变量的最终结果是发生还是不发生,其取值有明显的0~1分化。而概率回归研究的是在因变量具有两种相反属性时,随着自变量的变化,因变量取某属性的比例变化情况。如家庭购买电脑的比例与家庭人均收入之间的关系,研究的不是在某各收入水平下是否会购买,而是在不同的收入水平下购买的比例。 一般情况下:Probit 回归更适用于从有计划的试验中获得的数据,而Logistic回归更适用于直接的观测数据。 Probit 回归输出对各种响应比例有效值的估计,Logistic 回归输出对自变量发生比(OR)的估计。 Probit曲线和logit曲线很相似。两条曲线都是在pi = 0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。 实际应用中,对于同一资料用Probit 回归与Logistic 回归分析的结果非常接近。但Logistic回归的应用比Probit 回归更广泛。这是因为: Logistic 回归中的偏回归系数可以计算其exp (b) , 即OR 值,可以得到很好的直观解释与应用。Probit 回归模型中偏回归系数的含义为其他自变量取值保持不变时自变量每改变一个单位,出现某结果的概率密度函数值的改变量。显然解释起来比较麻烦,远不如Logistic 模型中,这也导致了研究者更喜欢使用Logistic 模型。 目前有很多针对Logistic 回归模型的诊断及补救措施,而对于Probit 回归而言而有信方面相对缺乏。当然,这类似先有鸡还是先有蛋的问题,很难说是因为模型诊断措施较多而导致了Logistic 回归的更多应用,还是说因为Logistic 回归更多的应用促进了其模型诊断措施的发展。 15.2 Probit回归的案例分析 例1: 某医师希望研究病人的年龄(岁)、性别co 为女性, 1 为男性)、心电图检验是否异常(ST 段压低, 0 为正常、1 为轻度异常、2 为重度异常)与患冠心病是否有关,数据文件为“冠心病影响. sav” 拟合Logistic 回归模型 因变量:ca;协变量:sex , ecg 、age exp (B) :自变量增加一个单位, 总体研究对象患

文档评论(0)

l215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档