- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优势分析原理和基础
优势分析:在多元回归中比较预测因子相对重要性的新方法 David V. Budescu 报告人:周浩、杨英 在使用多元回归的过程中,研究者不仅要得出一个包含多个自变量的回归等式,而且要指出哪个自变量相对来说是最重要的,这样的结果实际应用中才更有意义。 在理想的情况下,各个自变量之间没有相关(或者相关极小),那么 , 因为各个回归系数都是标准化的,其相对重要性就是标准化回归系数的平方。 大多数情况下,各个自变量之间存在着不可忽略的相关,这个时候重要性的比较就不能简单地从标准化回归系数得出。对此,不同的人采用了不同的方法: 1、将自变量与因变量的零次相关 或平方相关 作为评判自变量重要性的标准。其对重要性的定义为一个自变量独特、直接的预测能力,忽略模型中其他所有的自变量。 2、由于不恰当地确定模型,无论是遗漏了重要的自变量,或者将不重要的自变量纳入到了模型中都会导致,模型的失真,所以应该认为,能够纳入到一个恰当模型中的所有自变量都是同等重要的。 3、自变量的重要性应为某个自变量在控制其他变量不变的情况下其对于完整模型的贡献: 3.1增溢法:考察控制其他变量情况下,某自变量变化一个单位,导致因变量变化的比例。例如以某自变量的回归系数与其数学期望乘积的绝对值作为检验标准。形象的理解为自变量的弹性。 3.2方差法:在控制其他变量的情况下,比较各自变量对于因变量方差贡献的大小 3.2.1由方差的可加性得: 即所有自变量对因变量的贡献可以分解为各个自变量在控制其他自变量情况下对模型贡献,这样的分解式有 个,而某个自变量的重要性即为在 个分解式中它的贡献的平均值。 EG 3.2.2某自变量的重要性即为其它对因变量的直接效应(与因变量的相关系数)与总效应(标准回归系数)的乘积。 3.2.3某自变量的重要性可量化为其与因变量的相关的平方,由于自变量之间的相关,所以: 即把各自变量的标准化回归系数平方中与要考察变量相关的部分提出来相加,即乘以其与要考察自变量之间的相关系数。 上述方法的缺陷 1、对于重要性的定义过于狭窄、模糊甚至有问题,限制过于严格,与人们实际应用相距太远。 2、不同定义之间难以相容,无法比较、交流研究结果,甚至根据不同的定义得出结论完全不同。 3、很高的模型依赖性,在不同的子模型中得出相对重要性的结论可能完全不一样,所以重要性的检验应该在全模型和子模型中结论一致。 4、重要性的比较应该是“净”的,如果变量之间高度相关,根本不可分,更无法比较分离出的重要性,那么此时重要性的比较就没有任何意义,所以应该首先区分可以比较和不能比较相对重要性的模型。 比较相对重要性应遵循的原则: 1、重要性应定义为自变量在预测因变量时对于减少误差的贡献。 2、应该能够对自变量的相对重要性作直接比较而非推断比较。 3、重要性应该能够反映直接效应(自变量的单独效应)、总效应( 纳入其他所有变量)、偏效应(纳入其他部分变量),即要求重要性的结论在全模型与子模型中保持一致。 优势分析的质的定义 优势是成对的关系,如果全模型包括p个自变量,那么就有p(p-1)/2对优势的比较;确定 和 优势关系的充分必要条件是: 代表除要比较的两个自变量之外的其他自变量所构成的任何子集(包括空集)。 优势分析定义的变式: 一个变量比另一个变量重要即它在任何子模型中对因变量的预测能力都大于另一个。 优势分析的量化: 由两个自变量的比较推广到所有自变量的同时比较时, 是除自身外的其他所有p-1个变量构成的所有子集(包括空集), 表示在由k(0=k=p-1)个自变量构成 时,该自变量的单独贡献的平均值。将其累加求平均数,即该自变量在所有子模型下的贡献平均值。 EG:当有3个自变量时: 数据实例: 计算和样本理论 接着,我们再来看一个p=4的例子,用取得博士以后的年限(x1) 、出版著作的多少(x2) 、性别(x3)和被引用的频率(x4)来预测薪水(y) : 另: 当数据不能完全满足优势分析条件时,需要确定自变量的重要性关系,可以考虑采用“理想点”法: 即选取每K值子模型下最大(或者最小)的自变量贡献平均值,从而构建出一组最优(或最劣)的理想自变量的贡献平均值,通过计算、比较其他自变量与其的相关系数大小,从而确定它们的重要性关系。TO 小结—— THANK YOU! * * BACK 根据优势方程的定义,对于要进行优势分析的每一对变量, 每一个变量都需要和其他许多偏模型进行多元相关系数平方的比较。如果要包括所有的子模型,则一个变量要进行p(
您可能关注的文档
最近下载
- 香港电影简史年表.docx VIP
- 临床免疫学检验:免疫原和抗血清的制备.ppt VIP
- 项目生命周期与项目管理过程课件.pptx VIP
- GB50348-2004 安全防范工程技术规范.docx VIP
- 大模型时代的具身智能.pptx
- 2024-2025学年安徽省合肥四十五中九年级(上)第一次月考物理试卷(含答案).pdf VIP
- 戏剧教育与戏剧表演技巧培训.pptx VIP
- 新药研究与开发技术 课件全套 第1--7章 概论、新药的发现研究---新药选题与信息利用.pptx
- 2025年中国智慧停车行业研究报告-鼎帷咨询.docx
- 《AI时代新机遇》AIGC如何为教师赋能培训课件.pptx VIP
文档评论(0)