- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Agenda ? ? ? ? ? 4.1 回归分析与回归函数 4.2 多元线性回归模型 4.3 违背经典假设的回归模型 4.4 含虚拟变量的回归模型 4.5 非线性回归预测 4.4.1 虚拟变量回归的基本理论 1. 虚拟变量的基本概念 被解释变量的变动往往是定量因素和属性因 素共同作用的结果。在回归分析模型中,应当同 时包含定量和属性两种因素对被解释变量的影响 作用。 定量因素 是指那些可直接测度的数值型因素, 如 GDP 、 等。 M 2 定性因素 (或称为属性因素) 是指不能直接测度的、用来说明某种属性或状态 存在与否的非数值型因素,如男性或女性、城市 居民或非城市居民、文化程度等。 2 为了在模型中反映定性因素,可以将定性因 素转化为虚拟变量去表现。 虚拟变量 (或称为属性 变量、双值变量、类型变量、定性变量、二元型变 量、哑变量等) 是人工构造的取值为 0 和 1 的作为 属性变量代表的变量,一般用字母 D (或 dummy 的缩写 DUM )表示 。 属性因素通常具有若干类型或水平,虚拟变量的取 值为 0 和 1 。当虚拟变量取值为 0 ,即 D=0 时,表示 某种属性或状态不出现或不存在,即不是某种类型; 当虚拟变量取值为 1 ,即 D=1 时,表示某种属性或 状态出现或存在,即是某种类型。 3 2. 虚拟变量的设置规则 ( 1 )虚拟变量数量的设置规则 ? 一是,若定性因素有 m 个相互排斥的类型(或 属性、水平),在有截距项的模型中只能引入 m- 1 个虚拟变量,否则会陷入所谓“虚拟变量陷 阱”,模型产生完全的多重共线性。 ? 二是,若定性因素有 m 个相互排斥的类型(或 属性、水平),在无截距项的模型中引入 m 个虚 拟变量,不会导致完全多重共线性,不过这时虚 拟变量参数的估计结果,实际上是 D=1 时的样本 均值。 4 ( 2 )虚拟变量 0 和 1 的选取原则 虚拟变量取 1 或 0 的原则,应从分析问题的目 的出发予以界定。从理论上说,虚拟变量取“ 0 ”, 通常代表基础类型;虚拟变量取“ 1 ”,通常代表 与基础类型相比较的类型。 5 3. 含虚拟变量回归模型的建立及其本质 在回归模型中,我们针对四种情况引入虚 拟变量。 ? 一是属性变量的不同类型只导致回归模型的截 距发生变动,而各解释变量的参数在不同类型 情况下保持不变。 ? 二是属性变量的不同类型不会导致回归模型的 截距发生变动,只会导致一些解释变量的参数 在不同类型情况下发生变化。 6 ? 三是属性变量的不同类型既会导致回归模型 的截距发生变动,也会导致一些解释变量的参 数在不同类型情况下发生变动。前三种情况均 假定不同属性变量的类型组合不会导致回归模 型的截距或解释变量的参数发生变动。 ? 四则是用来测度不同属性变量的类型组合对 回归模型参数变动的影响。这一影响我们称之 为“相互作用效应”。 7 ? ( 1 )属性变量只导致回归模型的截距发生变化 例如我们研究基金业务推广人员薪酬水平 Y ,假定 影响薪酬水平的主要因素是工作时间 X 1 和业绩水 平 X 2 ,其内在规律可用线性回归模型表示。则这 一模型可以表示为: Y ? ? 0 ? ? 1 X 1 ? ? 2 X 2 ( 4 - 69 ) 8 当需要研究性别因素对薪酬水平的影响程度,且假 定这种影响只导致模型( 4 - 69 )的截距项发生变 化时,模型( 4 - 69 )则改变为: Y ? ? ? ? 0 3 D ? ? X ? ? X 1 1 1 2 2 ( 4 - 70 ) 其中: ? 1 男性 D 1 ? ? ? 0 女性 9 ? ( 2 )属性变量只导致回归模型的一些解释变量 参数发生变化 当假定性别因素不会导致回归模型的截距项发生变 化,而是使工作时间变量 X 1 的参数发生变化,则 模型( 4 - 69 )则改变为: Y ? ? 0 ? ? 1 X 1 ? ? 3 D 1 X 1 ? ? 2 X 2 10 ? ( 3 )属性变量将导致回归模型的截距项和一些解 释变量的参数同时发生变化。 ? 学历分为大学本科、大学本科以下和研究生三 个层次,考虑到性别因素可能会导致工作时间 参数变化,学历水平可能会导致业绩水平参数 变化,性别和学历水平二者都会使模型截距项 发生改变,则模型( 4 - 69 )改变为: Y ? ? 0 ? ? 1 X 1 ? ? 2 X 2 ? ? 3 D 1 ?
文档评论(0)