- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS 16实用教程 含虚自变量回归分析 对于一个表示受教育程度的定性变量EDU,拥有多个属性分类。这里设定有5个分类,则需要4个虚变量来进行表示 设置虚拟变量的两种方法: 1.计算赋值(transform/compute variable) 2.重新编码赋值(transform/recode into different variable) 计算赋值法步骤: 重新编码赋值 1.含虚变量回归模型: 2.考虑到学历与地域交互影响的回归模型: 对于同一因素的两个分类之间是否显著的检验问题: 其中 t 的自由度为 n-k-1, n为样本数,k为模型自变量个数。 回归系数的方差、协方差(statistics/covariance matrix) 作业: 分析妇女的年龄(AGE)、文化程度(EDU)、以及居住地(AREA)状况对其曾生子女数(CEB)的影响。年龄是间距变量,文化程度和居住地是分类变量。 (基本要求与前几节一样。包括有回归模型表达式、拟合优度评价、模型检验、系数检验、残差分析,另外给出个回归系数之间的协方差矩阵为检验因素内不同分类之间显著性做准备) 1.不考虑交互影响。(同时需要指明农村妇女与城市妇女平均曾生子女个数的差异、大学毕业妇女与文盲妇女平均曾生子女数的差异。试分析教育程度中,初中与高中两个分类之间是否可以合并?) 2.考虑地域因素与教育程度因素之间的交互影响。 数据文件见ftp 曾生子女数.sav * * 7.7.1 统计学上的定义和计算公式 7.7 含虚拟自变量的回归分析 定义:前面几节所讨论的回归模型中,因变量和自变量都是可以直接用数字计量的,即可以获得其实际观测值(如收入、支出、产量、国内生产总值等),这类变量称作数值型变量。然而,在实际问题的研究中,经常会碰到一些非数值型的变量,如性别、民族、职业、文化程度、地区、正常年份与干旱年份、改革前与改革后等定性变量。 在建立一个实际问题的回归方程时,经常需要考虑这些定性变量。例如,建立粮食产量预测方程就应考虑到正常年份与受灾年份的不同影响;建立空调的销售模型时,除了要考虑居民收入和商品价格这两个量的因素之外,还必须将“季节”这个质的因素,作为一个重要解释变量。 由于受到质的因素影响,回归模型的参数不再是固定不变的。例如,在空调销售模型中,收入、价格与空调销售额的关系是随着季节变化而改变的,也就是说,在不同的季节回归模型的参数也会有所不同。再如,我国居民的消费行为在改革开放前后大不相同,因此消费函数的参数也会发生变化。显然,如果忽略质的因素,仍把模型中的参数看作是固定不变的,得到的参数估计量就不能正确描述经济变量之间的关系。 在回归分析中,对一些自变量是定性变量的先作数量化处理,处理的方法是引进只取“0”和“1”两个值的0?1型虚拟(dummy)自变量。当某一属性出现时,虚拟变量取值为“1”,否则取值为“0”。例如,令“1”表示改革开放以后的时期,“0”则表示改革开放以前的时期。再如,用“l”表示某人是男性,“0”则表示某人是女性。虚拟变量也称为哑变量。需要指出的是,虽然虚拟变量取某一数值,但这一数值没有任何数量大小的意义,它仅仅用来说明观察单位的性质和属性。 如果在回归模型中需要引入多个0?1型虚拟变量D时,虚拟变量的个数应按下列原则来确定:对于包含一个具有k种特征或状态的质因素的回归模型,如果回归模型不带常数项,则中需引入k个0?1型虚拟变量D;如果有常数项,则只需引入k?1个0?1型虚拟变量D。当k=2时,只需要引入一个0?1型虚拟变量D。 例如: 对于表示地域定性变量 AREA,只有两个属性,所以需要一个虚变量来表示 建立虚拟变量DU。设置逻辑运算,如果AREA==1时,DU=1,否则DU=0. 进行重新编码 编码完成 ? 研究问题 研究采取某项保险革新措施的速度y与保险公司的规模x1及其类型d之间的关系,数据如表7-6所示。 操作步骤与普通线性回归无异! 7.7.2 SPSS中实现过程 表7-6 保险公司革新情况 1 246 14 20 1 124 30 19 1 305 13 18 1 166 20 17 1 224 21 16 1 85 31 15 1 68 38 14 1 295 11 13 1 272 15 12 1 164 28 11 0 238 16 10 0 290 4 9 0 120 19 8 0 210 12 7 0 277 0 6 0 104 22 5 0 31 30 4 0 175 21 3 0 92 26 2 0 151 17 1 d x1 y i ? 实现步骤 图7-23 “Linear Regression
您可能关注的文档
最近下载
- 25题技术研发工程师岗位常见面试问题含HR问题考察点及参考回答.docx VIP
- 2025年《开学第一课》.ppt VIP
- 烟草物流师3级专业知识复习提纲下发版课件.docx
- Grundfos格兰富计量泵SMART Digital S, DDA, DDC, DDE up to 30 lph (Data Booklet)产品选型手册.pdf
- 2023年新版GMP成品运输确认.docx VIP
- 河北省阜平县石漕沟水库枢纽工程可行性研究报告的审查意见.docx
- 22G101 三维彩色立体图集.docx VIP
- 预留预埋施工.pdf VIP
- 某公司卓越绩效管理手册.pdf VIP
- 中国石化零售管理系统站级平台用户操作手册.doc VIP
文档评论(0)