虚拟变量的转换与回归分析
回归分析的类型
因变量与自变量都是定量变量的回归分析——即我们常做的回归分析
因变量是定量变量,自变量中有定性变量的回归分析—即含有虚拟变量的回归分析
因变量是定性变量的回归分析—Logistic回归分析
自变量中有定性变量的回归
在社会经济研究中,由许多定性变量,比如地区、民族、性别、文化程度、职业和居住地等。
可以应用它们的信息进行线性回归。
但是,必须现将定性变量转换为哑变量(也称虚拟变量),然后再将它们引入方程,所得的回归结果才有明确的解释意义。
哑变量的建立
对于具有k类的定性变量来说,设哑变量时,我们只设k-1个哑变量。
例7.4 分析某地区妇女的年龄、文化程度、及居住地状况对其曾生子女数的影响。
定量变量: 年龄
定性变量:文化程度、地区
哑变量的建立
原变量编码值 哑变量赋值的操作
文化程度=1(文盲) 所有EDU=0
文化程度=2(小学) EDU2=1,其他EDU=0
文化程度=3(初中) EDU3=1,其他EDU=0
文化程度=4(高中) EDU4=1,其他EDU=0
文化程度=5(大学) EDU5=1,其他EDU=0
地区=1(城市) AREA=1
地区=2(农村) AREA=0
应用SPSS建立回归方程
回归结果:
SPSS输出结果
SPSS输出结果
回归方程的解释
当案例在两个分类变量都等于0时,即文化程度为文盲,居住地在农村时,此种情况称为参照类(其他情况将于此进行比较),其回归方程为:
表明所有参照类妇女年龄每上升1岁,其曾生子女数的平均变化量为0.068个。
回归方程的解释
当文化程度为小学,居住地为农村时:
表明,对于相同年龄和居住地而言,小学文化程度妇女比文盲妇女曾生子女数多出b2个部分,即少生1.13个子女。
回归方程的解释
当教育程度为文盲、居住地为城市时,
表明,对于相同年龄和文化程度而言,城市妇女比农村妇女曾生子女数多出b6个部分,即少生0.49个子女。
回归方程的解释
总之,该回归方程表示:
参照类妇女曾生子女数对年龄的回归直线的截据为1.41,年龄每上升1岁,参照类妇女的平均曾生子女数上升0.068个。
城市妇女比农村妇女的平均曾生子女数少0.49个。
小学、初中、高中和大学文化程度妇女的平均曾生子女数分别比文盲妇女少1.13、1.31、1.58、1.57个(在年龄和居住地相同时)。
回归方程的解释
文化程度在实际中是一个序次变量。可以用 表示序次变量个相邻分类的实际效应,如初中的边际效应为:
类似,可以计算下面的边际效应:
小学= -1.13 初中= -0.18
高中= -0.27 大学= 0.01
回归分析
利用同样的方法我们可以对例7.2进行回归分析。
例7.2的数据中,还有一个自变量是定性变量“收入”,以虚拟变量或哑元(dummy variable)的方式出现。
SPSS输出结果
SPSS输出结果
回归分析
回归方程为:
您可能关注的文档
最近下载
- 支部党员大会会议记录(支委会选举范例).docx VIP
- 深圳市宝安区2025-2026学年第一学期五年级语文期末学业质量评估卷(原卷+答案)统编版.docx VIP
- 山桐子种植加工、旅游项目可行性研究报告商业计划书.docx VIP
- 山桐子种植及种苗培育种植加工可行性研究报告申请备案.doc VIP
- 和田地区2026年度地直机关公开遴选公务员、事业单位公开选聘工作人员备考题库及完整答案详解1套.docx VIP
- 山桐子合作种植协议合同.docx VIP
- 2025年香氛未来趋势报告-英敏特.docx VIP
- 报告正文2014年太阳绿宝.pdf VIP
- 2025年高考:云南物理--试题及答案.pdf VIP
- 广东省深圳市宝安区2025-2026学年五年级上学期期末学业质量评估语文试卷.docx VIP
原创力文档

文档评论(0)