- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高等教育情况地区差异的回归分析
一、研究背景
百年大计,教育为本。任何一个大国的崛起都离不开教育的崛起。进入新世纪以来,中国更是将对教育的重视提升到一个前所未有的程度。14年教师节,习近平主席参观我校,新闻联播用将近一半的时间来对此事进行报道,也可见新一届领导班子对教育的重视。
不仅仅是国家,社会层面上对于教育——尤其是高等教育,也投入了极大的关注。就在本月刚刚举办的“新华教育论坛”中,400多名全国知名教育专家、学者齐聚北京。本次活动发布的《2014年度中国教育行业舆情报告》指出,在2014年教育热点事件中,受网民关注度较高的仍然是考试招生类,其中就有教育资源的区域差异等等。而在报告提出的2015年教育舆情预测中,更是指出“由城乡差别、地区差距以及地区内校际教育资源的差别引起的涉及教育公平的政策出台及个案报道的相关话题仍将备受舆??热议”。可见研究不同地区的高等教育情况,对于推动教育公平的发展具有重要意义。
在本案例的研究中,主要研究的对象是不同省份的高等教育情况。由于研究区域经济差异对高等教育的影响的文章和报道已经很多了,本文将试图提出一些较为新颖的视角来对高等教育的区域差异进行研究和分析。
首先我们可以从直观上认识到,在排除经济因素的影响后,决定孩子接受教育水平高低的另一因素就是“文化因素”。孩子和父母是否重视教育,是否有长远发展的观念,将会直接影响孩子的受教育水平。
因此,本文将首先采用不同地区的投保金额、有线电视的普及情况来反映不同地区的文化观念差异(在这里运用了代理变量的方法,即通过可测量的变量还反映不可量化的变量,因此这里的假设是文化观念差异与购买保险金额、是否安装有线电视有相关关系)。通过二元回归对此问题进行分析。最后进行简单的预测和政策分析。
二、数据说明
对于本案例所需的不同地区的受高等教育程度、投保金额、有线电视用户数量等数据,来源于《中国统计年鉴2013》和《中国经济景气月报201301》。
在这里,地区主要选取了中国的31个省份,受高等教育程度通过地区内接受大专及以上教育的人数来反映,有线电视普及情况是有线广播电视用户数。所有的数据均是比例数值。
本次研究将主要运用回归分析的方法对数据进行研究。具体包括线性(逐步)回归、参数检验、显著性检验等方法。
三、数据检验和预处理
奇异点的剔除和数据的筛选
由于统计机构的不同,数据之间不能吻合。所以在投保数据表中进行了简单的筛选,只选取了省份的数据,去除某些大城市的数据。另外将所有省份字段进行排序,使得数据能够一一对应。
数据的预研究
在线性回归中,变量的选取很重要。如果自变量和被预测的变量之间没有关系,则不能用线性回归来进行研究分析。所以我们必须对数据进行预研究,探究因变量与自变量之间是否存在关系。
对此,我们分别作了各个变量之间的相关系数计算,并绘制了散点矩阵图结果如下:
Correlations教育人数投保金额有线电视数量Pearson Correlation教育人数1.000.909.901投保金额.9091.000.880有线电视数量.901.8801.000Sig. (1-tailed)教育人数..000.000投保金额.000..000有线电视数量.000.000.N教育人数313131投保金额313131有线电视数量313131表格 SEQ 表格 \* ARABIC 1相关系数计算
图表 SEQ 图表 \* ARABIC 1散点图
从图标1可以看出,受教育人数与每一个变量的线性关系都较为明显。而表格1中相关系数的计算结果也能从数字上验证直观上的结论,所以有进一步建立线性回归模型进行研究和分析的必要。
前提条件检验
由于使用多远线性回归有几个前提假设,所以首先要对数据进行前提条件的检验。在这里我们选取了两个较为重要且可以检验的假设来进行研究。
误差项的期望值是0,且方差σ2相同(方差齐性);
在这里,我们做了标准化预测值和标准化残差的散点图(横轴为标准化预测值,纵轴是标准化残差)如下:
图表 SEQ 图表 \* ARABIC 2
可以看出,大部分散点都位于(-3,3)之间,根据文献[1],我们可以说基本满足此假设。即随机误差的方差不随解释变量的变化而变化,其方差是相同的。
随机误差项是服从正态分布的随机变量:
为验证假设,本文中做了残差的直方图和P-P图如下:
图表 SEQ 图表 \* ARABIC 3 残差直方图
图表 SEQ 图表 \* ARABIC 4 残差P-P图
可以看出,P-P图中的样本点基本都处在直线的两侧,可以说随机误差符合正态分布。
综上所述,对于本研究中的数据,基本符合
文档评论(0)