- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我国彩票销售影响因素的实证研究
自1987年以来,中国已开始发行年轻人汽车,并已经使用了20年。在过去20年中,中国在国家层面上筹集了数百亿个社会基金。从分配和销售汽车权益基金中筹集的社会基金已成为发展中国社会和非营利组织的重要经济支柱。在改革开放的浪潮下,我国的经济持续快速发展,国内生产总值高速增长,居民收入稳步提高,使人们有更充裕的财力来消费生活非必需品,为我国福利彩票的发展提供了有力的基础。如果我们可以利用政府每年发布的各省份的宏观经济变量的数据,定量的找到它们与福利彩票销售额之间的关系,那么福利彩票的销售就更加有的放矢。
Luke Zhang于2007年首次对中国福利彩票销售额的影响因素做了研究,选择了各省份的人口总数、城镇人口百分比、地区生产总值、农村居民纯收入及城镇居民可支配收入作为影响因素应用多元线性回归来拟合福利彩票的销售额。结果显示:城镇居民可支配收入对福利彩票销售额的影响并不显著,且判定系数R2仅为0.685,误差也比较大,最大的相对误差竟高达832.78%,由此可以看出单纯的利用线性回归来构建模型并不是很理想。
研究表明,福利彩票销售额这个复杂的经济量,不能仅仅依靠简单的多元线性回归确定的模型来决定,在一些实际的案例中,我们可以发现,一些影响因素的耦合,对于响应变量会产生显著性更强的影响。
本文在Luke Zhang所研究的基础上考虑影响因素的耦合项,采用分层变换筛选拟合法对影响我国福利彩票销售额的因素进行分析并建立回归模型。
1 建立各阶项拟合模型
分层变换筛选拟合法是将多项式回归、逐步回归、参数的岭估计等等有机结合,并采用累进变换,该方法可以有效的分离出显著非线性耦合扰动,提高模型的精度,降低拟合的模型误差。其具体步骤如下:
第一步:确定响应变量及影响因素,整理出相应的数据,并对影响因素两两作散点图,通过观察散点图剔除影响因素间的共线性关系。
第二步:依照响应变量与剩余的影响因素两两间散点图的关系,将影响因素与响应变量是非线性关系的因素作线性化变换,并以变换后的形式代替原影响因素,再与无需变换的原影响因素一起作为基本变量,构成多元回归多项式,一般多项式的最高阶数为2(超过二阶的很难找到合理的物理解释),各影响因素的乘积项即二阶项称为复合非线性项。
第三步:依照各基本变量及各复合非线性项两两间的散点图关系,剔除回归多项式中的各阶项之间的共线性。
第四步:依照剩余的各复合非线性项与响应变量的散点图关系,对响应变量是非线性关系的复合非线性项作线性变换,并以变换后的形式代替之前的多元回归多项式中的相应复合非线性项。
第五步:依照剩余的各阶项与响应变量的散点图关系,选择对响应变量影响显著的量,确定拟合模型。
第六步:通过岭估计法确定模型中的参数,并对拟合效果加以检验。
2 确认研究
2.1 分区域社会经济指标的确定
本文选取的影响因素是各省份的人口总数、城镇人口百分比、地区生产总值、农村居民纯收入及城镇居民可支配收入,在构建模型之前,通过观测数据(文中用到的数据是2007年的相关数据除福利彩票销售额外均来自于中国统计年鉴的官方网站),我们发现可以先对数据做一些处理,当有些变量的观测值取值范围很大且严格为正, 即最大观测值与最小观测值之比大于10时,我们可以对数据做对数变换,这样可以稳定方差以及使得残差更接近于有一个来自相同正态总体的样本。因此,我们对福利彩票销售额、人口总数及地区生产总值做对数变换,记Y为log(福利彩票销售额),z1为log(人口总数),z2为城镇人口百分比,z3为log(地区生产总值),z4为农村居民纯收入,z5为城镇居民可支配收入。在此基础上,我们采用分层变换筛选拟合法。
2.2 y与剩余的关系
对于我们所选取的数据,依照分层变换筛选拟合法,我们可以得到:
(1)z1、z2、z3、z4、z5两两间均无共线性关系,Y与z1、z2、z3、z4、z5均有一定的线性关系,因此以z1、z2、z3、z4、z5为基本参量构成复合非线性项。
(2)依照基本参量间的散点图,剔除基本参量与复合非线性项之间的共线性,最终剩下的量为z1、z2、z3、z4、z5、z2z3、z1z3、z1z4、z1z5、z2z4、z2z5.
(3)通过散点图,可以发现Y与剩余的各复合非线性项均有一定的线性关系。
(4)依照剩余各阶项与Y的散点图关系,删除对Y影响不显著的项,得到拟合模型,最终我们确立的模型是
Υ=a0+a1z1+a2z3+a3z1z3+a4z1z4+
a5z2z3+a6z1z5+ε
其中,a0,…,a6为待定系数,ε为随机误差。
(5)应用岭估计,得到a0、a1、a2、a3、a4、a5、a6的值分别为0.009799808、0.129018261、0.014564933、0.041261872、-0.0000154
原创力文档


文档评论(0)