第13章 基于数据挖掘技术的市财政收入分析预测V1.1.docVIP

  • 231
  • 0
  • 约2.68万字
  • 约 25页
  • 2019-03-10 发布于广西
  • 举报

第13章 基于数据挖掘技术的市财政收入分析预测V1.1.doc

第13章 基于数据挖掘技术的市财政收入分析预测V1.1 第 PAGE \* Arabic \* MERGEFORMAT 11 页 基于数据挖掘技术的市财政收入分析预测模型 背景与挖掘目标 在我国现行的分税制财政管理体制下,地方财政收人不仅是国家财政收入的重要组成部分,而且具有其相对独立的构成内容。如何有效的利用地方财政收入,合理的分配,来促进地方的发展,提高市民的收入和生活质量是每个地方政府需要考虑的首要问题。因此,对地方财政收人进行预测,不仅是必要的,而且也是可能的。科学、合理地预测地方财政收人,对于克服年度地方预算收支规模确定的随意性和盲目性,正确处理地方财政与经济的相互关系具有十分重要的意义。 广州作为改革开放的前沿城市,其经济发展在全国经济中的地位举足轻重。目前,广州市在财政收入规模、结构等方面与北京、上海、深圳等城市仍有一定差距,存在不断完善的空间。本案例旨在通过研究,发现影响广州市目前以及未来地方财源建设的因素,并对其进行深入分析,提出对广州市地方财源优化的具体建议,供政府决策参考,同时为其他经济发展较快的城市提供借鉴。 考虑到数据的可得性,本案例所用的财政收入分为地方一般预算收入和政府性基金收入。地方一般预算收入包括:(1)税收收入,主要包括企业所得税和地方所得税中中央和地方共享的40%,地方享有的 25%的增值税、营业税、印花税等;(2)非税收入,包括专项收入、行政事业性收费、罚没收入、国有资本经营收入和其他收入等。政府性基金收入是国家通过向社会征收以及出让土地、发行彩票等方式取得收入,并专项用于支持特定基础设施建设和社会事业发展的收入。 由于1994年我国对财政体制进行了重大改革,开始实行分税制财政体制,影响了财政收入相关数据的连续性,在1994年前后不具有可比性。由于没有合适的数学手段来调整这种数据的跃变,仅对1994年及其以后的数据进行分析,本案例所用数据均来自《广州市统计年鉴》(1995-2014)。 REF _Ref424655508 \h 表 131给出了广州市1994-2013年财政收入以及相关因素的数据,为进一步寻找广州市财政收入的关键印象因素做准备。 表 STYLEREF 1 \s 13 SEQ 表 \* ARABIC \s 1 1 广州市财政收入及其相关数据 本次数据挖掘建模目标如下: 梳理影响地方财政收入的关键特征,分析、识别影响地方财政收入的关键特征的选择模型; 结合目标1的因素分析,对广州市2015年的财政总收入及各个类别收入进行预测。 分析方法与过程 我国很多学者已经对财政收入的影响因素进行了很多研究,但是他们大多先建立财政收入与各待定的影响因素之间的多元线性回归模型,运用最小二乘估计方法来估计回归模型的系数,通过系数能否通过检验来检验他们之间的关系,这样的结果对数据的依赖程度很大,并且普通最小二乘估计求得的解往往是局部最优解,后续的检验可能就会失去应有的意义。 近几十年来,现代统计技术不断完善和发展,对新的数据运用新的方法来考察地方财政收入的影响因素是有必要的。本案例在已有研究的基础上运用Adaptive-Lasso变量选择方法来研究影响地方财政收入的因素。 在以往的文献中,对影响财政收入的因素的分析中大多使用普通最小二乘法来对回归模型的系数进行估计,预测变量的选取则采用的是逐步回归。然而,无论是最小二乘法还是逐步回归,都有其不足之处。它们一般都局限于局部最优解而不是全局最优解。如果预测变量过多,子集选择的计算过程具有不可实行性,且子集选择具有内在的不连续性,从而导致子集选择极度多变。Lasso是近年来被广泛应用于参数估计和变量选择的方法之一,并且Lasso进行变量选择在确定的条件下已经被证明是一致的。案例选用了Adaptive-Lasso方法来探究地方财政收入与各因素之间的关系。 Lasso是由Tibshirani[13-1] (1996)提出的将参数估计与变量选择同时进行的一种正则化方法。Lasso参数估计被定义如下: ( STYLEREF 1 \s 131) 其中,为非负正则参数,称为惩罚项。 Lasso方法虽然可以解决最小二乘法和逐步回归局部最优估计的不足,但是其自身需要满足一定的苛刻条件。Hui ZOU[13-2](2006)提出了一种改进的Lasso方法,其改进之处在于给不同的系数加上了不同的权重,被称为Adaptive-Lasso方法,定义如下: ( STYLEREF 1 \s 132) 其中,权重,,为由普通最小二乘法得出的系数。 设变量为一非负单调原始数据序列,建立灰色预测模型:首先对进行一次累加得到一次累加序列

文档评论(0)

1亿VIP精品文档

相关文档