基于大数据背景下住宅价格指数编制方法探讨.PDFVIP

  • 25
  • 0
  • 约3.21万字
  • 约 29页
  • 2017-06-07 发布于湖北
  • 举报

基于大数据背景下住宅价格指数编制方法探讨.PDF

基于大数据背景下的住宅价格指数的编制方法探讨 国家统计局陕西调查总队 畅通、李东涛、王艳 摘 要 本文旨在探索如何有效利用住宅交易大数据,最大限度地消除住宅异质性对 于价格指数编制的影响,从而为住宅价格指数的编制寻求一种新的思路和方法。 通过多渠道并借助“网络爬虫技术”,获得结构复杂、类型多样的某市2013 年1 月-2014 年2 月新建住宅销售网签数据和大量的相关网络搜索数据。经过数据 整理和挖掘,分别使用两种不同的直接Hedonic 法—— 时间哑元法和分月特征价 格指数法,来构建Hedonic 模型并编制住宅价格指数。在模型构建过程中,经反 复测算,时间哑元法选用了拟合优度表现较好的半对数链式更新模型,分月特征 价格指数法通过五折交叉验证选用了随机森林和SVM 模型,分别进行指数编制, 并对两种编制方法进行了优劣比较与评估。 关键词:大数据 住宅价格指数 Hedonic 模型 链式指数法 随机森林 目 录 一、问题的提出 1 二、研究背景 1 三、研究思路及创新点 3 (一)研究思路 3 (二)创新点 3 四、数据来源和预处理 4 (一)数据背景及来源 4 (二)数据质量考察与预处理 5 五、数据描述与特征分析 7 (一)特征因素的量化 7 (二)数据特征分析 8 1.交易量与价格变化特征 8 2.宅价格变化特征 8 3.邻里环境与住宅价格变化特征 11 4.条件与住宅价格变化特征 11 (三)发现与结论 12 六、模型构建与分析 12 (一)时间哑元法 13 1.选取模型形式 13 2.基于某市2013 年住宅交易数据的模型估计 14 3.基准期月度特征价格指数的计算 16 4.考察期(2014 年1-2 月)月度特征价格指数的链式更新计算 18 (二)分月特征价格指数法 19 1.选取模型形式 19 2.模型参数选择 20 3.预测住宅价格 20 4.指数编制 21 (三)模型结果比较 22 七、模型的评价、改进和展望 23 (一)模型优点 23 (二)模型的局限 23 (三)前景展望 24 八、结论及建议 24 参考文献 25 附录 错误!未定义书签。 1.网络爬虫主程序 错误!未定义书签。 2 .保障性住宅和商业住宅价格散点图 错误!未定义书签。 3 .R 程序 错误!未定义书签。 一、问题的提出 房地产是国民经济的重要支柱产业,2013 年全国房地产开发投资占GDP 的 15%,拉动上游钢铁、建材,下游家用电器、纺织等50 多个行业发展,对于促 进经济增长、扩大就业、提高财政收入发挥了重要作用。住宅价格指数作为反映 房地产市场变化的“风向标”,备受社会各界关注。如何获得准确反映房地产市 场需求变化的住宅价格指数,对于指导房地产开发企业的投资行为和社会公众的 购买行为,为政府宏观决策提供科学依据,具有重大意义。 现行的住宅价格指数编制方法—加权平均法,我们认为存在两个值得商榷的 地方:一是由于未考虑样本的异质性特征,难以完全满足建立价格指数时“同质 可比”的要求;二是仅以住宅销售面积和销售额双加权计算价格指数,没有考察 住宅涵盖的环境、区位、交通、教育、商贸、医疗等大量特征因素,无法体现住 宅品质对价格的影响,计算的住宅价格指数难免会有偏差。探索新的住宅价格指 数编制方法势在必行。为此,本文采用以消除商品“异质性”为目标的Hedonic 法计算住宅价格指数,具有同质化程度高、经济意义明确等优点,能够充分利用 住宅所涵盖的大量特征因素,计算精度高,是目前较为理想的住宅价格指数编制 方法。 本文以消除住宅商品“异质性”、加入大量住宅特征因素为切入点,以网签 数据为基础,同时加入住宅环境、区位、交通、教育、商贸、医疗等大量特征因 素,并利用 “网络爬虫技术”获取这些特征因素数据,形成住宅价格统计“大数 据”库。在大数据背景下,运用Hedonic 法编制住宅价格指数,对于优化和改进

文档评论(0)

1亿VIP精品文档

相关文档