- 25
- 0
- 约3.21万字
- 约 29页
- 2017-06-07 发布于湖北
- 举报
基于大数据背景下的住宅价格指数的编制方法探讨
国家统计局陕西调查总队 畅通、李东涛、王艳
摘 要
本文旨在探索如何有效利用住宅交易大数据,最大限度地消除住宅异质性对
于价格指数编制的影响,从而为住宅价格指数的编制寻求一种新的思路和方法。
通过多渠道并借助“网络爬虫技术”,获得结构复杂、类型多样的某市2013 年1
月-2014 年2 月新建住宅销售网签数据和大量的相关网络搜索数据。经过数据
整理和挖掘,分别使用两种不同的直接Hedonic 法—— 时间哑元法和分月特征价
格指数法,来构建Hedonic 模型并编制住宅价格指数。在模型构建过程中,经反
复测算,时间哑元法选用了拟合优度表现较好的半对数链式更新模型,分月特征
价格指数法通过五折交叉验证选用了随机森林和SVM 模型,分别进行指数编制,
并对两种编制方法进行了优劣比较与评估。
关键词:大数据 住宅价格指数 Hedonic 模型 链式指数法 随机森林
目 录
一、问题的提出 1
二、研究背景 1
三、研究思路及创新点 3
(一)研究思路 3
(二)创新点 3
四、数据来源和预处理 4
(一)数据背景及来源 4
(二)数据质量考察与预处理 5
五、数据描述与特征分析 7
(一)特征因素的量化 7
(二)数据特征分析 8
1.交易量与价格变化特征 8
2.宅价格变化特征 8
3.邻里环境与住宅价格变化特征 11
4.条件与住宅价格变化特征 11
(三)发现与结论 12
六、模型构建与分析 12
(一)时间哑元法 13
1.选取模型形式 13
2.基于某市2013 年住宅交易数据的模型估计 14
3.基准期月度特征价格指数的计算 16
4.考察期(2014 年1-2 月)月度特征价格指数的链式更新计算 18
(二)分月特征价格指数法 19
1.选取模型形式 19
2.模型参数选择 20
3.预测住宅价格 20
4.指数编制 21
(三)模型结果比较 22
七、模型的评价、改进和展望 23
(一)模型优点 23
(二)模型的局限 23
(三)前景展望 24
八、结论及建议 24
参考文献 25
附录 错误!未定义书签。
1.网络爬虫主程序 错误!未定义书签。
2 .保障性住宅和商业住宅价格散点图 错误!未定义书签。
3 .R 程序 错误!未定义书签。
一、问题的提出
房地产是国民经济的重要支柱产业,2013 年全国房地产开发投资占GDP 的
15%,拉动上游钢铁、建材,下游家用电器、纺织等50 多个行业发展,对于促
进经济增长、扩大就业、提高财政收入发挥了重要作用。住宅价格指数作为反映
房地产市场变化的“风向标”,备受社会各界关注。如何获得准确反映房地产市
场需求变化的住宅价格指数,对于指导房地产开发企业的投资行为和社会公众的
购买行为,为政府宏观决策提供科学依据,具有重大意义。
现行的住宅价格指数编制方法—加权平均法,我们认为存在两个值得商榷的
地方:一是由于未考虑样本的异质性特征,难以完全满足建立价格指数时“同质
可比”的要求;二是仅以住宅销售面积和销售额双加权计算价格指数,没有考察
住宅涵盖的环境、区位、交通、教育、商贸、医疗等大量特征因素,无法体现住
宅品质对价格的影响,计算的住宅价格指数难免会有偏差。探索新的住宅价格指
数编制方法势在必行。为此,本文采用以消除商品“异质性”为目标的Hedonic
法计算住宅价格指数,具有同质化程度高、经济意义明确等优点,能够充分利用
住宅所涵盖的大量特征因素,计算精度高,是目前较为理想的住宅价格指数编制
方法。
本文以消除住宅商品“异质性”、加入大量住宅特征因素为切入点,以网签
数据为基础,同时加入住宅环境、区位、交通、教育、商贸、医疗等大量特征因
素,并利用 “网络爬虫技术”获取这些特征因素数据,形成住宅价格统计“大数
据”库。在大数据背景下,运用Hedonic 法编制住宅价格指数,对于优化和改进
原创力文档

文档评论(0)