- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于算法模型的房租指数编制方法研究
北京市统计局、国家统计局北京调查总队
冯艳、吴寒、肖京涛
目 录
摘 要 1
一、研究背景及意义2
二、相关理论综述3
(一)特征价格理论3
(二)算法建模4
三、模型的构建与测算5
(一)数据来源5
(二)数据预处理6
1.属性合并归类——保证信息规范6
2.属性重定义——保证信息准确7
3.剔除异常值——保证信息合理7
(三)数据的描述性分析8
1.交易特征8
2.房屋特征9
3.配套设施 10
4.区位特征 10
(四)模型的测算 11
1.数据缺失值处理 11
2.模型测算 13
四、基于大数据利用算法模型编制房租指数 15
(一)与传统方法的区别 15
1.调查方法从抽样到总体——大数据 15
2.同质可比从主观到科学——算法模型 15
(二)房屋租赁价格指数计算步骤 16
1.选定规格品集合 16
2.确定规格品在基期和报告期的价格 16
3.计算各个规格品的价格变动率 17
4.计算房屋租赁价格指数 17
(三)实证测算 17
(四)各类房租环比指数比较 17
五、应用及展望 18
(一)研究结论及应用 18
(二)待完善之处及展望20
参考文献22
附录错误!未定义书签。
摘 要
编制价格指数最核心、最基本的要求是同质可比,从而保证指数反映的是纯
价格变化,而不包括质量改变带来的价格变化。为保证同质可比,对价格进行质
量调整是价格指数构建中最重要的实践问题之一,它是决定价格指数精确性的关
键问题,同时也是目前编制过程中最难以解决的问题。
本研究试图运用大数据解决房租指数编制中的同质可比问题,通过建立模
型,对房租进行评估预测,实现同质量的房屋在基期和报告期都有租赁价格,保
证计算价格指数的样本质量不发生变化,由此计算出的房租指数反映纯价格变
化。数据选取2013 年 1 月-2014 年5 月北京主要大中型房屋中介公司的全部房
屋租赁成交记录,以特征价格理论为基础构建模型。在综合考量数据建模和算法
建模的基础上,选用算法建模方法建立模型。选择线性模型、决策树、Adaboost、
Bagging、随机森林、神经网络、支持向量机等7 种模型,通过多个数据集的比
较验证,最终选择随机森林算法模型对房租进行评估预测。基于此模型,实证测
算2014 年 1-5 月各月质量调整后房租环比指数。与多类房租环比指数比较分析
后认为,基于随机森林算法模型计算的房租价格指数方法较为科学。
本研究所建模型具有较大的利用拓展空间:一是可进一步分析各种房屋特征
对房租影响的重要性;二是可利用该模型构建公开的房租咨询平台,为租赁双方
提供房租指导价,避免中介公司利用信息不对称操纵市场价格;三是在数据基础
完备的条件下,本研究的方法和思路可应用于价格指数编制中其他类别的质量调
整。
1
关键词:算法模型 特征价格理论 价格指数 同质可比
一、研究背景及意义
居民消费价格指数(Consumer Price Index,简称CPI),是度量一定时期内
居民消费的商品和服务价格水平变动的相对数,反映的是供求因素变化等引起的
纯价格变动,不应反映商品和服务的质量变化。因此,“同质可比”是对样本的
基本要求。然而在实践中,由于一些商品的特殊性或产品更新换代较快等原因,
选取的样
原创力文档


文档评论(0)