基于支持向量机二手房普通住宅价格指数分析.docVIP

基于支持向量机二手房普通住宅价格指数分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于支持向量机二手房普通住宅价格指数分析

基于支持向量机二手房普通住宅价格指数分析   【摘 要】为研究重庆市二手房价格整体波动情况,在特征价格理论的支持下,运用聚类分析将重庆市二手房普通住宅品质分成高中低三个档次,用支持向量机回归模型对各档次标准住宅进行价值评估,将这三类物业的平均价格以成交量为权数求得加权平均价格,得出了各时期的二手房各档次比较价格,进而生成了重庆市二手房普通住宅的价格指数   【关键词】特征价格;支持向量机;聚类分析   一、引言    在房地产市场中,对于投资者、消费者和政府来说,房地产价格指数都是一种很重要的市场信息。政府的宏观调控服务需要房地产价格指数作为指引。政府部门可根据其指数的变化来判断房地产市场的走势,决定未来的政策取向,以防止房地产泡沫的发生,促进国民经济的持续、稳定和健康发展。房地产价格指数就是剔除非市场因素来反映市场因素引起的价格的变化,并以其简明的形式来表述价格变化,价格指数所反映的市场信息因采用的编制方法和模型的不同而迥异。本文采用基于特征价格理论的房地产指数的编制,运用支持向量机挖掘出各档次特征变量与价格的关系,并以成交量为权重,最终得到各档次比较价格。为政府部门进行宏观调控以及消费者判断市场走势提供理论依据和实践指导。   二、建立基于支持向量机模型二手房价格指数    (一)相关理论基础    特征价格模型是用来处理异质产品差异特征与产品价格之间关系时广泛使用的一种模型。消费者购买商品所产生的效用,实际上是商品各个特征所包含效用的集合,商品特征越多,其效用就越大。商品的每一个特征对应着一个价格,这个价格无法用市场价格来衡量,它对应的是该特征的品质。每个特征对应的价格就是特征价格。特征价格指数是编制异质商品价格指数的一种常用方法,尤其在西方发达国家的房地产价格指数的编制中被普遍采用。国外学界的许多研究者对利用特征价格理论编制房地产价格指数的问题进行了诸多有价值的理论和实证研究,这些研究为准确衡量住宅市场的发展提供了有力的支持[1]。我们在基于特征价格原理的基础上用支持向量机来进行指数的编制。    支持向量机回归法[2]是以VC维理论和结构风险最小原理作为理论基础,根据有限的样本信息,对模型的复杂性和学习能力进行最优折衷,使其具有较好的推广能力。结构风险最小化的特点赋予了支持向量回归出色的泛化预测能力。因此,支持向量算法特别适合于预测领域的应用。另外,SVR[3]作为一种自然的非线性建模工具,具有很好的自适应功能,只需对样本信息不断进行训练,无须知晓方程的非线性方式,非常适合于解决先验知识不清楚、无规则多约束条件的应用问题,操作起来非常便捷快速,克服了传统观测方法信息获取间接、费时且效率低下的缺点。    (二)基于特征价格理论的变量选取    从特征价格指数理论要求出发,影响二手房价格的因素[4]归纳为三类:区位因素、建筑内部因素、邻里环境因素。区位因素主要包括距区中心距离,建筑内部因素主要包括建筑面积、楼层、总楼层、装修、容积率、建筑年代。邻里环境因素主要包括周边配套设施情况。在这些物理属性中,不是每个特征对二手房的价格都有贡献。通过专家法,结合数据搜集的难易程度,我们最终确定进入支持向量机模型的特征变量为建筑面积、楼层、总楼层、装修、建筑年代、距区中心距离,二手房挂牌价。    (三)变量数据的来源与处理    数据均来源于搜房网和安居客,这些数据包括建筑面积、楼层、总楼层、装修、建筑年代;用百度地图软件测量了每一区域住宅到区中心的直线距离。经过以上数据的搜集和整理,得到了2015年6月至2016年3月的各区域各楼盘以上特征完整的6000条案例数据。然后对数据进行量化处理,具体方式和过程为:对建筑面积、楼层、总楼层、建筑年代、距离直接采用原始数据,装修等级划分为五个档次,用分类变量表示。我们这里采用挂牌价代替成交价,是由于市面上成交数据难以获得,而且挂牌价与成交价存在一定的线性关系。    (四)标准住宅的选取   特征价格法编制房地产价格指数的核心思路在于以同质化的标准住宅的价格变化反映住宅市场的整体走势,因此需要选取在市场中最具一般性、代表性的住宅作为标准住宅。将最具典型性的一组特征组合在一起,形成标准住宅。对于近似符合对称分布的连续变量,如楼层、总楼层、建筑面积、建筑年代等取其平均值作为变量在标准住宅中的取值。对于离散变量,如装修档次取其众数值作为变量在标准住宅中的取值。    (五)二手房普通住宅品质档次的划分以及权重的确定    运用K均值聚类将重庆市二手房普通住宅分成高、中、低三个档次,确定每个档次的价格界限。将重庆市2015年6月至2016年3月搜集到的全部二手房挂牌价格通过聚类分成3类,即得到了每一类的价格边界,以此来对搜集到的每月数据进行物业品质档次的划分。

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档