- 33
- 0
- 约4.56千字
- 约 9页
- 2019-02-18 发布于广东
- 举报
上海市商品住房价格分布及其影响因子分析
[摘要]近些年,上海市商品住宅的价格增长迅速,成为拉动内需、带动经济增长的支柱性产业。但是,若任其发展,将在一定程度上影响房地产市场健康发展的持续稳定,影响宏观经济和社会稳定。虽然政府相关部门出台了一系列调控措施,如房产税、户口限制等,但“购房热”“买房难”依然是持续影响百姓生活的重大问题。也正因为多数新房价格昂贵,大多数人会选择购买二手房,那么,二手房的房价走势是一个很值得研究的问题。文章主要通过对数量指标进行数据整理与清洗,并运用动态聚类法完成多元线性回归模型的构建。通过构造合理准确的多元线性回归模型来预测出较为客观的上海市二手房房价走势。
网:m
[关键词]商品住宅价格;线性回归模型;房价预测;二手房
[]/2018.02.042
1引言
在我国观念的影响下,房地产业是每位我国国民几乎都会进行消费的重要产业,是推动国民经济增长的关键组成部分,[1]但由于房价泡沫等一系列因素导致房价陷入持续性飙升的“怪圈”。这种奇怪现象说明了对房地产业的研究和房屋价格走势预测刻不容缓。[2]由图1可知,上海的商品住房价格走势一直呈现上升态势。随着更多的流动人口进入上海,住房的需求会越来越大。然而,在房价居高不下致使大多数人买不起房的情况下,房价依旧持续走高,不但加重了居民购房的负担,还可能造成诸多经济、社会问题,[3]所以,住房问题日渐成为我国的问题,引起中央与地方政府的高度关注。虽然国家出台了一系列宏观调控政策,但是效果并不是特别明显。[4]上海作为国家经济发展的重要城市,对上海市商品房价格走势的预测,有着一定的现实意义。
2012年,张小富、侯纲发表题为“基于多元线性回归模型的西安住宅价格泡沫研究”的文章,其中通过构建多元线性回归方程分析多种因素对房价的影响。2013年,卢小涛对上海房地产业与区域经济相关性研究,发现房地产业发展对其区域经济的带动作用更为显著。2015年,LisiG和IacobiniM通过对意大利房产数据进行分析,构建模型进而对房地产进行较为合理的估价,此模型对世界各地房地产普遍适用。本文中,笔者将通过对变量进行处理,构造多元回归线性模型,运用更为准确的方式分析上海市二手房价格的变动因素及发展趋势。[5]见图1。
2数据的获取与分析
2.1数据的获取
本文主要以链家网为例通过python编写代码获取相应的已成交二手房信息。[6]其中所需的有效信息为上海各个区域下每套二手房的所在区域、小区名称、户型、面积、成交日期、售价、楼层(分区)、朝向、单价及建造日期。(注:获取的成交数据建造日期存在部分,通过与未成交数据匹配可以尽量弥补所缺少的建造日期),获取数据整理成如图2所示的格式(共24036套)。
2.2数据的整理与分析
2.2.1上海各地区二手房的均价
各区近期房价如图3所示,上海二手房价格最高的三个地区为:静安、黄浦和徐汇,均价都在7万元以上,房价较低的三个区为:金山、崇明和奉贤,均价都在2万元左右。
2.2.2二手房的户型和档次的分布
从图4中不难看出,户型分布数据的长尾向右延伸,属于严重的正偏态分布。所以,考虑将600套以下的户型统统归为一类,以此减轻长尾现象。如图5所示。
2.2.3二手房的面积和成交价格的正态性检验
核密度估计是对直方图的一个自然拓展。
QQ图是由标准正态分布的分位数为纵坐标,样本值为横坐标的散点图,利用QQ图可以判断数据是否近似符合正态分布,只需看QQ图上的点是否近似地在一条直线附近,该直线的斜率为标准差,截距为均值。
PP图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。利用PP图可以判断数据是否符合正态分布。当数据符合正态分布时,PP图中各点近似呈一条直线。[7]
显然,获取到的数据的面积和成交价格均不满足正态分布,那么就无法直接对数据进行方差分析或构建线性回归模型。通过上述方法检验发现,二手房的面积和成交价格均不符合正态分布。详见图6和图7。
3多元线性模型的构建
3.1相关分析
动态聚类法又称逐步聚类法,其基本思路为,起初进行粗略分类,然后依据最优原则将原本不合理的分类进行调整,进而形成最终聚类。此方法较为简便,占用内存较少,所以更适用于大样本的聚类分析。其中最常用的为kmea函数。由于获取到的数据属于大样本范畴,本文将采用此算法进行聚类。[8]
第一,用房子的单价(danjia)和面积(mianji)这两个变量对楼盘进行聚类分析,用K均值聚类,分成四类,进行显组间比较,结果差异显著,有意义。[9]聚?数量分布表――每个聚类中的个案数量见表1,方差分析表―ANOVA见表2。
第二,根据每个类别的单价,面积的平均值,以及各个类别在区域、朝向、户型的分布情况。[10]四个楼盘的类别是以下几类。
第一类:大户型,楼盘的面积最大,价格最高
原创力文档

文档评论(0)