- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于随机森林的合肥市城区商品房定价模型探索
安徽省统计局 过劲松、吴润青、徐群
摘 要
房地产定价方法是房地产经营过程中的核心与实务。如何定价既影响到房地产企业的销售和利润,也关系到消费者的切身利益。本文利用搜房网、365地产网及百度地图卫星遥感等互联网数据,以目前合肥市城区在售的全部楼盘为研究对象,选取环线、公交、地铁、物业、绿化等15个变量,涵盖区位交通、楼盘品质、周边配套、邻近环境等内容,通过对楼盘均价建立随机森林算法模型,试图找出影响定价的主要因素对其模拟,并结合探索性分析对楼盘分类,建立判别模型。此外,基于模型的拟合结果,结合聚类对奇异点楼盘进行分析。结果表明,随机森林方法稳健性较高,有助于在房地产定价应用中提供参考。
关键词:房地产定价 随机森林 判别模型 互联网数据
一、问题的提出
房地产价格一直是大家关注的热点问题。为什么同一个城市,楼盘价格有高有低?为什么随着时间推移,有些楼盘价格持续看涨,有些却大幅促销?商品房作为老百姓的必需品,也是投资品,其价格的一涨一跌牵动着每一位消费者的心,也关系到社会的和谐和稳定。由于房地产资产规模较大,且具有较强的异质性、不易流动性、不可分割性,其交易信息与数据难以获得,致使对房地产资产的定价研究难度较大,房地产定价模型和方法的研究没有像房地产市场那样得到应有的重视和发展,国内外房地产定价的研究也不多,如何科学定价困扰了专家学者与业内人士。大多数房地产企业按照一般商品模式定价,然而,仅从开发成本角度考虑易导致定价偏低,有利于销售却未体现区位优势和投资潜力,过高的价格又会导致销售不佳。因此,房地产定价模型研究就成为房地产价格未来走势的重要工具。在当今大数据时代,互联网数据获取之便捷以及计算机应用的大量普及,让我们不禁思考,能否运用数据挖掘方法从从纷繁复杂的互联网数据中寻找到房地产定价的一般模式?
二、相关研究综述
在商品房定价时,定价人员必须考虑开发商成本,同时也要考虑一些相关因素,如楼层、建筑面积、区位、交通、物业管理等。传统的定价方法有:成本加利润法、市场价法和差别定价法。国内外学者以市场竞争、销售博弈、供求理论为基础,根据供需双方之间的市场博弈行为对房地产定价,以影响房地产价格的因素作用波动进行价格调节。2002年Leung B.Y.P,Hui E.C.M.以香港迪斯尼乐园为案例,把定价理论(OPT)运用到房地产定价的策略,阐述了这种定价策略方法的实际应用。2003年Francis K.Cheung,Shawn Ni和Alan Siu对于香港不稳定的房地产市场是否与基于消费者的资产定价模型相一致做出了分析。
近年来,部分学者将神经网络、随机森林、支持向量机等新技术运用到房地产价格评估。2001年NguyenNghiep得出了人工神经网络方法对住宅价格预测效果好于多元线性回归的结论,2010年K.C.Lama,C.Y. Yua和C.K.Lama使用支持向量机预测房产价格,并与多元回归、神经网络等方法进行比较。在国内, 2007年惠彦涛罗党?时亚楠 区位交通 环线位置、至城市中心乘车时间、公共交通、地铁规划 楼盘品质 装修水平、容积率、物业费标准、绿化率、楼层情况、建筑面积 周边配套 与邻近商圈距离、商场数量、配套设施 邻近环境 距公园湖山距离、区域环境得分
(三)数据来源及预处理
合肥市在售楼盘相关情况,包括均价、环线位置、公共交通、地铁规划等12项变量数据均取自搜房网、合肥365地产家居网和合肥家园网,共计156个样本数据。至城市中心乘车时间、与离邻近商圈距离、距公园湖山距离3项变量数据取自百度地图,区域环境评分是基于合肥市环保局监测数据的综合评分。需要说明的是:
1.楼盘均价为2014年7月份当月价格。部分楼盘因销售尾盘大幅调整价格,我们对这些楼盘价格作了相应修正,采用了该楼盘本年度主要销售时间内的定价。
2.地铁规划、装修水平为虚拟变量,具有地铁规划或精装修为1,否则为0。环线位置分为一环内、二环内和二环外三级,相应地赋值为1分、0.8分和0.6分。配套设施包括幼儿园、小学、初中、高中、医院、银行六个分项,具备一项得0.1分,最高为0.6分。
3、我们以百度地图为工具,将合肥市传统意义上的市中心淮河路步行街作为终点坐标,查询各楼盘乘公交所花费的时间,记录为“至城市中心乘车时间”数据。选取包括环城公园、森林公园、植物园、蜀峰湾公园、大蜀山、天鹅湖等在内的多个公园、湖、山作为终点坐标,计算与附近楼盘间的距离,记录为“距公园湖山距离”数据。选取逍遥津、天鹅湖万达、明珠广场、双岗、滨湖世纪金源等多个重要商圈作为终点坐标,计算与附近楼盘间的距离,记录为“与邻近商圈距离”。
4、我们根据合肥市环保局的监测数据,对各区域绿化、空气、卫生、噪音进行评分。其中,政务区为第一档
文档评论(0)