基于LightGBM和改进的XGBoost模型融合的深圳市二手房估价模型研究.pdf

基于LightGBM和改进的XGBoost模型融合的深圳市二手房估价模型研究.pdf

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要 摘 要 2000年以后,中国的房地产行业得到迅速发展,一手房和二手房交易量持续攀升,房 价也在不断上涨。相对于一手房,二手房具有更多的优势,比如周边的配套、商圈、交通、 医疗、学校等公共基础设施相对于一手房更加成熟,配套设施也更加完善。从2011年起, 二手房的销量超过了一手房,二手房交易越发频繁,并产生了大量的二手房交易数据。随 着大数据技术和机器学习技术的不断发展,从这些海量的二手房交易数据中分析房源与二 手房价格之间的关系,准确评估二手房的价格具有重要的意义。一方面,准确的估价为二 手房购买者提供可靠的价格参考,让房价回归理性,推动社会公平和谐;另一方面依据准 确的估价能有效减少双方的交易风险及矛盾,促进二手房交易双方和谐共赢,进而规范二 手房交易市场,促进房地产和谐发展。 本文基于Spark 大数据处理框架,将爬取的链家网站上2010年至2020 年深圳市二手 房交易的九万多条真实成交数据作为初始数据集,结合机器学习算法,建立了基于 LightGBM 和改进的XGBoost 的模型融合的深圳市二手房估价模型,提高了房价评估的准 确性,更好的适用于房地产价格评估。主要研究内容及创新点如下: (1)将POI (Point ofInterest)引入到数据集中,扩充了数据集,提高了房价评估精 确度。根据数据集中的经纬度,结合百度地图,对数据集进行POI 处理,使数据集更加符 POI POI 合现实意义。与未加入 的数据集评估结果相比, 数据集的加入使得评估结果更加 准确。 (2)改进了XGBoost 估价模型。基于网格搜索算法和K 折交叉验证改进了XGBoost 模型,找寻出XGBoost 估价模型中最合适的参数,有效地避免过拟合和欠拟合的发生,使 得房价评估精确度得到了提升。 (3)提出了基于LightGBM 估价模型和改进的XGBoost 估价模型相融合的二手房估 价模型。实验结果表明,LightGBM 估价模型和改进的XGBoost 估价模型进行模型融合, 可以得到比单个估价模型更好的评估效果,提高了深圳市二手房价格评估准确度。 大数据与机器学习算法相结合,克服了使用单一方法导致二手房房价评估精度低的缺 点。同时,加入的POI 增加了数据集的实际意义,提高了房价评估的精确度,丰富了二手 房价格评估的方法,为现代房地产评估提供了一种新方式。 关键词:模型融合,机器学习,兴趣点,二手房价格评估 I 目录 目录 摘 要I AbstractII 第1章 绪论1 1.1 研究背景和意义1 1.2 研究现状4 1.2.1 房屋价格评估方法研究现状4 1.2.2 房屋价格影响因素研究现状5 1.3 主要研究内容6 1.4 论文创新点7 1.5 论文组织结构8 1.6 本章小结8 第2章 相关技术理论基础9 2.1 Spark 框架9 2.2 机器学习模型10 2.2.1 多元线性回归模型12 2.2.2 随机森林模型13 2.2.3 CatBoost 模型15 2.2.4 LightGBM 模型16 2.2.5 XGBoost 模型18 2.3 本章小结21 第3章 数据分析处理22 3.1 数据获取22 3.2 数据清洗24 3.3 数据分析25 3.4 引入POI 维度31 3.5 特征选取33 3.6 本章小结34 第4章 深圳市二手房估价模型35 4.1 估价

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档