数据挖掘及其在房地产评估中应用.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

数据挖掘及其在房地产评估中的应用 (刘 飞张栋梁) 摘要:数据挖掘一般指从海量的数据中挖掘出可能有潜在价值信息的技术。这些具有潜在 价值的数据可以为企业带来利益或者为相关数据分析、数据研究中找到突破点。近年来数据 挖掘在各行业中都起到了很大的作用,在房地产评估中也日趋明显。利用数据挖掘的方法可 以从大量的房地产评估或与之相关的数据中发现有价值、有意义的信息,经过成果应用,提 高公司核心竞争力,提高公司决策水平。因此,本文主要介绍了数据挖掘方法的定义、步骤 和基本流程,该方法在房地产评估行业中的应用及其在未来的发展方向。 关键词:数据挖掘、应用、房地产评估 一、数据挖掘概述 (一)数据挖掘的定义 数据挖掘是指从存放在数据库、数据仓库或其它信息库中的大量数据中发现、提取有价 值信息的过程。数据挖掘是一项综合技术,一般涉及计算机技术、数据库、信息学、统计学 等多个领域,不同研究者从自身的领域出发,对数据挖掘的含义有着不同的理解。 (二)数据挖掘的步骤 数据挖掘阶段首先要确定挖掘的对象或目的,如数据总结、分类、聚类、关联规则或序 列模式等。然后根据挖掘对象、任务进行数据收集、调用,根据数据的类型、质量、完整度 等情况,对数据进行预处理,其次根据数据的质量结合数据挖掘的目的,选择合适的算法模 型。最后对数据挖掘成果进行评价,以确定数据的可用性、准确性,从而对最终的数据结果 进行评估、展示。 (三)房地产评估中的数据类型[1] (1)区域类型:一般根据行政界线进行划分;还可以根据约定区域、商圈进行板块的 划分。 (2)产品类型:房地产市场交易的产品类型可以分为住宅、办公、商业、厂房等;从 产品的性质可以分为新增商品房、存量商品房及政策性住房。 (3)时间类型:房地产市场交易的时间分隔可以分为年、季、月、旬、周等。 (4)计算单位类型:房地产市场的计算单位可以有房屋的套数、面积、价格等。 (5)房屋类型:房屋总楼层、房屋类型、居室、配套等。 (6)其它:交通、环境、政策及其它。 121 利用数据挖掘的理论和方法,通过以上等各种类型的数据可以得到房地产市场的许多数 据挖掘结果实例,如商品房市场供应情况、商品房市场交易量情况、购房对象结构统计、抵 押贷款情况统计、存量住宅转让情况统计、各类宏观统计数据汇总等。 (四)数据挖掘的方法及模型 目前数据挖掘工具都提供多种可供选择的数据挖掘算法,因为一种算法不可能完成所有 的不同类型的数据挖掘任务,同一种数据挖掘方法也不可能应对所有的数据运算需求。根据 某一特定的问题或任务,结合数据本身的复杂程度、信息量的多少、信息完整程度、类型特 点,选择数据挖掘的最佳方法。 数据挖掘有很多实现方法,这些方法不仅需要特定的数据结构,而且需要特定的算法, 这就意味着建模过程要适用于现有的数据。尤其要适用于大量动态数据变更的动态数据库。 目前主要使用的有神经网络、决策树和遗传算法。 (1)神经网络模型 神经网络模型是一个计算模型,由三部分组成:定义神经网络数据结构的神经网络图、 指明学习将如何进行的学习算法和确定如何从网络中获取信息的抽取技术。 (2)决策树 决策树是根和每个内部节点都被标记为一个问题的数。从每个节点引出的弧代表该节点 相关联的问题的可能答案。每个叶节点代表对问题解决方案的一个预测。 决策数模型是一个计算模型,由三部分组成:定义的决策树、创建树的算法和将树应用 于数据并解决所考虑问题的算法。大多数决策树技术随树的创建过程不同而不同。 (3)遗传算法 遗传算法是给出一个问题潜在解的种群,进而计算用新的更好的潜在解,扩展该种群。 在数据挖掘中,遗传算法可以用于聚类、预测甚至关联规则。可以认为这些技术是从一组表 示数据的模型中发现“最适应的”模型。研究中假设一个起始模型,经过对模型进行多次迭 代、合并,从而产生新的模型。由适应度函数确定的最好的模型被输入下一次迭代中。算法 在如何表示模型、模型中的不同个体如何合并以及如何使用适应度函数都有所不同,一般会 根据数据的情况单独对待。 (五)数据挖掘的工具[2] 数据挖掘工具根据其适用的范围分为两类:专用挖掘工具和通用挖掘工具 专用数据挖掘工具是针对某个特定领域的问题提供解决方案,在涉

文档评论(0)

ygeorcgdw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档