基于MVU的协同并置挖掘决策树算法研究-地质资源与地质工程专业论文.docxVIP

基于MVU的协同并置挖掘决策树算法研究-地质资源与地质工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万 万方数据 研究生学位论文独创性声明和版权使用授权书 独创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果 。 据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含他人已经发表或撰写 过的研究成果,也不包含为获得其它教育机构的学位或证书而使用过的材料。对论文的 完成提供过帮助的有关人员己在论文中作了明确的说明并表示谢意 。 学位论文作者(签字): 11:.才及民 签字日期: 3比生 tPr7fJ 学位论文版权使用授权书 本学位论文作者完全了解(学校)有关保留、使用学位论文的规定,有权保留并向国 家有关部 门或机构送交论文的印刷本和电子版本,允许论文被 查阅和借阅。本人授权 (学 校)可 以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用 影 印、缩印 或扫描等复制手段保存、汇编学位论文。同时授权中国科学技术信息研究所将本学位论 文收录到《中国学位论文全文数据库)) ,并通过网络向社会公众提供信息服务。(保密的 学位论文在解密后适用 本授权书) 本论文是否保密:是 在/ 如需保密,保密期限为 : 学位论文作者签名:以莱瓦 签字日期 : t{),延年 d 月 7 日 导师签字 : 摘 要 决策树归纳法是一种基于空间数据挖掘和知识发现的分类预测算法,适合用于发现 探测式知识,并具有易于人工解译、结构清晰明了、计算时间花费少以及能够处理噪声 等特点。它可以从大量的遥感影像数据中提取隐含的、预测未知的以及潜在有用的信息。 然而,从空间数据挖掘的角度来看,传统的决策树归纳法并没有考虑属性间的空间 关系,例如时空域中的空间协同并置(co-location)关系。为此,Zhou et al.(2012)利 用 co-location 技术来指导传统决策树的构建,提出了一种叫作 co-location decision tree, CL-DT 的归纳方法。CL-DT 算法利用欧氏距离来判断两个实例之间是否存在空间协同 并置关系。尽管当实例在三维(或更高维)空间属于线性分布时,欧氏距离能够有效地 表达实例间的实际距离,但是当实例在三维(或更高维)空间属于非线性分布时,欧氏 距离并不能反映出实例间的实际距离。为了解决 CL-DT 中存在的缺陷,本文在 CL-DT 算法的基础上对其做了改进,并提出了一种新的决策树归纳方法,即基于 MVU 的空间 协同并置挖掘决策树(MVU-based CL-DT)。MVU-based CL-DT 算法利用最大方差展开 算法(Maximum Variance Unfolding,MVU)对数据集进行“展开”,然后对“展开”后 的数据集中的实例进行“展开距离”的计算。由于 MVU 算法在展开数据集的时候,实 例间的邻近关系(距离和方向)并没有发生改变,这使得实例间的展开距离可以真实地 表达它们之间的距离。 本文对 MVU-based CL-DT 算法以及实现该算法的步骤进行了详细地描述。首先, 本文描述了利用 MVU 算法展开数据集以及计算实例间展开距离的详细过程;其次,本 文对 MVU-based co-location mining 算法进行了描述,在这一过程中,本文发展了一种混 合约束条件,即基于实例间展开距离的几何约束条件和不同事件类型的约束条件;最后, 本文专注于发展 MVU-based CL-DT 算法,主要包括非空间属性数据的选择、MVU-based co-location 算法模型、剪枝准则以及 MVU-based CL-DT 的归纳。在这一过程中,基于 MVU 的空间协同并置规则集被用来指导决策树的构建和决策规则的产生。 为了验证本文所提出的算法,MVU-based CL-DT 被用于遥感影像的分类。通过比 较本文所提出的算法和 CL-DT 算法得到的结果以及这两种决策树归纳方法的参数,本 文发现:(1)在两个测试区,通过本文所提出的算法所获得的遥感影像分类结果的总体 精度都高于 90%,而 CL-DT 算法所获得的遥感影像分类结果的总体精度都低于 90%。 (2)与 CL-DT 算法相比,树节点总个数、叶节点个数和层级数分别减少了 48%、45% 和 25%。(3)与 CL-DT 算法相比,数据处理用时、决策树生成用时、画树所用时间及 规则生成所用时间分别减少了 25%、38%、44%及 43%。 关键词:决策树,协同并置挖掘,流形学习,最大差异展开,展开距离 I Abstract Decision tree induction is a classification prediction algorithm based on data mining and knowledge discovery. It is capable of discov

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档