基于决策树的信息物理融合系统数据处理方法研究-软件工程专业论文.docxVIP

  • 2
  • 0
  • 约5.39万字
  • 约 60页
  • 2019-03-30 发布于上海
  • 举报

基于决策树的信息物理融合系统数据处理方法研究-软件工程专业论文.docx

万方数据 万方数据 南京邮电大学学位论文原创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。 研究生签名: 日期: 南京邮电大学学位论文使用授权声明 本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文 档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索; 可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质 论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。 涉密学位论文在解密后适用本授权书。 研究生签名: 导师签名: 日期: 摘要 信息物理融合系统中的数据一般来源于物理设备对于现实世界信息的采集,数据往往具 有现实意义。在使用数据挖掘的决策树算法对其进行分类预测时,不同的错误分类往往会造 成不一样的代价损失,本文将代价敏感和决策树相结合以解决此类代价损失的问题,同时使 用遗传规划进行优化处理,解决信息物理融合系统数据量过于庞大时,决策树分类器的构建 耗时过多的问题。 本文提出了基于代价敏感的 ConSenDT 方法。该方法利用集成分类器的技术构建多个决 策树基分类器,通过概率论中的贝叶斯公式计算最小风险来修改类标号,再用修改后的数据 建立最终的决策树分类器。其中在计算最小风险的时候,考虑到了每个决策树基分类器的预 测准确率所带来的影响,将分类器的准确率作为一个参数加入到最小风险的计算过程中。实 验表明 ConSenDT 方法可以达到在保证分类准确率的基础上,避免代价高的错误分类情况的 出现,减少错误分类的代价损失。 本文利用遗传规划对 ConSenDT 方法加以优化提出了 ConSenDT-GP 方法。该方法通过选 择、交叉运算操作,留下适应度值较高的几个基分类器作为最终的基分类器。在对数据进行 修改类标号操作时,该方法规定只有当最终的基分类器类别判定不一致时才需要根据最小条 件风险来修改类标号。实验表明当数据集过于庞大时,改进的方法可以有效的减少最终决策 树分类器构建所消耗的时间,同时可以做到具有较少的代价损失和较高的分类准确率。 关键词: 信息物理融合系统,数据挖掘,决策树,代价敏感,遗传规划 I Abstract The data in the Cyber-physical systems is generally derived by the physical device from the real world.And the data often has a realistic significance. When use decision tree to classify the data different error classification result in different cost loss. In this thesis we combine cost-sensitive and decision tree to solve this kind of problem. In addition, when the amount of data is too large, the construction of the final decision tree classifier will consume too much time, so we will use genetic programming to optimize it. In this thesis, we present a method callede ConSenDT. This method uses the ensemble classifier technology to built some based decision tree classifiers, and uses bayesian formula to calculate the minimum risk classification rules to modify the class label. Then we use the modified data to built the final decision tree classifier. When calcula

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档