- 2
- 0
- 约3.88万字
- 约 52页
- 2019-03-30 发布于上海
- 举报
I
I
摘 要
数据挖掘作为当前的热门研究领域,已广泛应用于科学研究和商业预测等领 域,拟从大量的数据中提取潜在的、人们感兴趣的、有用的信息。数据分类是数 据挖掘的一个重要分支,按照一组数据对象的特征给出数据对象划分的过程。
本文研究的是基于决策树的分类技术。决策树学习采用自顶向下的递归方 式,类似于树的生长,经过层层分枝,最终形成若干个叶子结点,每个叶子结点 代表一个决策类别。
由于传统的决策树分类算法存在准确率低下的缺点,为了解决这一问题,本 文将人工遗传学和免疫学理论应用于决策树算法,提出了基于免疫遗传算法的决 策树分类算法。遗传算法是一种模拟达尔文的遗传选择和自然淘汰的生物进化过 程而形成的一种全局优化概率搜索算法。免疫遗传算法是将生物免疫机制原理引 入到标准遗传算法中,克服遗传算法的早熟收敛问题,提高全局搜索能力。
本文围绕免疫遗传算法理论及其在决策树的构造这一问题,开展研究工作, 并取得了较好的效果。
本文主要研究内容和工作成果如下:
(1)系统阐述了决策树学习算法的工作原理和实现方法,并分析了典型的 决策树算法之间的优缺点。
(2)详细阐述了遗传算法及免疫遗传算法的工作机理,比较了两种算法的 优缺点。
(3)将遗传算法应用到决策树分类方法中,利用遗传算法的全局搜索能力 及并行处理能力,以提高决策树算法收敛速率。同时考虑到决策树生成效果的评 价因素,提出了兼顾分类的准确度、支持度、简洁度、信息增益率的评价标准体 系,作为遗传算法的适应度。实例分析表明,遗传算法在精确度上高于传统的决 策树分类方法。
(4)提出了一种基于免疫遗传算法的决策树算法,该算法将免疫算子引入 到遗传算法中(包括抽取疫苗,接种疫苗,选择疫苗),以提高决策树分类的质 量和效率。实验结果显示,免疫算子的加入,提高全局搜索能力,确保快速收敛
II
II
基于免疫遗传算法的决策树分类研究于全局最优解。通过对基于免疫遗传算法的决策树算法与基于简单遗传算法的决
基于免疫遗传算法的决策树分类研究
策树算法的实验结果比较,表明基于免疫遗传算法的决策树算法在保证分类精确 度的同时,也使得产生的规则简洁易理解。
关键词:遗传算法;免疫算法;决策树;数据挖掘
PAGE
PAGE VI
Abstract
Data mining has become a very popular research field, which is widely used in scientific research, business forecast and so on. It tries to extract information of potential, interesting and useful. Classification is one crucial branch of data mining. It’s a process of giving data object partition according to the characteristics of a group of data objects.
This thesis aims to the classification techniques of decision tree. Decision tree learning using recursive top-down approach, it is similar to the growth of trees, through layers of branches, and it has formed a number of leaf nodes ultimately, each leaf node represents a decision-making categories.
Genetic algorithm is an overall random searching method based on the theory of Darwinian natural selection and biological evolution. Immune genetic algorithm is a proved algorithm because it has overcome the premature convergence of Genetic algorithm, and improved overall search capability
In this thesis, the immune genetic algorithm is applied to the generation of decision tree. It has
您可能关注的文档
- 基于生态位适宜度理论品牌空间扩张外部环境评价研究-企业管理专业论文.docx
- 基于通信业的物联网产业链培育及政策研究-企业管理专业论文.docx
- 基于胜任力模型的平煤神马集团专业人才建设方案研究-企业管理专业论文.docx
- 基于遗传规划的深基坑围护结构侧移预测方法-建筑与土木工程专业论文.docx
- 基于视频的人体运动分析的分析-通信与信息系统专业论文.docx
- 基于可拓理论的房地产投资决策分析-管理科学与工程专业论文.docx
- 基于生命周期理论的CQ银行个人理财产品营销策略研究-工商管理专业论文.docx
- 基于条件随机场的地理命名实体识别方法研究-地理学;地图学与地理信息系统专业论文.docx
- 基于神经网络的重庆市物流需求预测研究-企业管理专业论文.docx
- 基于生态服务价值的辽宁省土地利用优化配置分析-土地资源管理专业论文.docx
原创力文档

文档评论(0)