- 2
- 0
- 约4.68万字
- 约 49页
- 2015-08-11 发布于江苏
- 举报
摘要
以政府决策为主题的数据挖掘系统是对呼叫中心数据库和政府各部门的统计
信息进行数据挖掘和规则提取,从而为政府各部门改进工作,提高为民办事效率
提供决策支持。要实现以政府决策为主题的数据挖掘系统,需要对呼叫中心和各部
门的统计信息数据进行预处理,然后对处理后的数据建立数据挖掘模型,最后对挖
掘后的数据模型进行评价与展示。
本文从学习数据挖掘的基础理论出发,研究发现,以政府决策为主题的数据
挖掘系统采用决策树算法来建立数据挖掘模型,决策树算法中最成功、影响最大
的是ID3算法。因而,本文首先重点学习了决策树的ID3算法,通过研究分析ID3
算法发现ID3算法存在两个缺点:1、ID3算法不能处理连续型数据。2、ID3算法
在选择分裂属性时倾向于选择属性取值多的属性。针对这两个缺点,本文提出了
一个改进的ID3算法,改进的算法提出一种预处理技术来处理连续型数据。另外
该算法还提出了利用信息增益率来选择分裂属性的标准。通过对新算法在测试样
例上训练得出的决策树分析,结果表明:
1、改进后的ID3算法能有效的提高分类的精度,改善了ID3算法选择分裂属
性时倾向取值较多的不足。
2、改进后的ID3算法能有效的处理连续型数据。
最后,本文将改进ID3算法应用于
原创力文档

文档评论(0)