决策树算法研究.doc

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树算法研究课案

摘 要 随着信息科技的高速发展,人们对于积累的海量数据量的处理工作也日益增重,需求是发明之母,数据挖掘技术就是为了顺应这种需求而发展起来的一种数据处理技术。 数据挖掘技术又称数据库中的知识发现,是从一个大规模的数据库的数据中有效地、隐含的、以前未知的、有潜在使用价值的信息的过程。决策树算法是数据挖掘中重要的分类方法,基于决策树的各种算法在执行速度、可扩展性、输出结果的可理解性、分类预测的准确性等方面各有千秋,在各个领域广泛应用且已经有了许多成熟的系统,如语音识别、模式识别和专家系统等。本文着重研究和比较了几种典型的决策树算法,并对决策树算法的应用进行举例。 关键词:数据挖掘决策树 Abstract With?the?rapid?development?of?Information?Technology,?people?are?facing?much?more?work?load?in?dealing?with?the?accumulated?mass?data. Data?mining?technology?is?also?called?the?knowledge?discovery?in?database,?data?from?a?large?database?of?effectively,?implicit,?previously?unknown?and?potentially?use?value?of?information?process. Algorithm of decision tree in data mining is an important method of classification based on decision tree algorithms, in execution speed, scalability, output result comprehensibility, classification accuracy, each has its own merits., extensive application in various fields and have many mature system, such as speech recognition, pattern recognition and expert system and so on. This paper studies and compares several kinds of typical decision tree algorithm, and the algorithm of decision tree application examples. Keywords: Data mining; decision tree;Compare 目录 第一章 绪论 5 第二章 文献综述 5 2.1 数据挖掘简述 5 2.2 决策树算法背景知识及研究现状 6 2.2.1 决策树算法描述 6 2.2.2关联分析决策树算法研究现状 7 第三章 决策树算法 7 3.1 CLS算法 7 3.2 ID3算法 9 3.2.1 信息量大小的度量 9 3.2.2 ID3决策树应用举例 10 3.3 C4.5算法 12 3.3.1 用信息增益率选择属性 13 3.3.2 处理连续属性值 13 3.3 树剪枝 14 3.4 weka平台的简述 14 第四章 决策树在学生成绩中的应用 14 4.1数据的预处理 14 4.2数据的训练集处理 16 4.3数据的校验和成绩分析 17 第五章 结论 18 参 考 文 献 I 无论在企业应用领域,还是在科学领域,数据挖掘技术有着广泛的应用价值。????? 在企业应用领域,用于制定好的市场策略以及企业的关键性决策。在商业面,?数据挖掘技术可以增强企业的竞争优势,缩短销售周期,降低生产成本,有助制定市场计划和销售策略,并已经成为电子商务中的关键技术。? 近年来,随着我国高等教育的飞速发展,高校的教学管理信息不断增多。教学工作信息化有了很大的进步,好多高校在管理学生和教师信息方面有了很好的方式。比如我校的教务系统,这些系统为老师和学生提供了很好的帮助。这些系统中积累了大量的数据。目前的这些数据库系统虽然基本上都可以实现数据的录入、修改、统计、查询等功能,但是这些数据所隐藏的价值并没有被充分的挖掘和利用,信息资源的浪费还是比较严重的。 为了提高教学质量,将数据挖掘技术引入到高校学生成绩分析中,对这些数据进行深入的挖掘和合理的分析,从而挖掘出传统的分析方法所无法得出的结论。进而利用分析结果引导教学的开展,从而有利于提高教学质量。 第二章 文献综述 数据挖掘作为一个新兴的多学科交叉应用领域,

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档