决策树分类算法的改进及其应用分析-improvement of decision tree classification algorithm and its application analysis.docxVIP

决策树分类算法的改进及其应用分析-improvement of decision tree classification algorithm and its application analysis.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树分类算法的改进及其应用分析-improvement of decision tree classification algorithm and its application analysis

application process, we integrate students’ essential information table and feedback table into new data set which is used to ID3 optimization algorithm. Finally, we derive decision tree and distill rules from decision tree. According to these rules, company Manager could more exactly make judgement and decision. And these rules could improve the benefit of company.Key Words: ID3 algorithm; variety bias; weight function; ID3 optimization algorithm; students’ renewal tuitionIV学位论文原创性声明声明:本人所呈交的学位论文,是本人在导师的指导下,独立进 行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外, 本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本 文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 本人完全意识到本声明的法律结果由本人承担。论文作者签名:日期:年月日学位论文版权使用授权书本人完全了解云南财经大学有关保留、使用学位论文的规定,即: 学校有权保留并向国家有关部门或机构送交论文和论文电子版,允许 学位论文被查阅或借阅;学校可以公布学位论文的全部或部分内容, 可以采用影印、缩印或其它复制手段保存、汇编、发表学位论文;授 权学校将学位论文的全文或部分内容编入、提供有关数据库进行检 索。(保密的学位论文在解密后遵循此规定)论文作者签名:导师签名:日期:年月日日期:年月日第一章 绪论数据挖掘是一门诞生时间不长但已迅速发展的计算机分析技术。随着数据挖 掘理论的日趋成熟,其在商业领域中的应用也极其广泛,尤其是数据挖掘技术中 的决策树方法更是引起了工业界和学术界的广泛关注。本章主要介绍了课题研究 背景、国内外相关课题研究现状、课题研究内容及意义、论文组织结构等内容。第一节课题研究背景随着数据库技术的迅速发展以及数据库管理系统(DBMS)在各行各业中的 广泛应用,人们积累的数据也随着时间推移和业务发展而变得越来越多。据不完 全统计,1993 年全球数据存储容量约为 2000TB,2000 年增加到约 300 万 TB, 到 2008 年,这一数字已飙升至上亿 TB[1],不难想象,到现在,全球的数据存储 容量更是急剧膨胀。大量的历史数据背后隐藏着许多重要信息,人们希望对其进 行更高层次的处理和分析,从中找出有价值的模型和规则,以便辅助人们更好地 利用这些数据进行决策和研究。目前,DBMS 虽然可以高效地实现数据的录入、 编辑、查询、统计等基本功能,但无法提取数据背后所潜在的知识规则,也无法 根据现有数据信息来预测未来的发展趋势。正因为如此,导致了激增的数据库出 现“数据丰富,但知识匮乏”的现象。面对这种现象,在人们需求的呼唤下,数 据挖掘技术应运而生,并引起了信息产业界的极大关注,同时也被许多科研人员 看作是 DBMS 和机器学习方面的一个重要研究课题。经过多年的理论研究和实践,数据挖掘迅速发展成为一门多领域交叉学科, 涉及到数据库技术、人工智能、机器学习、神经网络、知识库系统以及统计学等 多个研究和应用领域[2]。数据挖掘的技术和方法也有很多,主要有决策树方法、 神经网络方法、粗糙方法、统计学方法和可视化技术等[3],这些技术和方法从不 同角度对历史数据进行数据挖掘和知识发现。由于常用于预测模型的决策树方法 具有分类速度快、精度高、生成的模式简单等优点,在诸多的数据挖掘技术中其 受到了许多研究者和软件公司的关注[4],它通过对大量历史数据进行有目的的分 类,从中找出潜在的、有价值的信息,以便用户准确地作出理想决策。在各个领域中,应用决策树方法进行知识发现的领域有很多,如制造业、医疗诊断、零售业等[5]。针对决策树方法的研究,在国外发展较快,而在国内则相对滞后,因此, 决策树分类方法的研究对数据挖掘技术有着很大的意义。目前,国际上最早具影响力的决策树方法是 1986 年由 J.Ross.Quinlan 等人提 出的 ID3 算法,ID3 算法的优点是:理论基础清晰、分类原理简单易懂、学习能 力强、适于处理大规模的学习问题,因此,ID3 算法一直是数据挖掘和机器学习 领域中的一个极好典范[2],然而,尽管最具影响力的 ID3

您可能关注的文档

文档评论(0)

xyz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档