决策树分类算法的改进及其应用分析-improvement of decision tree classification algorithm and its application analysis.docxVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策树分类算法的改进及其应用分析-improvement of decision tree classification algorithm and its application analysis
application process, we integrate students’ essential information table and feedback table into new data set which is used to ID3 optimization algorithm. Finally, we derive decision tree and distill rules from decision tree. According to these rules, company Manager could more exactly make judgement and decision. And these rules could improve the benefit of company.Key Words: ID3 algorithm; variety bias; weight function; ID3 optimization algorithm; students’ renewal tuitionIV学位论文原创性声明声明:本人所呈交的学位论文,是本人在导师的指导下,独立进 行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外, 本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本 文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。 本人完全意识到本声明的法律结果由本人承担。论文作者签名:日期:年月日学位论文版权使用授权书本人完全了解云南财经大学有关保留、使用学位论文的规定,即: 学校有权保留并向国家有关部门或机构送交论文和论文电子版,允许 学位论文被查阅或借阅;学校可以公布学位论文的全部或部分内容, 可以采用影印、缩印或其它复制手段保存、汇编、发表学位论文;授 权学校将学位论文的全文或部分内容编入、提供有关数据库进行检 索。(保密的学位论文在解密后遵循此规定)论文作者签名:导师签名:日期:年月日日期:年月日第一章 绪论数据挖掘是一门诞生时间不长但已迅速发展的计算机分析技术。随着数据挖 掘理论的日趋成熟,其在商业领域中的应用也极其广泛,尤其是数据挖掘技术中 的决策树方法更是引起了工业界和学术界的广泛关注。本章主要介绍了课题研究 背景、国内外相关课题研究现状、课题研究内容及意义、论文组织结构等内容。第一节课题研究背景随着数据库技术的迅速发展以及数据库管理系统(DBMS)在各行各业中的 广泛应用,人们积累的数据也随着时间推移和业务发展而变得越来越多。据不完 全统计,1993 年全球数据存储容量约为 2000TB,2000 年增加到约 300 万 TB, 到 2008 年,这一数字已飙升至上亿 TB[1],不难想象,到现在,全球的数据存储 容量更是急剧膨胀。大量的历史数据背后隐藏着许多重要信息,人们希望对其进 行更高层次的处理和分析,从中找出有价值的模型和规则,以便辅助人们更好地 利用这些数据进行决策和研究。目前,DBMS 虽然可以高效地实现数据的录入、 编辑、查询、统计等基本功能,但无法提取数据背后所潜在的知识规则,也无法 根据现有数据信息来预测未来的发展趋势。正因为如此,导致了激增的数据库出 现“数据丰富,但知识匮乏”的现象。面对这种现象,在人们需求的呼唤下,数 据挖掘技术应运而生,并引起了信息产业界的极大关注,同时也被许多科研人员 看作是 DBMS 和机器学习方面的一个重要研究课题。经过多年的理论研究和实践,数据挖掘迅速发展成为一门多领域交叉学科, 涉及到数据库技术、人工智能、机器学习、神经网络、知识库系统以及统计学等 多个研究和应用领域[2]。数据挖掘的技术和方法也有很多,主要有决策树方法、 神经网络方法、粗糙方法、统计学方法和可视化技术等[3],这些技术和方法从不 同角度对历史数据进行数据挖掘和知识发现。由于常用于预测模型的决策树方法 具有分类速度快、精度高、生成的模式简单等优点,在诸多的数据挖掘技术中其 受到了许多研究者和软件公司的关注[4],它通过对大量历史数据进行有目的的分 类,从中找出潜在的、有价值的信息,以便用户准确地作出理想决策。在各个领域中,应用决策树方法进行知识发现的领域有很多,如制造业、医疗诊断、零售业等[5]。针对决策树方法的研究,在国外发展较快,而在国内则相对滞后,因此, 决策树分类方法的研究对数据挖掘技术有着很大的意义。目前,国际上最早具影响力的决策树方法是 1986 年由 J.Ross.Quinlan 等人提 出的 ID3 算法,ID3 算法的优点是:理论基础清晰、分类原理简单易懂、学习能 力强、适于处理大规模的学习问题,因此,ID3 算法一直是数据挖掘和机器学习 领域中的一个极好典范[2],然而,尽管最具影响力的 ID3
您可能关注的文档
- 经济欠发达中小城市商圈布局研究——以乌兰察布市为例-study on the layout of business circle in small and medium-sized cities with underdeveloped economy - taking wulanchabu city as an example.docx
- 经济欠发达地区农村最低生活保障制度研究——以秀山县为例-research on rural minimum living security system in economically underdeveloped areas - a case study of xiushan county.docx
- 经济全球化背景下中国汽车产业的区位竞争优势研究-research on the location competitive advantage of china's automobile industry in the context of economic globalization.docx
- 经济全球化下新生产网络和空间网络的理论与实证分析—以海尔为例-theoretical and empirical analysis of new production network and spatial network under economic globalization - taking haier as an example.docx
- 经济全球化时代我国粮食安全现状及对策分析-analysis on the current situation and countermeasures of china's food security in the era of economic globalization.docx
- 经济市场化与对外直接投资逆向技术溢出——基于中国省际面板数据的门槛回归分析-economic marketization and reverse technology spillover from foreign direct investment a threshold regression analysis based on china's provincial panel data.docx
- 经济全球化下新生产网络和空间网络的理论与实证分析——以海尔为例-theoretical and empirical analysis of new production network and spatial network under the economic globalization - taking haier as an example.docx
- 经济适用住房的经济可承受性研究--以西安市为例-study on the economic affordability of affordable housing - a case study of xi 'an city.docx
- 经济外交与战后日本经济崛起1945-1970-economic diplomacy and postwar japan's economic rise 1945 - 1970.docx
- 经济新常态下银行信贷风险管理研究——以某分行营业部为例-research on bank credit risk management in the new normal economy - taking the business department of a branch as an example.docx
- 决策树算法在人力资源管理中的应用分析-application analysis of decision tree algorithm in human resource management.docx
- 厥阴病体质心理学与临床证治规律分析-analysis of constitution psychology and clinical treatment law of jueyin disease.docx
- 具有执行器饱和的非线性切换系统的优化与控制分析-optimization and control analysis of nonlinear switching system with actuator saturation.docx
- 掘进巷道煤岩瓦斯流固耦合效应数值模拟分析-numerical simulation analysis of coal and rock gas fluid-solid coupling effect in tunneling roadway.docx
- 蕨麻多糖的提取工艺及抗辐射 抗氧化药理学研究-study on extraction technology and anti-radiation and anti-oxidation pharmacology of pteridium aquilinum polysaccharide.docx
- 爵士萨克斯乐手的基本演奏素质——如何更好的演奏爵士乐-basic performance qualities of jazz saxophone musicians - how to play jazz better.docx
- 军队汽车运输安全风险评估与控制分析-risk assessment and control analysis of military automobile transportation safety.docx
- 军队文职人员薪酬制度分析-analysis of salary system of military civilian personnel.docx
- 军队医院绩效机制的优化与实施——以x军区医院为例-optimization and implementation of performance mechanism in military hospitals - taking x military hospital as an example.docx
- 军队医院军人门诊服务保障模式及评价指标体系的分析-analysis of military outpatient service support model and evaluation index system in military hospitals.docx
文档评论(0)