数据挖掘十大经典算法教程
数据挖掘十大经典算法
?一、 C4.5??C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. ? C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:??1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;??2) 在树构造过程中进行剪枝;??3) 能够完成对连续属性的离散化处理;??4) 能够对不完整数据进行处理。??C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。
1、机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则?对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。??2、 从数据产生决策树的机器学习技术叫做决策树学习, ?通俗说就是决策树。??3、决策树学习也是数据挖掘中一个普通的方法。在这里,每个决策树都表述了一种树型结构,他由他的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠对源数据库的分割?进行数据测试。这个过程可以递归式的对树进行修剪。当不能再进行分割或一个单独的类可以被应用于某
您可能关注的文档
- 数据库安全实验二教程.doc
- 数据库大作业报告教程.doc
- 数据库实验一教程.docx
- 数据库实验三报告教程.doc
- 2009年河北省中考理综试题要点.doc
- 数据库实验报告一教程.doc
- 2009至2016历年广西南宁市中考历史试题要点.docx
- 数据库上机考试预习报告教程.docx
- 数据平台系统项目_技术方案教程.doc
- 数据库实验4教程.docx
- 近三年个人工作总结.docx
- 组织生活会个人检视剖析材料.docx
- 2026年春江苏开放大学中国政治思想史050006形成性考核作业一答案.pdf
- 2026年春江苏开放大学中国政治思想史050006形成性考核作业二答案.docx
- 近三年个人工作总结.doc
- 2026年春江苏开放大学生活中的经济学060057综合作业一答案.doc
- 2026年春江苏开放大学中国政治思想史050006形成性考核作业二答案.doc
- 2026年春江苏开放大学商务笔译060758第一次过程性考核作业答案.docx
- 2026年春江苏开放大学生活中的经济学060057综合作业二答案.doc
- 2026年春江苏开放大学商务笔译060758第一次过程性考核作业答案.pdf
最近下载
- 2014款英菲尼迪Q50_汽车使用手册用户操作图解驾驶指南车主车辆说明书电子版.pdf
- 超星尔雅学习通《创新创业(同济大学)》2025章节测试附答案.pdf VIP
- 工程结算咨询服务方案.docx VIP
- 2023年度职业教育课题选题指南 .pdf VIP
- 混凝土灌注桩施工方案.doc VIP
- 预计总收入预计总成本确认办法.pdf VIP
- JB_T 14701-2024《工业设备设施用齿轮齿条式升降机 安全要求》.pdf VIP
- 钢制焊接石油储罐apistandard6505-6.pdf VIP
- 基于MATLAB的人脸识别系统研究与实现毕业论文.doc VIP
- 国企运营考试题及答案.doc VIP
原创力文档

文档评论(0)