- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
?
HYPERLINK /xxinliu/article/details/7408742 机器学习10大经典算法
2012-03-29 20:35?14024人阅读? HYPERLINK /xxinliu/article/details/7408742 \l comments 评论(3)? HYPERLINK javascript:void(0); \o 收藏 收藏? HYPERLINK /xxinliu/article/details/7408742 \l report \o 举报 举报
HYPERLINK /tag/%e7%ae%97%e6%b3%95 \t _blank 算法 HYPERLINK /tag/google \t _blank google HYPERLINK /tag/%e7%bd%91%e7%bb%9c \t _blank 网络 HYPERLINK /tag/%e6%90%9c%e7%b4%a2%e5%bc%95%e6%93%8e \t _blank 搜索引擎 HYPERLINK /tag/%e4%ba%92%e8%81%94%e7%bd%91 \t _blank 互联网 HYPERLINK /tag/yahoo \t _blank yahoo
1、C4.5
机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。
从数据产生决策树的机器学习技术叫做决策树学习,?通俗说就是决策树。
决策树学习也是数据挖掘中一个普通的方法。在这里,每个决策树都表述了一种树型结构,他由他的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠对源数据库的分割进行数据测试。这个过程可以递归式的对树进行修剪。?当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。另外,随机森林分类器将许多决策树结合起来以提升分类的正确率。
决策树同时也可以依靠计算条件概率来构造。决策树如果依靠数学的计算方法可以取得更加理想的效果。
决策树是如何工作的
决策树一般都是自上而下的来生成的。
选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。
从根到叶子节点都有一条路径,这条路径就是一条“规则”。
决策树可以是二叉的,也可以是多叉的。
对每个节点的衡量:
1)????????通过该节点的记录数
2)????????如果是叶子节点的话,分类的路径
3)????????对叶子节点正确分类的比例。
有些规则的效果可以比其他的一些规则要好。
由于ID3算法在实际应用中存在一些问题,于是Quilan提出了C4.5算法,严格上说C4.5只能是ID3的一个改进算法。相信大家对ID3算法都很.熟悉了,这里就不做介绍。
????C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:
????1)?用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;
????2)?在树构造过程中进行剪枝;
????3)?能够完成对连续属性的离散化处理;
????4)?能够对不完整数据进行处理。
????C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。
来自搜索的其他内容:
C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法.?
??分类决策树算法是从大量事例中进行提取分类规则的自上而下的决策树.?
??????决策树的各部分是:?
????????????根:???学习的事例集.?
????????????枝:???分类的判定条件.?
????????????叶:???分好的各个类.?
§4.3.2?????ID3算法?
??1.概念提取算法CLS?
1)?????初始化参数C={E},E包括所有的例子,为根.?
2)???????IF?????C中的任一元素e同属于同一个决策类则创建一个叶子?????
??????????????节点YES终止.?
??????????ELSE?????依启发式标准,选择特征Fi={V1,V2,V3,...Vn}并创建?
??????????????????????判定节点?
划分C为互不相交的N个集合C1,C2,C3,...,Cn;?
3)?????对任一个Ci递归.?
您可能关注的文档
- 关于开展“安全生产示范矿井”达标建设实施方案的通知教材.doc
- 关于开展2014年度团员教育评议活动的通知教材.doc
- 关于开展第16届全国推广普通话宣传周活动的通知教材.doc
- 儿科护理学内容整理教材.doc
- 关于开展环境因素、危险源辨识与评价的通知教材.doc
- 儿科需要死记的内容教材.doc
- 关于开展全省煤矿企业煤炭生产许可证专项检查汇报教材.doc
- 儿童发展目标教材.doc
- 关于开展优秀主题班团活动的通知教材.doc
- 关于可口可乐公司的财务教材.docx
- 12.《为人民服务》课件(共22张PPT).pptx
- 重庆市万州区名校联盟2024-2025学年高三下学期第一次联合考试思想政治试题(含答案).pdf
- 浙江省宁波市九校联考2024-2025学年高一上学期期末物理试题(含答案).pdf
- 湖南省常德市汉寿县第一中学2024-2025学年高一上学期1月期末政治试卷(含答案).pdf
- 江西省多校2024-2025学年高二下学期3月联考思想政治试题(含答案).pdf
- 2024-2025学年云南省大理白族自治州民族中学高一下学期开学考试数学试卷(含答案).pdf
- 2024学年第二学期高一3月阶段考试 地理 学科试题卷.pdf
- 15.1 《谏太宗十思疏 》课件(共40张PPT)2024-2025学年统编版高中语文必修下册.pptx
- 统编版五年级语文下册第二单元快乐读书吧《红楼梦》推进课课件(共20张PPT).pptx
- 在全市社会工作部长会议上的讲话.docx
最近下载
- 2023~2024学年三年级下册语文期末模考试卷·创意情境 统编版.docx VIP
- 扬州地区部分县2025届全国卷Ⅱ数学试题中考模拟题解析(精编版)含解析.doc VIP
- 中国规范与菲律宾规范中风荷载计算比较研究参考.pdf VIP
- 学校党组织领导的校长负责制实施方案.doc VIP
- 人教版三年级数学下册第一次月考试卷第一二单元.doc VIP
- JBT14264-2022 高温纳电池性能要求和试验方法.pdf
- 2025年科尔沁艺术职业学院单招职业适应性测试题库参考答案.docx
- 北师大版小学一年级下册语文第一-六单元月考试卷2.doc VIP
- 中文大模型基准测评2024年度报告.pdf
- 金属非金属矿山重大事故隐患检查表(根据金属非金属矿山重大事故隐患判定标准(2022)编制).pdf
文档评论(0)