- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目 录
C4.5
k-means
SVM
支持向量机
拉格朗日对偶
最优间隔分类器
核函数
SMO算法详解
Apriori
EM
PageRank
AdaBoost
kNN
Naive Bayes
CART
本文档使用 看云 构建 - 2 -
C4.5
C4.5
数据挖掘学习笔记--决策树C4.5
来源 :http///u011067360/article/details
在网上和教材上也看了有很多数据挖掘方面的很多知识 ,自己也学习很多 ,就准备把自己学习和别人分享
的结合去总结下 ,以备以后自己回头看 ,看别人总还是比不上自己写点 ,及时有些不懂或者是没有必要。
定义 :分类树 (决策树 )是一种十分常用的分类方法。他是一种监管学习 ,所谓监管学习说白了很简单 ,
就是给定一堆样本 ,每个样本都有一组属性和一个类别 ,这些类别是事先确定的 ,那么通过学习得到一个
分类器 ,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。分类本
质上就是一个map的过程。C4.5分类树就是决策树算法中最流行的一种。
算法简介 :
1. Function C4.5(R:包含连续属性的无类别属性集合,C:类别属性 ,S :训练集 )
2. /*返回一棵决策树*/
3. Begin
4. If S为空,返回一个值为Failure的单个节点;
5. If S是由相同类别属性值的记录组成,
6. 返回一个带有该值的单个节点;
7. If R为空,则返回一个单节点,其值为在S的记录中找出的频率最高的类别属性值 ;
8. [注意未出现错误则意味着是不适合分类的记录] ;
9. For 所有的属性R(Ri) Do
10. If 属性Ri为连续属性 ,则
11. Begin
12. 将Ri的最小值赋给A1 :
13. 将Rm的最大值赋给Am ;/*m值手工设置*/
14. For j From 2 To m-1 Do Aj A1+j*(A1Am)/m;
15. 将Ri点的基于{ Aj,Aj}的最大信息增益属性 (Ri,S)赋给A ;
16. End ;
17. 将R中属性之间具有最大信息增益的属性 (D,S)赋给D;
18. 将属性D的值赋给{dj/j 1,2...m} ;
19. 将分别由对应于D的值为dj的记录组成的S的子集赋给{sj/j 1,2...m};
20. 返回一棵树,其根标记为D;树枝标记为d1,d2...dm;
21. 再分别构造以下树 :
22. C4.5(R-{D},C,S1),C4.5(R-{D},C,S2)...C4.5(R-{D},C,Sm);
23. End C4.5
Function C4.5(R:包含连续属性的无类别属性集合,C:类别属性 ,S :训练集 )
/*返回一棵决策树*/
Begin
If S为空,返回一个值为Failure的单个节点;
If S是由相同类别属性值的记录组成,
返回一个带有该值的单个节点;
If R为空,则返回一个单节点,其值为在S的记录中找出的频率最高的类别属性值 ;
[注意未出现错误则意味着是不适合分类的记录] ;
For 所有的属性R(Ri) Do
If 属性Ri为连续属性 ,则
本文档使用 看云 构建
您可能关注的文档
最近下载
- 大型会议会务工作流程清单(培训讲学版).docx VIP
- 零碳园区水资源循环利用方案.docx
- DB35∕T 836-2015 学生服装标准规范.docx VIP
- 心力衰竭病人的护理(完整版) .pptx VIP
- 明配管支吊架的计算表.xls VIP
- 活动一《塑料制品大点兵》课件 沪科黔科版综合实践活动二年级上册.pptx VIP
- 社区教育考试题及答案.doc VIP
- 污水处理优化软件:SuperPro Designer二次开发_(5).设备与物料流管理.docx VIP
- MSS SP-25中文 国外国际规范.pdf VIP
- 医院信息互联互通标准化成熟度测评方案(2025年版).docx VIP
原创力文档


文档评论(0)