- 13
- 0
- 约3.88千字
- 约 45页
- 2016-12-09 发布于重庆
- 举报
3第三章决策树很详细的算法介绍
* * * * * * * * * * 计算各属性的信息增益 * * 第四步:决策树 * * 案例2:银行违约率 * * * * 案例3 对电信客户的流失率分析 * * 数据仓库 条件属性 类别属性 客户是否流失 案例4:在银行中的应用 * * 案例5:个人信用评级 * * 个人信用评级决策树 (五)其他算法 * C4.5与C5.0算法 Gini Index算法 CART算法 PRISM算法 CHAID算法 * 1、C4.5与C5.0算法 * C5.0算法则是C4.5算法的修订版 ,适用在处理大数据集,采用Boosting(提升)方式提高模型准确率,又称为Boosting Trees,在软件上的计算速度比较快,占用的内存资源较少。 * 类别属性的信息熵 2、Gini Index算法 * ID3 and PRISM适用于类别属性的分类方法。 Gini Index能数值型属性的变量来做分类。着重解决当训练集数据量巨大,无法全部放人内存时,如何高速准确地生成更快的,更小的决策树。 * 集合T包含N个类别的记录,那么其Gini指标就是 如果集合T分成两部分N1 和 N2。则此分割的Gini就是 提供最小Gini split就被选择作为分割的标准(对于每个属性都要经过所有可以的分割方法)。 Gini Index算法 * * 案例:在汽车销售中的应用 * * * * * *
您可能关注的文档
最近下载
- 新时代不忘初心党员担当作为ppt模板.pptx VIP
- 天津华宁KBZ3300/1140组合开关说明书.pdf VIP
- 材料科学与工程基础》顾宜第四章课后答案.pptx VIP
- 2026年湖南有色新田岭钨业有限公司招聘备考题库及一套答案详解.docx VIP
- 2026年北京舞蹈学院辅导员招聘备考题库必考题.docx VIP
- 2025年北京舞蹈学院辅导员考试笔试题库最新.docx VIP
- 2025年福建省中小学教师招聘考试教综真题及答案 .pdf VIP
- CNAS-CL02-2012《医学实验室质量和能力认可准则》.pdf VIP
- 2023年卫生人才评价-中级临床医学工程技术考试历年真题荟萃带答案.docx VIP
- 企业首席质量官职业技能竞赛竞赛题库及答案.docx
原创力文档

文档评论(0)