- 17
- 0
- 约5.21千字
- 约 36页
- 2016-11-23 发布于北京
- 举报
2016决策树算法
该检验所获得的信息系数F(F=13/14)修正: Gain(x1)=13/14(0.961-0.747)=0.199 该值比上个例子的值0.216小。然后,该分区信息仍是根据整个训练集来确定的,而且更大,因为对未知值有一个额外的类别。 Split-info(xi) =-(5/14log(5/14)+3/14log(3/14) +5/14log(5/14)+1/14log(1/14))=1.876 另外,每个样本都有一个相关的新参数,即概率。显然,当一个值已知的样本从T分配给Ti时,它属于Ti的概率是1,属于其他所有子集的概率是0。 当一值是未知时,只能得出不稳定的概率描述。因此C4.5和每个子集Ti中的每个样本是用权重w联系起来的,它表示属于每个子集的样本概率。 为了使该解决方法更具一般性,必须认为分区前样本的概率并不总是等于1。因此,分区后丢失值的新参数wnew为: wnew=wold·P(Ti) 对于属性1的检验x1分区结果,丢失值的记录将被表示在3个子集中。如图7-7所示。 因为最初的(旧的)w值等于1,新的权值wi等于概率5/13,3/13,和5/13。在C4.5中,Ti的算式如下: |T1|=5+5/13, |T2|=3+3/13, |T3|=5+5/13 对
您可能关注的文档
- 2016关于青春的.ppt
- 2016其他 资料 胜任素质简介.ppt
- 2016典型火灾案例.ppt
- 2016养生保健讲座.ppt
- 2016内审员 管理要求部分.ppt
- 2016内审员培训 .ppt
- 2016内科护理学试题及答案.doc
- 2016内蒙古商贸职业学院邀请函.doc
- 2016内衣价格模板.ppt
- 2016内部控制.doc
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 指导老年人正确使用手杖老年护理意外防护课件.pptx VIP
- 2026年3月武汉三调数学全解析.docx
- GZ054 数字艺术设计赛题B卷-2023年全国职业院校技能大赛赛项正式赛卷.pdf VIP
- 06J505-1 外装修(一)(规范).pdf VIP
- 2022年初级银行从业资格《公司信贷》考试真题试卷(含答案).docx VIP
- 国外航运政策之日本航运政策--第十三周.pdf VIP
- 2024年第十届全国新世纪杯初中数学优质课大赛 课件 说课4.pdf VIP
- 冰冻及常规取材规范中南大学湘雅医院郑长黎.pptx VIP
- 52 非线性泛函分析 [郭大钧 编著] 2015年版.pdf VIP
- 2025年浙江交通职业技术学院高职单招综合素质考试题库及答案解析.docx VIP
原创力文档

文档评论(0)