心理测量中数据挖掘课件
在本例中,如果根据年龄来划分,可以分为3个子集,它们的Gini系数分别为 于是可计算属性“年龄”的信息增益为: 采用类似的方法,可以计算属性“学生”的信息增益为: 采用类似的方法, 还可以计算属性“收入”、“信用等级”的信息增益, 然后从所有属性中找到信息增益最大的属性,将它作为划分的对象。 3.2.4决策树的剪枝 如果建立的决策树的构造过于复杂,则对应的知识规则将是难以理解和应用的, 因此对于决策树的建立,不仅需要考虑分类的正确性, 还要考虑决策树的复杂程度,即在保证一定的分类正确率条件下,决策树越简单越好。 最常用的决策树简化方法就是剪枝, 包括预剪枝与后剪枝。 预剪枝是预先设定某一相关阈值,决策树达到该阈值后就停止树的生长。 该方法比较简单,但预先指定阈值相当困难。 后剪枝是对已经建立的决策树 以一定的标准进行剪枝, 使决策树得以简化, 但仍具有一定的分类正确率。 CART算法采用后剪枝法。 具体方法为: 针对未经剪枝的决策树T,运用算法将其某一个或几个子树删除,得到新的决策树 j,然后对于多种不同剪枝的结果 j进行比较,找出最好的剪枝形式。 剪枝过程中删除的子树将用叶结点代替,这个叶结点所属的类 用这棵子树中大多数训练实例所属的类来代替。 4、来华留学生跨文化适应性测量的数据挖掘 我们通过问卷调查
您可能关注的文档
- 七年级历史辉煌隋唐文化2课件.ppt
- 七年级生物生物基本特征课件.ppt
- 七年级生物人体营养复习课件.ppt
- 三年级科学上册校园里植物课件.ppt
- 三角形特征课件.ppt
- 上消化道出血临床护理课件.ppt
- 上消化道大出血病人护理课件.pptx
- 下肢深静脉血栓形成护理课件.ppt
- 下肢深静脉血栓病人护理课件.ppt
- 下肢骨折康复课件.ppt
- 4.4 控制系统的设计与实施(教学设计)高中通用技术苏教版2019必修2.docx
- 2026届衡水市第十三中学高三第一次质量调研(一模)数学试题.doc
- 3.1.1关系数据结构及关系代数教学设计-浙教版高中信息技术选修三.docx
- 高考化学二轮复习 阿伏伽德罗常数.docx
- 运筹学期末复习完全手册(直接使用版).docx
- 人工肝治疗中的家属支持与护理.pptx
- 人工肝治疗后的康复护理.pptx
- 4 自由落体运动(表格式教学设计)高中物理人教版2019必修第一册.docx
- 第05讲 充分条件、必要条件、充要条件(八大题型)新高一数学(苏教版2019必修第一册).docx
- 29 古代诗歌文本比较鉴赏题(比较形象、语言、表达技巧、情感态度)高考语文二轮复习专题.docx
最近下载
- 17J927-1车库建筑构造1.pdf VIP
- TCECS465-2017 既有建筑绿色改造技术规程.pdf
- 2025届高三英语一轮复习之非谓语动词课件.pptx
- 2025四川省三支一扶招聘考试职业能力测验试题卷 (1).docx VIP
- 小学五年级数学混合运算计算专项练习题(每日一练,共23份).pdf VIP
- 2025北京东城区高一(下)期末化学试题及答案.pdf VIP
- 《GBT29404-2012灌溉用水定额编制导则》(2026年)实施指南.pptx VIP
- 小学二年级数学下册应用题专项练习题(每日一练,共9份).docx VIP
- 人教版九年级化学上册教材课后习题参考答案.pdf VIP
- 冀少版(2024新版)七年级上册生物跨学科实践活动:《饲养家蚕,了解我国的养蚕历史》教案.docx VIP
原创力文档

文档评论(0)