深圳大学研究生课程:模式识别理论与方法
课程作业实验报告
实验名称:Classification and Regression Tree
实验编号:Proj08-01
姓 名:萧嘉慰
学 号:2110130216
规定提交日期:2012年7月14 日
实际提交日期:2012年7月13日
摘 要:本实验编程实现了分类回归树算法,采用非剪枝完全树分类和进行进行非二叉分支。
实验内容:
写一个生成二叉分类树的通用程序,并使用课本 359页的表中的数据来训练该树,使用熵
不纯度进行分支。
(a) 采用非剪枝完全树分类下列模式:
{A,E,I,L,N}, {D,E,J,K,N}, {B,F,J,K,M}, {C,D,J,L,N}。
(b) 对叶节点进行剪枝,使剪枝后树的不纯度的增加尽可能小。
(c) 修改程序,使之可以进行非二叉分支,以生成多叉树。其中每个节点的分叉数可根据该节点
在训练时的情况进行自动确定。 用增益比不纯度重新训练生成一个新树, 并用该树重新对(a)进行分类。
技术论述:
分类回归树算法其采用基于最小距离的基尼指数估计函数, 这是因为基尼指数可以单独考虑子数据集中类属性的分布情况, 用来决定由该子数据集生成的决策树的拓展形状。CART创建简单二叉树结构对新事例进行分类, 这样可以有效地处理缺失数据, 尤其对于分类与预测时更好。并且 CAR
您可能关注的文档
- 幂函数的图像与性质与练习答题.doc
- 开关变压器答题.doc
- 绵竹项目组织计划答题.doc
- 开关磁阻电动机原理答题.ppt
- 开关电器典型灭弧装置的工作原理答题.ppt
- 苗木修剪自检表答题.doc
- 急性上消化道出血浅析.ppt
- 描述统计:表格与图形方法答题.doc
- 描写雪景的优美句子答题.doc
- 民法学摘要答题.doc
- DB31_T 1551-2025 企业集团安全生产管控基本规范.docx
- DB31_T 1670-2026 供应链质量管理数字化要求.docx
- 重点单位重要部位安全技术防范系统要求 第26部分:民用机场航站楼__DB31_T 329.26-2025-500积分.docx
- DB31 881-2024 涂料、油墨及其类似产品制造工业大气污染物排放标准.docx
- DB32_T 5363-2026 县级(区域)医疗资源集中化运行规范.docx
- DB23_T 3821—2024 黑龙江省超低能耗建筑用外门窗应用技术规程.docx
- DB31 T 838-2026,草坪主要害虫预测与防治技术规范.docx
- DB23_T 3813—2024 公路智能自助收费系统技术规范.docx
- DB31_T 1496-2024 火力发电企业碳管理要求.docx
- DB31_T 1586-2025 未成年人保护工作站建设和服务规范.docx
最近下载
- 西南交大MBA毕业论文答辩.ppt VIP
- 2025年12月(第1套)大学英语四级考试真题及答案.pdf VIP
- 铝合金的熔炼与铸造试题.doc VIP
- 贵州省六盘水市六枝特区2025年小升初模拟数学测试卷含解析.doc VIP
- 2023同步轻松练习道德与法治八年级下册答案,部编版道德与法治八年级下册 基本道德与法治制度 同步练习.doc VIP
- 智慧物流装备与应用 第1章 智慧物流装备概论.pptx VIP
- mba毕业论文答辩教学课件模板.ppt VIP
- 隧道施工组织设计方案.doc VIP
- C.0.1 工作联系单完整版.doc VIP
- 2023同步轻松练习道德与法治八年级下册答案.docx VIP
原创力文档

文档评论(0)