- 2
- 0
- 约3.39千字
- 约 4页
- 2024-07-09 发布于上海
- 举报
Usingchemicalanalysisdeterminetheoriginofwines赵启杰S摘要
采用较简单的决策树归纳算法根据红酒的成分对其进行分类,划分度量采用的是Gini指标,所有数据都看做是连续属性,进行二元划分,最后得到的是一棵二叉决策树。最后采用二折交叉验证的方式,进行评估,得到的分类准确度在85%左右。
为了简单,没有考虑噪声的干扰,没有考虑模型的过分拟合问题,没有考虑泛化误差。
相关工作
算法的实现参考《数据挖掘导论》算法4.1的决策树归纳算法的框架。TreeGrowth(E,F)
ifStopping_cond(E,F)=truethenleaf=creatNode()leaf.label=Classify(E)returnleaf
else
root=creatNode()root.test_cond=find_best_split(E,F)
令V={v|v是root.test_co的nd一个可能的输出}for每个vinVdo
E ={e|root.test_cond(e并)=且v
v
child=TreeGrowth(E,F)
v
einE}
将child作为root的派生节点添加到树中,并将边(root--chi标ld记)为v
endforendifr
您可能关注的文档
- 机会是一笔财富.docx
- 机会是一种财富.docx
- 机能活动训练计划.docx
- 机票预订系统.docx
- 机器模具加工测量系统 英语翻译.docx
- 机器人活动室建设方案.docx
- 机器人讲解简介.docx
- 机器人瓦力分析和总结.docx
- 机器人制作分析和总结.docx
- 机械安装工试题库.docx
- 第一节 电阻和变阻器(讲义)物理沪科版2024九年级全一册.docx
- 第3节 质量的测量 (讲义) 物理沪科版(五四学制)2024 八年级上册.docx
- 第14讲 圆周运动(复习讲义)高考物理一轮复习.docx
- 暑假预习专题15 指数函数(20题型)新高一数学讲义(沪教版2020).docx
- 第二节 发电机是怎样工作的(讲义)物理沪科版2024九年级全一册.docx
- 4.18 东晋南朝政治和江南地区开发 教学设计 部编版七年级上学期历史.docx
- 2.5实验:用单摆测量重力加速度(表格式教学设计)物理人教版2019选择性必修第一册.docx
- 第49讲 沉淀溶解平衡及图像分析(讲义)高考化学复习讲义(新教材新高考).docx
- 旅游景区行业分析报告:内外兼修,多元创新.pdf
- Unit 1~2 单元语法知识点梳理 高二下学期期中考点(上教版2020选择性必修第二册).pptx
原创力文档

文档评论(0)