- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第11课决策树----以选西瓜为例构建决策树
决策树算法是一种基于树形结构的决策分析方法,其原理是通过一系列的判断和决策过程,将数据集进行分类或回归预测。具体来说,决策树算法通过递归地将数据集划分为更小的子集,并在每个子集上应用决策规则,从而构建出一个树形结构。决策树算法是一种基于树形结构的决策分析方法,通过递归地将数据集划分为更小的子集,并在每个子集上应用决策规则,从而构建出一个树形结构。其原理在于选择合适的特征进行划分,并构建出准确可靠的决策树结构。决策树算法的原理
决策树算法用途分类问题:决策树算法常用于分类问题,如垃圾邮件识别、疾病诊断等。通过构建决策树模型,可以根据输入的特征将数据划分为不同的类别。回归预测:除了分类问题,决策树算法也可以用于回归预测,如预测房价、股票价格等。通过构建决策树模型,可以根据输入的特征预测连续的输出值。
决策树算法用途3.特征选择:决策树算法在特征选择方面也有很好的应用。通过计算特征的信息增益、增益率或基尼系数等指标,可以选择出对数据集分类或回归最有影响的特征。4.数据挖掘:决策树算法可以用于数据挖掘中的关联规则挖掘,如购物篮分析等。通过构建决策树模型,可以发现不同商品之间的关联关系,为商业决策提供支持。
人工选瓜根蒂纹理触感
新西瓜输入规律结果推测输入模型结果预测知识学习数据训练人工选瓜与机器选瓜新西瓜
收集数据1分析数据2训练算法3使用算法4
软粘清晰硬挺硬滑模糊硬挺硬滑模糊蜷缩软粘稍糊蜷缩软粘模糊蜷缩硬滑清晰蜷缩软粘清晰蜷缩软粘清晰蜷缩硬滑稍糊蜷缩硬滑清晰蜷缩12345678910编号12345678910根蒂蜷缩蜷缩蜷缩蜷缩蜷缩硬挺硬挺蜷缩蜷缩蜷缩纹理清晰清晰清晰清晰稍糊清晰模糊模糊稍糊模糊触感硬滑硬滑软粘软粘硬滑软粘硬滑硬滑软粘软粘好瓜是是是是是否否否否否好瓜坏瓜
编号12345678910根蒂蜷缩蜷缩蜷缩蜷缩蜷缩硬挺硬挺蜷缩蜷缩蜷缩纹理清晰清晰清晰清晰稍糊清晰模糊模糊稍糊模糊触感硬滑硬滑软粘软粘硬滑软粘硬滑硬滑软粘软粘好瓜是是是是是否否否否否属性值好瓜坏瓜根蒂蜷缩53硬挺02纹理清晰41稍糊11模糊03触感硬滑32软粘23纯度分类结果的差异程度稍糊的纯度清晰的纯度模糊的纯度
属性值好瓜坏瓜信息熵信息增益根蒂蜷缩530.950.24硬挺020纹理清晰410.720.44稍糊111模糊030触感硬滑320.970.03软粘230.97利用程序计算各属性的信息熵和信息增益编号12345678910根蒂蜷缩蜷缩蜷缩蜷缩蜷缩硬挺硬挺蜷缩蜷缩蜷缩纹理清晰清晰清晰清晰稍糊清晰模糊模糊稍糊模糊触感硬滑硬滑软粘软粘硬滑软粘硬滑硬滑软粘软粘好瓜是是是是是否否否否否
编号12345678910根蒂蜷缩蜷缩蜷缩蜷缩蜷缩硬挺硬挺蜷缩蜷缩蜷缩纹理清晰清晰清晰清晰稍糊清晰模糊模糊稍糊模糊触感硬滑硬滑软粘软粘硬滑软粘硬滑硬滑软粘软粘好瓜是是是是是否否否否否纹理7,8,105,91,2,3,4,6模糊稍糊清晰1,2,3,4,6编号12346根蒂蜷缩蜷缩蜷缩蜷缩硬挺纹理清晰清晰清晰清晰清晰触感硬滑硬滑软粘软粘软粘好瓜是是是是否??
编号12345678910根蒂蜷缩蜷缩蜷缩蜷缩蜷缩硬挺硬挺蜷缩蜷缩蜷缩纹理清晰清晰清晰清晰稍糊清晰模糊模糊稍糊模糊触感硬滑硬滑软粘软粘硬滑软粘硬滑硬滑软粘软粘好瓜是是是是是否否否否否纹理7,8,105,91,2,3,4,6模糊稍糊清晰1,2,3,4,6??编号59根蒂蜷缩蜷缩纹理稍糊稍糊触感硬滑软粘好瓜是否
任务一根据计算的信息增益,手工绘制决策树纹理模糊稍糊清晰
作业展示
任务二依据决策树,将判断西瓜好坏的程序补充完整a=input(请输入西瓜的纹理{清晰,稍糊,模糊}:)b=input(请输入西瓜的根蒂{蜷缩,硬挺}:)c=input(请输入西瓜的触感{硬滑,软粘}:)ifa==模糊:print(坏瓜)elifa==____:ifc==_____:print(____)elifc==_____:print(____)elifa==____:ifb==_____:print(____)elifb==_____:print(____)
运行程序,判断一个新买的西瓜是否是好瓜?
1、对真实西瓜的判定,决策树算法的判断结果一定准确吗?2、如何提高决策树算法的结果准确性?思考与讨论不一定,因为特征有限,样本有限增加特征、样本的数量
编号1234567891011121314151617色泽青绿乌黑乌黑青绿浅白青绿乌黑乌黑乌黑青绿浅白浅白青绿浅白乌黑浅白青绿根蒂蜷缩蜷缩蜷缩蜷缩蜷缩稍蜷稍蜷稍蜷稍蜷硬挺硬挺蜷缩稍蜷稍蜷稍蜷蜷缩蜷缩敲声浊响沉闷浊响沉闷浊响浊响浊响浊响沉闷清脆清脆浊
您可能关注的文档
- 省级优秀课件商务星球版初中地理八年级下册第九章 青藏地区第一节区域特征.pptx
- 省级优秀课件1.1原子结构-人教版(2019)高中化学选择性必修2.pptx
- 省级优秀课件人教版(2019)高中物理必修第一册第三章第2节摩擦力.pptx
- 省级优秀课件5.1硫及其化合物-人教版(2019) 高中化学必修2.pptx
- 省级优秀课件3.1.1铁的单质-人教版(2019)高中化学必修1.pptx
- 省级优秀课件北师大版(2019)高中数学必修2第1章第1节周期变化.pptx
- 省级优秀课件苏少版小学美术五年级下册第13课 诗配画.pptx
- 省级优秀课件统编版(2019)高中政治必修二第四课第二框我国的社会保障.pptx
- 省级优秀课件苏教版(2019)高中通用技术必修《技术与设计1》第五章第三节计算机辅助设计.pptx
- 省级优秀课件6.5.1第二课时 直线与平面垂直的判定-北师大版(2019)高中数学必修2.pptx
- 省级优秀课件中图版(2019)高中地理必修2第1章第2节人口迁移的特点及影响因素.pptx
- 省级优秀课件中图版(2019)高中地理选择性必修1第4章第1节陆地水体及其关系.pptx
- 【寒假作业】人教PEP版英语四年级下册知识衔接Unit-2-What-time-is-it.docx
- 省级优秀课件统编版(2019)高中政治必修4 第1单元第二课第2框运动的规律性.pptx
- 省级优秀课件浙江摄影版(三起)(2020)小学信息技术六年级上册第10课 人脸识别.pptx
- 省级优秀课件统编版(2019)高中政治必修3第9课第一框科学立法.pptx
- 人教版(2019)高中物理选择性必修1第2章第2节简谐运动的描述.pptx
- 统编版(2019)高中历史高三高考第一轮复习两宋(960年-1279年)的政治和军事.pptx
- 人教版(2019)高中生物必修2第五章第二节第2节基因表达与性状的关系—— 表观遗传.pptx
- 人美版小学美术六年级下册《城市雕塑》.pptx
文档评论(0)