决策树DecisionTree-优质课件 .pptx

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树 Decision Tree;简介;决策树的结构; 决策树的结构;决策树分类;Example of a Decision Tree;Another Example of Decision Tree;9、我们的市场行为主要的导向因素,第一个是市场需求的导向,第二个是技术进步的导向,第三大导向是竞争对手的行为导向。七月-21七月-21Sunday, July 18, 2021 10、市场销售中最重要的字就是“问”。09:25:5909:25:5909:257/18/2021 9:25:59 AM 11、现今,每个人都在谈论着创意,坦白讲,我害怕我们会假创意之名犯下一切过失。七月-2109:25:5909:25Jul-2118-Jul-21 12、在购买时,你可以用任何语言;但在销售时,你必须使用购买者的语言。09:25:5909:25:5909:25Sunday, July 18, 2021 13、He who seize the right moment, is the right man.谁把握机遇,谁就心想事成。七月-21七月-2109:25:5909:25:59July 18, 2021 14、市场营销观念:目标市场,顾客需求,协调市场营销,通过满足消费者需求来创造利润。18 七月 20219:25:59 上午09:25:59七月-21 15、我就像一个厨师,喜欢品尝食物。如果不好吃,我就不要它。七月 219:25 上午七月-2109:25July 18, 2021 16、我总是站在顾客的角度看待即将推出的产品或服务,因为我就是顾客。2021/7/18 9:25:5909:25:5918 July 2021 17、利人为利已的根基,市场营销上老是为自己着想,而不顾及到他人,他人也不会顾及你。9:25:59 上午9:26 上午09:26:00七月-21 ;Apply Model to Test Data;Apply Model to Test Data;Apply Model to Test Data;Apply Model to Test Data;Apply Model to Test Data;Apply Model to Test Data;决策树原理;Check for the above base cases. For each attribute?a, find the normalized information gain ratio from splitting on?a. Let?a_best?be the attribute with the highest normalized information gain. Create a decision?node?that splits on?a_best. Recur on the sublists obtained by splitting on?a_best, and add those nodes as children of?node.;例子:算法过程;例子:算法过程;例子:算法过程;; Father of information theory 证明熵与信息内容的不确定程度有等价关系 系统科学领域三大论之一;? 系统越无序、越混乱,熵就越大。 ? 构造决策树,熵定义为无序性度量。 ? 选择一个属性划分数据,使得子女节点上数据的类值(例中“yes”或“no”)大部分都相同(低无序性)。 ? 如果一个节点上的数据类值??可能的类值上均匀分布,则称节点的熵(无序性)最大。 ? 如果一个节点上的数据的类值对于所有数据都相同,则熵最小。 ? 通过分裂,得到尽可能纯的节点。这相当于降低系统的熵。;例子;1.基于天气的划分;构造树;(1)训练样本的信息值(基于类的比例) ? 训练样本(用来创建树的数据集)在包含9个yes和5个no的根节点上,对应于信息值 info([9,5])=0.940位 →总的信息;(2) 第一棵树,属性,各叶节点的信息值 ? 基于天气(outlook)的划分,在叶节点的yes和no类的个数分别是[2,3],[4,0],和[3,2],而这些节点的信息值分别是: ? info([2,3])=0.971位 →sunny ? info([4,0])=0. 0位 →overcast ? info([3,2])=0.971位 →rain;(3)第一棵树,属性,导致的信息增益 计算平均信息值。 根据天气的树导致的信息增益为:基于类比例原来信息需求-基于天气属性划分之后得到的信息需求;;(5)选择获得最大信息增益的属性进行划分 ?最大信息增益:? gain(outlook)=0.247位 ?选择天气作为树的根节点的划分属性,其中一个子女节

文档评论(0)

魏魏 + 关注
官方认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

版权声明书
用户编号:5104001331000010
认证主体仪征市联百电子商务服务部
IP属地江苏
领域认证该用户于2023年10月19日上传了教师资格证
统一社会信用代码/组织机构代码
92321081MA26771U5C

1亿VIP精品文档

相关文档