- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树的属性选取 属性选取标准: 最大化反映数据差异,使树的层次和节点数最小 患者代码 嗓子痛 发烧 淋巴肿 充血 头痛 诊断结果 1 Yes yes Yes Yes Yes 咽炎 2 No No No Yes Yes 敏感症 3 Yes Yes No Yes No 感冒 4 Yes No Yes No No 咽炎 5 No Yes No Yes No 感冒 6 No No No Yes No 敏感症 7 No No Yes No No 咽炎 8 Yes No No Yes Yes 敏感症 9 No Yes No Yes Yes 感冒 10 yes Yes no Yes Yes 感冒 淋巴肿 发 烧 No No Yes Yes 咽炎 敏感症 感冒 数据挖掘方法 第三十一页,共六十二页。 患者代码 嗓子痛 发烧 淋巴肿 充血 头痛 诊断结果 1 Yes yes Yes Yes Yes 咽炎 2 No No No Yes Yes 敏感症 3 Yes Yes No Yes No 感冒 4 Yes No Yes No No 咽炎 5 No Yes No Yes No 感冒 6 No No No Yes No 敏感症 7 No No Yes No No 咽炎 8 Yes No No Yes Yes 敏感症 9 No Yes No Yes Yes 感冒 10 yes Yes no Yes Yes 感冒 淋巴肿 发 烧 No No Yes Yes 敏感症 敏感症 咽炎 No Yes 头 痛 淋巴肿 感冒 发 烧 淋巴肿 No Yes 咽炎 No Yes 数据挖掘方法 决策树的属性选取 属性选取标准: 最大化反映数据差异,使树的层次和节点数最小 第三十二页,共六十二页。 信用卡促销数据库 收入段 寿险促销 信用卡保险 性别 年龄 4-5万 No No M 45 3-4万 Yes No F 40 4-5万 No No M 42 3-4万 Yes Yes M 43 5-6万 Yes No F 38 2-3万 No No F 55 3-4万 Yes Yes M 35 2-3万 No No M 27 3-4万 No No F 43 3-4万 Yes No F 41 4-5万 Yes No M 43 2-3万 Yes No F 29 5-6万 Yes No F 39 4-5万 No No M 55 2-3万 Yes Yes F 19 ○选取收入段为根节点 ○选取寿险促销为输出属性 ○沿着每个分支有两个类,选取最频繁出现的类 收入段 2Yes2No 4Yes1No 3No 1Yes 2Yes 2—3万 3—4万 4—5万 5—6万 ○训练集分类的正确性为11/15=73% 数据挖掘方法 第三十三页,共六十二页。 ——决策树(Decision Tree):例 信用卡促销数据库 ○选取信用卡保险为根节点 ○选取寿险促销为输出属性 ○沿着每个分支有两个类,选取最频繁出现的类 信用卡保险 6Yes6No 3Yes 0No No Yes ○训练集分类的正确性为9/15=60% 数据挖掘方法 收入段 寿险促销 信用卡保险 性别 年龄 4-5万 No No M 45 3-4万 Yes No F 40 4-5万 No No M 42 3-4万 Yes Yes M 43 5-6万 Yes No F 38 2-3万 No No F 55 3-4万 Yes Yes M 35 2-3万 No No M 27 3-4万 No No F 43 3-4万 Yes No F 41 4-5万 Yes No M 43 2-3万 Yes No F 29 5-6万 Yes No F 39 4-5万 No No M 55 2-3万 Yes Yes F 19 第三十四页,共六十二页。 ——决策树(Decision Tree):例 信用卡促销数据库 ○选取数值型属性年龄为根节点 ○选取寿险促销为输出属性 ○依照年龄排序,对照输出属性进行数据分割,选择数据分割点 年 龄 9Yes3No 0Yes 3No ≤43 >43 ○以年龄≤43结合寿险促销=Yes,训练集分类的正确性为12/15=80% 17 27 29 35 38 39 40 41 42 43 43 43 45 55 55 Y N Y Y Y Y Y Y N Y Y N N N N 数据挖掘方法 收入段 寿险促销 信用卡保险 性别 年龄 4-5万 No No M 45 3-4万 Yes No F 40 4-5万 No No M 42 3-4万 Yes Yes M 43 5-6万 Yes No F 38 2-3万 No No F 55 3-4万 Yes Yes M 35 2-3万 No N
您可能关注的文档
最近下载
- 偏瘫患者的转移训练.ppt VIP
- 夜空中最亮的星合唱谱584411678.pdf
- 完整版苏教版科学五年级下册全册课件.ppt
- 前端产品手册V3.0(中文)100710.pdf
- 专题一 近代列强的侵略与中国人民的抗争(八上总复习课件)-2023-2024学年八年级历史上册同步备课系列(部编版).pptx VIP
- (二模)南通市2025届高三第二次调研测试语文试卷(含标准答案).docx
- 人教版八年级上册历史期中专题一 近代前期列强的侵略与中国人民的抗争.ppt VIP
- 2025河南省中考化学核心知识点汇总.docx
- 桂林理工大学《大学英语4》课件-Unit 4 Innovation.pptx
- 四平宏宝莱饮品股份有限公司发展战略研究.pdf VIP
文档评论(0)