- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2005年度情報理論ガイダンス -i
決定木-II 学習目標 1.○与えられた事例集合から,指定された属性選択基準に基づいて決定木を生成 できる 利得 利得比 2.△事例数に応じた決定木の検証法を 設定できる 事例が十分 事例が不十分 3.△枝刈を適切に行える 決定木 属性とクラスの対からなる事例集合 身長H, 収入L, 学歴Hの場合は? 身長 収入 学歴 クラス L M H + H L L - H L H - H H H + L L H - H H M + L M M - H M M - 決定木 属性とクラスの対からなる事例集合 身長H, 収入H, 学歴Lの場合は? 身長 収入 学歴 クラス L M H + H L L - H L H - H H H + L L H - H H M + L M M - H M M - L 学歴 H M M H L,M,H:+ L,M,M:- H,M,M:- 収入 H,H,H:+ H,H,M:+ H,L,L:- H,L,H:- L,L,H:- ID3で生成された決定木 赤(楕円)ノードは判別ノード 最も上の判別ノードをルートノード 青ノードはクラスノード なぜ「収入」→「学歴」の順? 属性選択基準 利得 (Information Gain) 該当(現時点で残った)事例集合のエントロピー - 候補属性で分岐した場合のエントロピーの期待値 利得比 (Gain Ratio) 利得/候補属性で分岐した場合の分割エントロピー 補足 エントロピー → クラスに関するエントロピー 判別ノード1 身長 エントロピーの期待値 = 0.95 bit 収入 エントロピーの期待値 = 0.34 bit 学歴 エントロピーの期待値 = 0.84 bit 最も低い (予想つきやすい) ので選択 エントロピー(情報量の期待値) n個の事象がそれぞれ確率p1, p2 ,…, pnで 発生するとき、この事象の集合の不確定度 を示す 収入のときのエントロピーの平均 = 0.344 bit L H M L,M,H:+ L,M,M:- H,M,M:- 収入 H,H,H:+ H,H,M:+ H,L,M:- H,L,H:- L,L,H:- エントロピー = 0 bit エントロピー = 0 bit エントロピー = -1/3 log2 1/3 - 2/3 log2 2/3 = 0.917 bit エントロピーの 平均 =0x3/8 + 0x2/8 + 0.917x3/8 =0.34 bit 判別ノード2は? L ? H M 収入 H,H,H:+ H,H,M:+ H,L,M:- H,L,H:- L,L,H:- L,M,H:+ L,M,M:- H,M,M:- 残りのデータに対して 身長のエントロピーの平均=0.666 bit 学歴のエントロピーの平均=0 bit 決定木生成アルゴリズム STEP1: 該当事例集合Cのすべての事例が同一 クラスに属するなら,そのクラスノードをつくり,停止する.それ以外なら,属性選択基準により一つの 属性A*を選んで判別ノードをつくる. STEP2: 属性A*の属性値(a1, a2,…, an )によりCをC1, C2,…, Cnにわけてノードをつくり,属性値の枝を張る. STEP3: それぞれのノードCi(1≦i≦n ) に対して このアルゴリズムを再起的に適用する. 決定木の例 事例集合 身長 収入 学歴 クラス L M H + H L L - H L H - H H H + L L H - H H M + L M M - H M M - L 学歴 H M M H L,M,H:+ L,M,M:- H,M,M:- 収入 H,H,H:+ H,H,M:+ H,L,M:- H,L,H:- L,L,H:- 属性選択基準(再登場) 利得 (Information Gain) 該当(現時点で残った)事例集合のエントロピー - 候補属性で分岐した場合のエントロピーの期待値 利得比 (Gain Ratio) 利得/候補属性で分岐した場合の分割エントロピー 利得 H(C) - H(C|A) 利得が最も高かい属性A = A*を選択 H(C)は該当事例集合Cのエントロピー m: Cのクラスの種類 p(i) : Cに含まれているクラスiの事例の確率 H(C|A)はCをn種類の属性値を持つAでn分岐した場合の エントロピーの期待値(Cの条件付きエントロピー) p(ai) :Cにおいて属性Aが値aiをとる確率 H(C|ai): Aの値がaiである事例集合(ノードC
您可能关注的文档
最近下载
- 第14届国际数学教育大会标识及介绍.docx VIP
- 血友病教学课件.ppt VIP
- 《费尔巴哈的提纲》课件.ppt VIP
- 05S502 室外给水管道附属构筑物国标 建筑图集 汇编 .docx VIP
- 马工程系列《教育学原理》项贤明主编第一到十章全完整版课件PPT:产生发展、教育与社会人的发展、目的培养目标、制度、课程教学德育、教师学生等(1).pptx VIP
- 2025年山东能源集团公开招聘笔试参考题库附带答案详解.docx
- 积极心理学课件:构建积极生活,提升幸福感.ppt VIP
- 碘对比剂不良反应预防和处理课件.ppt VIP
- 糖尿病肾病合并肺部感染护理查房-幻灯片.ppt VIP
- 大学生安全教育(思政版):交通安全PPT教学课件.pptx VIP
文档评论(0)