- 7
- 0
- 约8.56千字
- 约 65页
- 2019-04-05 发布于湖北
- 举报
现在考虑T被分区之后的一个相似度量标准,T按照一个属性检验X的几个输出进行分区。所需信息可通过这些子集的熵的加权和求得: n Info x(T)=-Σi=1 ((|Ti| /|T|).info(Ti)) 信息增益的计算公式: Gain(X) = Info(T) - Info x(T) 通过计算求出具有最高增益的属性。 以下分析有关度量标准的应用和创建决策树的一个简单例子,假设以平面文件形式给出的数据集T,其中有14个样本,通过3个输入属性描述且属于所给的两个类之一:类1或类2。 类1 假 96 C 类1 假 80 C 类1 假 80 C 类2 真 70 C 类2 真 80 C 类1 假 75 B 类1 真 65 B 类1 假 78 B 类1 真 90 B 类1 假 70 A 类2 假 95 A 类2 假 85 A 类2 真 90 A 类1 真 70 A 属性4 属性3 属性2 属性1 数据库T: 训练例子的简单平面数据库 其中:9个样本属于类1,5个样本属于类2,因此分区前的熵为: info(T)= -9/14.log2(9/14) -5/14.log2(5/14) = 0.940比特 根据属性1把初始样本集分区成3个子集(检验x1表示从3个值A,B或C中选择其一)后,得出结果: Info x1(T)=5/14(-2/5 log2(2/5) -3/5 log2(3/5
您可能关注的文档
最近下载
- 2026年中国铁路南宁局招聘笔试全题型真题附答案.doc
- EDU02MC直流配电监控模块用户手册-艾默生网络能源有限公司.PDF VIP
- 达风DF-1000MiDF-2000Mi系列铣床数控系统说明书.pptx VIP
- 2026年江苏南通市海安市中考二模道德与法治试题(试卷+解析).pdf VIP
- 具身智能Agent:从VLA_VA模型到物理世界交互的落地实践.pptx VIP
- 2026年二级网球裁判题目及答案.doc VIP
- 张永伟乾坤疗法培训课件.pptx VIP
- 鲁科版三年级起点【五四制】3-6年级单词表.docx VIP
- 2026年具身智能产业发展研究报告-36Kr-2026.1-42页.pdf VIP
- 2026年江苏省南通市海门区中考道德与法治二模试卷(含答案).pdf VIP
原创力文档

文档评论(0)