- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘2015最新精品课程完整课件(第9讲)---基于规则的分类方法-2PPT
基于规则的分类
基于规则的分类器(Rule-Based Classifier)
使用一系列“if…then…” 对数据集分类
规则: (Condition) y
此处
Condition 为多个属性-值对的合取
y 为类标号
LHS(IF 部分): 规则前件或前提
RHS(then 部分): 规则结论
分类规则例子:
(血的类型=温血) (下蛋=Yes) 鸟
(税收收入 50K) (退税=Yes) 逃税=No
规则的应用
若样本x的所有属性满足规则的前提,称规则 r 覆盖样本 x
R1: (Give Birth = no) (Can Fly = yes) Birds
R2: (Give Birth = no) (Live in Water = yes) Fishes
R3: (Give Birth = yes) (Blood Type = warm) Mammals
R4: (Give Birth = no) (Can Fly = no) Reptiles
R5: (Live in Water = sometimes) Amphibians
规则 R1 覆盖 hawk = Bird
规则 R3 覆盖 grizzly bear = Mammal
规则的评价
规则的覆盖度(Coverage):
满足规则条件的记录的百分比
规则的正确性(Accuracy) :
在满足规则条件的记录中,也满足规则结论的记录的百分比
(Status=Single) No
Coverage = 40%, Accuracy = 50%
规则的冲突
触发:规则被满足
激活:该规则为唯一满足的
R1: (Give Birth = no) (Can Fly = yes) Birds
R2: (Give Birth = no) (Live in Water = yes) Fishes
R3: (Give Birth = yes) (Blood Type = warm) Mammals
R4: (Give Birth = no) (Can Fly = no) Reptiles
R5: (Live in Water = sometimes) Amphibians
A lemur triggers rule R3, so it is classified as a mammal
A turtle triggers both R4 and R5
A dogfish shark triggers none of the rules
有序规则集
根据优先权对规则进行排序
对一个待分类的记录
若满足多条规则,则使用排在最前面的对其进行分类。
若不满足任何规则,则使用默认类别。
构造分类规则
直接方法:
直接从数据中提取规则
e.g. FOIL, AQ, CN2, RIPPER
间接方法:
从其它分类模型中提取规则 、
e.g. decision trees, neural networks, etc
直接方法: 顺序覆盖
顺序覆盖(Sequential Covering)
顺序学习规则: 对每个给定的类 Ci 希望规则可以覆盖该类 的大多数元组,但不包括其它类的元组(或很少)
(1) 初始值为空规则集
(2) 使用Learn-One-Rule函数得到一条新规则
(3) 从训练集中删去被新产生的规则所覆盖的实例
(4) 重复步骤(2)和步骤(3),直到满足停止标准为止。
示例
示例
顺序覆盖的要点
产生规则
消除实例
规则评价
停止标准
规则的剪枝
产生规则
两种常用方法
消除实例
不消除实例?
不消除正例?
不消除负例?
总是产生同一条规则
可能过高估计后续规则的正确度
可能过低估计后续规则的正确度
规则评价
标准:
Accuracy
Laplace
M-estimate
n : Number of instances covered by rule
nc : Number of instances corrected classified by rule
k : Number of classes
p : Prior probability
停止标准
停止标准
计算增益
若增益不显著,则舍弃新规则
规则剪枝
与决策树的后剪枝相似
降低错误剪枝:
删去规则的一个合取支(conjunct)
在测试集上比较剪枝前后的错误率
若出错率降低,则剪掉这一合取支
直接方法的总结
产生一条单一规则
删除规则覆盖到的元组
若需要,对规则进行剪枝
将规则添加到当前的规则集
您可能关注的文档
- 操作票培训班讲义PPT.ppt
- 操作票培训讲义PPT.ppt
- 改正错别字练习PPT.ppt
- 改变---从平凡到优秀PPT.ppt
- 改变心态享受人生PPT.ppt
- 放大镜和显微镜PPT.ppt
- 放射卫生学--剂量学基础PPT.ppt
- 放射卫生学重点 第六章 核医学诊断和治疗中对患者的防护PPT.ppt
- 放射性肾病PPT.ppt
- 放射卫生学重点 第三章 放射防护标准PPT.ppt
- 岸基供电系统 第4部分:工频电源.pdf
- 人教版八下英语Unit 5 What were you doing when the rainstorm came_测试卷.docx
- 热带作物品种区域试验技术规程 木薯.pdf
- 草原防火阻隔带建设技术规程.pdf
- 渔用气胀救生筏技术要求和试验方法-.pdf
- 浙江省杭州市2024-2025学年八年级下学期期中考试英语试卷(含答案).docx
- 重庆市渝北区六校联盟2024-2025学年九年级下学期期中教学大练兵语文试卷.docx
- 食品安全-花椒籽油 (2).pdf
- 2025年海博思创分析报告:储能集成“小巨人”,国内外业务进展可期.pdf
- 地理标志产品 宽城板栗.pdf
最近下载
- 毕业设计(论文)-徐州某小区1#住宅楼工程工程量清单与招标控制价的编制.docx
- 南山森林抚育补贴试点项目作业设计.pdf VIP
- 2022年北京市自来水集团有限责任公司校园招聘考试笔试试题及答案解析.pdf VIP
- 全国《职业教育》专业知识(重点)考试题库(300题).docx
- 青春期男女生交往.pptx
- 北京市自来水集团有限责任公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版及参.docx VIP
- 物理专业英语词汇.pdf
- 简易装修合同电子版3篇 .pdf VIP
- 瓦楞纸箱印刷过程中的质量控制.pdf
- GB∕T 35379-2017 木门分类和通用技术要求(高清版).pdf
文档评论(0)