RoughSets.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
RoughSets.ppt

粗糙集理论的提出(续1) “含糊”(Vague) 1904年谓词逻辑创始人G. Frege (弗雷格)首次提出 将含糊性归结到 “边界线区域”(Boundary region) 在全域上存在一些个体,它既不能被分类到某一个子集上,也不能被分类到该子集的补集上 …… “模糊集”(Fuzzy Sets) 1965年美国数学家L. A. Zadeh首次提出 无法解决G. Frege提出的“含糊”问题 未给出计算含糊元素数目的数学公式 …… 粗糙集理论的提出(续3) 粗糙集理论中的一些基本观点 “概念”就是对象的集合 “知识”就是将对象进行分类的能力(“各从其类”) “知识” 是关于对象的属性、特征或描述的刻划 不可区分关系表明两个对象具有相同的信息 提出上近似集、下近似集、分类质量等概念 …… 粗糙集理论在知识发现中的作用 在数据预处理过程中,粗糙集理论可以用于对遗失数据的填补。 在数据准备过程中,利用粗糙集理论的数据约简特性,对数据集进行降维操作。 在数据挖掘阶段,可将粗糙集理论用于分类规则的发现。 粗糙集理论在知识发现中的作用(续) 在数据挖掘阶段的主要作用 通过布尔推理挖掘出约简的规则来解释决策 通过熵理论将规则的复杂性和预测的误差分析溶入到无条件的度量中 与模糊集理论、证据理论构成复合分析方法 搜寻隐含在数据中的确定性或非确定性的规则 …… 在解释与评估过程中,粗糙集理论可用于对所得到的结果进行统计评估。 粗糙集理论的研究现状 在理论研究方面 数学性质:研究其代数与拓扑结构、收敛性等 粗糙集拓广:广义粗糙集模型、连续属性离散化 与其它不确定性处理方法的关系和互补:与模糊集理论、Dempster-Shafer证据理论的关系和互补 粒度计算:粗糙集理论是其重要组成之一 高效算法:导出规则的增量式算法、简约的启发式算法、并行算法、现有算法的改进 …… 粗糙集理论的基本原理 “知识”的定义 使用等价关系集R对离散表示的空间U进行划分,知识就是R对U划分的结果。 “知识库”的形式化定义 等价关系集R中所有可能的关系对U的划分 表示为:K = (U, R) * * 一. 粗糙集理论的发展概述 粗糙集理论的提出 自然界中大部分事物所呈现的信息都是: ◆ 不完整的、不确定的、模糊的和含糊的 ◆ 经典逻辑无法准确、圆满地描述和解决 粗糙集理论主要是为了描述并处理“含糊”信息。 粗糙集理论的提出(续2) “粗糙集”(Rough Sets) 1982年波兰数学家Z. Pawlak首次提出 将边界线区域定义为“上近似集”与“下近似集”的差集 指出在“真”、“假”二值之间的“含糊度”是可计算的 给出计算含糊元素数目的计算公式 借鉴了集合论中的“等价关系”(不可区分关系) 求取大量数据中的最小不变集合(称为“核”) 求解最小规则集(称为“约简”) …… 粗糙集理论的优点及局限性 主要优点 除数据集之外,无需任何先验知识(或信息) 对不确定性的描述与处理相对客观 …… 【说明】:Bayes理论、模糊集理论、证据理论等都需要先验知识,具有很大的主观性。 粗糙集理论的优点及局限性(续) 局限性 缺乏处理不精确或不确定原始数据的机制 对含糊概念的刻划过于简单 无法解决所有含糊的、模糊的不确定性问题 需要其它方法的补充 …… 解决办法 与模糊集理论相结合 与Dempster-Shafer证据理论相结合 …… 粗糙集理论的研究现状(续) 在数据挖掘领域的应用 发现数据之间(精确或近似)的依赖关系 评价某一分类(属性)的重要性 剔除冗余属性 数据集的降维 发现数据模式 挖掘决策规则 在其它领域的应用 金融商业 …… 1 基本概念 基本概念(续1) “信息系统”的形式化定义 S = {U, Q, V, f}, U:对象的有限集 Q:属性的有限集,Q=C?D,C是条件属性子集,D是决策属性子集 V: , Vp是属性P的域 f:U × A → V是总函数,使得 对每个xi ? U, q ? A, 有f(xi, q) ? Vq 一个关系数据库可看作一个信息系统,其“列”为“属性”,“行”为“对象”。 基本概念(续2) 基本集合(Elementary set)/ 原子(Atom) 关系R的等价类(Equivalence classes) U/R表示近似空间A上所有的基本集合(原子) 不可区分(等价、不分明)关系 U为论域,R是U?U上的等价(Equivalence)关系(即满足自反、对称、传递性质) A={U, R}称为近似空间,R为不分明关系 (indiscernibility,或不可区分关系、等价关系) 若x, y?U,(x, y)?R,则x, y在A中

您可能关注的文档

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档