- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 利用启发式搜索进行属性约简 性质1: 若M ?N ? C,则POS M (D) ? POSN (D) 性质2: M ?N ? C ,X ?U,则对任意x ∈ U,若x ∈ POS M (D) ,则x ∈ POSN (D). * * 利用启发式搜索进行属性约简 算法步骤: 第1步. ?a ∈ A: 计算邻域关系Νa ; 第2步. 将? 赋给red ; 第3步. 对任意ai∈A-red , 计算 //此处定义K?(D) = 0 第4步. 选择ak ,其满足: SIG(ak,red,D) = maxi(SIG(ai,red,D )) 第5步. 如果SIG(ak,red,D) 0 ,将red U ak 赋给red , 返回第3步; 否则,返回red,结束。 观看演示 * * 主要内容 ?? 粗糙集发展历程 粗糙集的基本理论介绍 ?? 粗糙集的属性约简算法研究 ?? 粗糙集的扩展模型 在文本分类中的应用 现有工具简介 * * 经典粗糙集存在的问题 经典粗糙集理论的主要存在的问题是: 1)对原始数据本身的模糊性缺乏相应的处理力; 2)对于粗糙集的边界区域的刻画过于简单; 3)对属性为连续数值的情况缺乏好的解决办法。 * * 可变精度粗糙集模型 W.Ziarko提出了一种称之为可变精度粗糙集模型,该模型给出了 错误率低于预先给定值的分类策略,定义了该精度下的正区域、边界 区域和负区域。下面扼要地介绍其思想: 一般地,集合X包含于Y并未反映出集合X的元素属于集合Y的“多 少”。为此,VPRS定义了它的量度: C(X, Y)=1–card(X?Y)/card(X) 当card(x)0, C(X, Y)=0 当card(x)=0。 C(X, Y)表示把集合X归类于集合Y的误分类度,即有C(X, Y)?100%的元 素归类错误。显然,C(X, Y)=0时有X?Y。如此,可事先给定一错误分 类率?(0??0.5),基于上述定义,我们有X??Y,当且仅当C(X,Y)??。 * * 可变精度粗糙集模型 在此基础上,设U为论域且R为U上的等价关系,U/R=A={X1, X2, …, Ak },这样,可定义集合X的?-下近似为 R?X =?Xi (C(Xi, X)??, i=1, 2, …, k), 并且R?X称为集合X的?-正区域,集合X的?-上近似为 R?X =?Xi (C(Xi, X)1–?, i=1, 2, …, k), 这样,?-边界区域就定义为: BNR?X =?Xi (?C(Xi, X)1–?); ?-负区域为:NEGR?X=?Xi (C(Xi, X)?1–?)。 以此类推,我们还可以定义?-依赖、?-约简等与传统粗糙集模型相对应的概念。 * * 相似模型 在数据中存在缺失的属性值的时候(在数据库中很普遍),等价关系无法处理这种情形。为扩展粗糙集的能力,有许多作者提出了用相似关系来代替等价关系作为粗糙集的基础。 在使用相似关系代替粗糙集的等价关系后,最重要的变化就是相似类不再形成对集合的划分了,它们之间是相互重叠的。类似于等价类,可以定义相似集,即所有和某各元素x在属性集合B上相似的集合SIMb(x)。值得注意的是SIMb(x)中的元素不一定属于同一决策类, 因此还需要定义相似决策类,即相似集对应的决策类集合。 * * 邻域模型 作为一种有效的粒度计算模型,Pawlak 粗糙集定义在 经典的等价关系和等价类基础上,只适合于处理名义型变 量,对于现实应用中广泛存在的数值型数据却不能直接处 理。在金融、医疗、科研和工程应用领域数值型变量无处 不在,如振动分析中的频谱信号,变压器状态分析中的温 度、电流、电压信号等,研究人员在引入粗糙集等机器学 习方法来处理该类数据时,往往采用离散化算法把数值型 属性转化为符号型属性。这一转换不可避免地带来了信息 损失,计算处理的结果很大程度上取决于离散化的效果。 * * 邻域模型 为解决上述问题,有人提出了邻域粗糙集模 型。该模型以实数空间中的每一个点形成一个δ 邻域,δ邻域族构成了描述空间中任一概念的基 本信息粒子。对于空间中的任一子集,通过基本 邻域信息粒子进行逼近,并由此提出了邻域信息 系统和邻域决策表模型。 * * 主要内容 ?? 粗糙集发展历程 粗糙集的基本理论介绍 ?? 粗糙集的属性约简算法研
文档评论(0)