一种基于粗糙集理论的连续属性离散化方法-JournalofNortheastern.PDF

一种基于粗糙集理论的连续属性离散化方法-JournalofNortheastern.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于粗糙集理论的连续属性离散化方法-JournalofNortheastern

第2 4 卷第8 期 东 北 大 学 学 报 ( 自 然 科 学 版 ) Vol 24 ,No . 8 2 0 0 3 年 8 月 Journal of Nort heastern U niver sity (N at ural Science) Aug . 2 0 0 3 文章编号 : (2003) 一种基于粗糙集理论的 连续属性离散化方法 陶 志 , 许宝栋 , 汪定伟 , 李  冉 ( 东北大学 信息科学与工程学院 , 辽宁 沈阳 110004) 摘    要 : 基于粗糙集的有关理论 ,提出了一种新的连续属性离散化方法 首先说明决策属性 · 支持度的概念 ,再利用决策属性支持度作为反馈信息 ,提出一种领域独立的基于决策属性支持度 的连续属性离散化算法 该算法能在保证决策表原始分类能力不变的前提下 ,提高约简效率 同 · · 时 ,各个属性拥有较少的分割区间 ,会使规则集合更加简洁 通过实例分析比较 ,说明该算法是非 · 常有效的 · 关  键  词 : 粗糙集理论 ;决策表 ;决策属性支持度 ;离散化 ;数据挖掘 中图分类号 : TP 18    文献标识码 : A 粗糙集理论作为一种不确定性数据处理方 给定问题的知识将问题的论域进行划分 ,然后对 法 , 自20 世纪 80 年代初由波兰学者 Z. Pawlak 提 划分后的每一个组成部分确定其对某一概念的支 出以来[ 1 ] , 已获得越来越广泛的关注 基于粗糙 持程度 下面给出相关概念和结论 · · · 集理论的数据挖掘方法 , 目前已成为智能计算领 1. 1  决策表与决策属性支持度 域的研究热点 ,并在工程设计 、过程控制 、故障诊 定义 1  四元组 S = ( U , A , V , f ) 是一个决 断、决策分析 、数据挖掘等诸多领域均有成功的应 策表, 其中 U 表示对象的非空有限集合, 称为论 用[2 , 3 ] · 域; A = C ∪D , C ∩D = , C 称为条件属性集, 一般来说 ,粗糙集理论为处理离散属性提供 D 称为决策属性集; V = ∪V a , V a 是属性 a 的 a ∈A 了很好的工具 ,但它不能直接处理连续属性 ,这一 值域; f 表示 U ×A →V 是一个信息函数, 它为每 缺陷大大限制了粗糙集理论的应用范围 在实际 个对象的每个属性赋予一个信息值, 即:f ( x , a) · 的数据挖掘应用中 ,数据类型各式各样 ,绝大多数 ∈V a , a ∈A , x ∈U , 通常决策属性 D = { d} , 即 情况是既包含连续属性又包含离散属性 ,因此 ,用

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档