- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于精简模糊规则库分类算法
一种基于精简的模糊规则库的分类算法
摘 要:结合模糊聚类和粗糙集提出了一种基于精简的模糊规则库分类算法。对于数值型样本数据,首先采用模糊聚类生成模糊规则库,然后运用粗糙集理论对样本属性进行约简,删除冗余规则,即可得到精简的模糊规则库,以方便进行分类决策。通过对IRIS的仿真测试表明,本算法所产生的模糊规则不仅简单易懂,而且分类效果很好。
关键词:模糊规则; 模糊C均值聚类; 粗糙集??
中图法分类号:TP301.6文献标识码:A
文章编号:1001―3695(2007)02―0024―03
模糊逻辑可运用在分类问题上,基于If-Then规则的模糊系统可以对样本进行分类[1,2]。与传统的分类方法相比,模糊分类可以处理分类中的模糊性,以及数据的不精确性和不完整性[3]。目前提出的模糊分类方法很多,包括Tz Ping基于α截集的分类方法[4],V.Ravi基于MTA的分类方法[5],G.G.Yen结合ILFN和GA的方法[6],I.Requena的Constructive方法[7]等。这些方法存在规则的冲突性,或表达知识不够精细,或算法实现复杂。一般来说,基于If-Then规则的模糊系统有两个基本的要求:①易理解性,要求规则数尽可能少,规则前件结构简单,操作方便。②精确性高,要求系统具有较高的精度,分类效果好[7]。正是出于这两方面的考虑,本文结合模糊聚类和粗糙集理论提出了一种新的基于模糊规则的分类方法。首先,对样本数据,运用模糊C均值(Fuzzy C-Mean,FCM)聚类算法分类别对各维分量聚类,得到聚类中心值矩阵,然后确定模糊语言值及其模糊子集,并产生初始的模糊规则库,最后运用粗糙集理论对模糊规则库进行简化,得到精简的规则库。
1 模糊C均值聚类生成模糊规则库
1.3 生成模糊规则库??
通过第1.2节聚类得到的规则前件部分是用数值型数据表示的,对于决策来说很难理解,需要将其转换为模糊隶属度函数及语言标志值来表示,如第一条规则应为
其中Ai,1,1(i=1,…,n)为语言标志值对应的模糊集合,具有明确的隶属度函数。初始模糊规则库的生成由如下算法实现,包括四个步骤:??
(1)确定模糊隶属度函数的类型和语言标志值的数量H。隶属度函数可以采用任何类型,本文采用高斯型。语言标志值的数量也就是划分的模糊子集个数,可以将所有样本属性值统一为一个论域进行模糊划分,也可以将每个属性值分别进行独立的模糊划分,本文采用的是将所有样本属性值统一为一个论域进行模糊划分, 语言标志值的数量越多,模糊划分越精细。??
(2)计算每个模糊子集的参数。由于采用的是高斯型隶属度函数,因此只需计算每个模糊子集的中心和标准差。
2 粗糙集理论简化模糊规则库??
粗糙集(Rough Set)理论是由波兰数学家Z.Pawlak提出的一种处理不完整性、不确定性问题的数学工具[8,9]。它从新的角度定义知识,把知识看作是关于等价类的划分,从而将知识和分类紧密联系起来。粗糙集理论的主要特点是它仅利用数据本身提供的信息,而无须其他先验知识。目前它已被成功地应用于模式识别、机器学习、决策支持和数据挖掘等领域[10]。??
决策表是一种特殊而重要的知识表达系统,多数决策问题均可以用决策表形式来表达。决策表也是一种分类,其中的决策属性相当于分类中的类属性。但是由于应用领域不同,因此两者的侧重点也有所区别。分类问题主要关注于对样本的完整覆盖,以及在保持分类能力不变的前提下尽量得到一个优化的规则集;而决策问题关注的是怎样以尽量少的规则和属性来得到一个完整的决策规则集。因此,对决策表的处理主要是对其进行简化和最小化,简化既包括对属性集的简化,也包括对属性值的简化和冗余规则的删除,最小化在本文中被定义为决策集中的规则数目最少。
可辨识矩阵将知识表中所有有关属性区分的信息均浓缩在一个矩阵中。根据可辨识矩阵可应用辨识函数实现属性约简。辨识函数定义为Δ=∏(i, j)∈U×U∑CD(i, j),其中∑代表“∨”,∏代表“∧”。通过辨识函数可以方便地得到属性集的简化和核。??
根据可辨识矩阵的定义可知,当两个样本的决策属性取值相同时,它们所对应的可辨识矩阵元素的取值为0;当两个样本的决策属性不同且可以通过某些条件属性的取值不同加以区分时,它们所对应的可辨识矩阵元素的取值为这两个样本属性值不同的条件属性集合,即可以区分这两个样本的条件属性集合;当两个样本发生冲突时,即所有的条件属性取值相同而决策属性的取值不同时,则它们所对应的可辨识矩阵中的元素取值为空集。显然,可辨识矩阵元素中是否包含空集元素,可以作为判定决策表系统中是否包含不相容(冲突)规则的依
3
您可能关注的文档
最近下载
- 草果栽培技术.ppt VIP
- 药物设计软件:Schrodinger二次开发_(16).Schrodinger插件开发与使用.docx VIP
- 浙江省9+1高中联盟2024-2025学年高二上学期11月期中考试物理试题(含答案).docx VIP
- 教育研究导论(宁虹主编)笔记.pdf VIP
- 药物设计软件:Schrodinger二次开发_(15).自定义分子力场与参数化.docx VIP
- 2019年高铁动车广告,高铁车身广告,高铁广告价格.pdf VIP
- 高考数学考点题型全归纳.pdf VIP
- 万华化学安全管理实践.pdf VIP
- 丹纳赫DBS管理系统.pptx VIP
- 金属焊接软件:SYSWELD二次开发_(6).焊接热源模型开发.docx VIP
文档评论(0)