- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模糊状态演化模式挖掘的研究.pdf
第27卷 第2期 大庆师范学院学报 Vo1.27 No.2
2007年4月 JOURNAL OF DAQING NORMAL UNIVERSITY April.20o7
模糊状态演化模式挖掘的研究
叶 萍
(中南林业科技大学理学院,湖南长沙410004)
摘 要:分析了状态演化模式挖掘(SEPM)过程中的不确定性,将模糊的思想引入SEPM中,提出了模糊状态演化
模式挖掘(FSEPM)的概念并对其进行了算法实现;在此基础上,对FSEPM进行了基于有效支持度的改进。
关键词:模糊;聚类;状态演化;挖掘
作者简介:叶萍(1979一),女,湖北武汉人,中南林业科技大学理学院信息与计算科学教研室教师,从事数据挖掘及
可视化研究。
中图分类号:O159 文献标识码:A 文章编号:1006—2165I2007)02—0058—05 收稿日期:2007一O1—17
1 SEPM中的不确定性
在状态演化模式挖掘算法中,状态矢量的聚类结果对挖掘的过程和结果有着重要的影响。为了获得
比较理想的挖掘结果,聚类程度的确定是一个关键的问题:状态矢量对应的状态点应该分成多少类?每个
类对应的空间区域的大小及其形状应该怎么选择?一种解决问题的策略是通过一种反馈的方式进行人为
的选取,比如给定初始的聚类数 目并选取一种聚类方法,根据最终挖掘结果规则的数目和价值来对聚类数
目加以调整,直到满足要求为止。类的数 目越多,同样的状态空间,则类所占空间区域就越小,类的精度越
高,在进行有关时序的预测时,对应的预测也相应的越精确。
然而,在对类的形状选取时,问题却变得比较微妙。不同的类的形状是由聚类距离测度决定的。聚类
中心、距离测度和阈值一起决定了每一个状态点的类属。然而对于这些点究竟应该怎样划分才会使得挖
掘的结果更合理我们却没有一个直接的判断标准。也就是说实际上,相对于后面的数据挖掘过程而言,在
状态点的分类中存在着不确定性.在 SEPM算法中,对这种不确定性并没有进行考虑并作出适当的处理。
当前对不确定性的理论研究认为,不确定性主要由随机性、模糊性、信息的缺省性以及混沌性造成
的…,我们认为这种不确定性是一种模糊性.本文中我们将相关的模糊集合理论引入状态序列数据挖掘,
提出了模糊状态数据挖掘的有关概念,并对其进行了算法实现。下面我们首先将对模糊聚类的有关知识
加以介绍。
2模糊聚类理论
正如聚类算法在数值分析中有着重要的地位一样,模糊聚类在使用模糊理论进行数值分析时也有着
很高的应用价值。一般的聚类方法属于硬分类,被聚类的对象被严格的区分出来,一个对象只能划分到一
个类中,经过处理后原来数据中所蕴含的信息损失较多。模糊聚类方法则是具有一定柔性特征的分类方
法。在模糊聚类中,一个被聚类对象属于多个类 ,但隶属度不同。模糊化的分类结果比明确的分类结果中
包含更多的信息,这种方法在模式识别中已经得到广泛的应用
一 般来讲,通用的模糊聚类迭代模型可以表示如下:设有待聚类的 n个样本的组成集合,X ={ 。,
… }每个样本的 m维特征值向量表示为 ,: , ,… }则可以用 mXn特征值矩阵表示样本集
r ll I12… l
l l
2l 22 … 2
X=l l
。 。 。 。 。 。 。 。
L m1 J,|2… mn
58
设将 n个样本依据样本的 1x1个特征,分为c类,其模糊聚类矩阵为
//ll//12Hln]
U21 “ 22 … “ 2n
= (“ )
U = ···… … …
“c1 “c2 … “ cn
其中(“ ),表示样本J.属于类别 h的隶属度,h=1,2,…c,它满足
U=0 (tthj) 1,∑=1,∑(“ )0
h :1 』
而 C个类别的聚类中心可以用模糊聚类中心矩阵表示
S =
聚类样本j与类别 h之间
文档评论(0)