- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
聚类是将数据分组成为簇或类。使得处于同一个簇中的数据之间相似度较高,
而处于不同簇的数据之间差别较大。人们对于聚类问题已经进行了深入的研究,
提出了很多的算法来解决各种各样的聚类问题。目前的算法大体上可以分为两类,
一类是硬聚类,在硬聚类中,一个数据元素只能属于一个簇。另外一类聚类是模
糊聚类,在模糊聚类中,一个数据元素可以同时属于多个簇,对于每一个簇有一
个相应的隶属度,其值介于0和1之间。通过将数据归大隶属度值最大的簇,模
糊聚类也可转化为硬聚类。
然而,在一些聚类问题中,一个数据元素是可以同时属于多个类或簇的,而
且对于每一个类或簇,其隶属度的值均可为1。
本研究把这一类问题称为多隶属聚类问题。对于数据型数据,现有的模糊聚
类算法也能加以解决,但对于事务属性数据或分类属性数据的多隶属聚类问题,
目前尚无相关研究。
本研究针对事务属性数据的多隶属聚类问题,提出了三种算法,分别是基于
频繁项目集的多隶属聚类算法、基于小项大项比的多隶属聚类算方法以及基于连
接的多隶属聚类算法。对于分类属性数据,在进行变换后,也能用这三种聚类方
法产生多隶属聚类。
关键词:聚类;数据挖掘;多隶属聚类;事务数据;频繁项目集;小项大项比
连接
Abstract
isthe of thedataintoclassesorclustersso
Clusteringprocessgrouping
that withinaclusterhave in toone
objects highsimilaritycomparison
are dissimilarto inother
another,butvery objects
beenstudied methodswerefound
has extensively,andmany to
analysis
solvevariouskindsof canbedividedinto
problems.Clusteringalgorithms
hardor hard allocateseach toa
fuzzy.Aclusteringalgorithm patternsingle
cluster its andinits method
duringoperation output.Afuzzyclustering
of inseveralclusterstoeach
assignsdegreesmembership inputpattems,
the of arebetween0and1.A canbe
membership fuzzyclustering
degrees
convertedtoahard each totheclusterwith
clusteringbyassigningpattern
the measureof
largest membership
Butinsome canbeallocatedtomorethanonecluster
cases,a
文档评论(0)