- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
算法步骤 设定聚类数目C和参数b 初始化各个聚类中心mi 重复下面的运算 用当前的聚类中心计算隶属度函数: μj(xi) 用当前的隶属度函数更新计算各类聚类中心: mi 当 μj(xi)变化很小时,算法收敛,迭代终止。 算法收敛时:得到各类的聚类中心,各个样本对于各类的隶属度值,从而完成了模糊聚类划分。 如果需要,可以将模糊聚类结果进行去模糊化,即用一定的规则把模糊聚类划分转化为确定性分类。 * 4.4.3 改进的模糊C均值算法 模糊C均值算法:引入了的归一化条件, 存在的问题:若样本集不理想,可能导致结果不好。 例如:如果某个野值样本远离各类的聚类中心,本来它严格属于各类的隶属度都很小,但由于归一化条件的要求,将会使它对各类都有较大的隶属度(比如两类倩况下各类的隶属度都是0.5),这种野值的存在将影响迭代的最终结果。 * 改进 放松的归一化条件: 算法与模糊C均值算法相同 ,而隶属度和均值按下式计算: * 隶属度 改进的模糊C均值算法得到的隶属度值可能会大于1,因此并不是通常意义上的隶属度函数。 必要时可以把最终得到的隶属度函数进行归一化处理,这时已不会影响聚类结果。 如果结果要求进行去模糊化则可以直接用这里得到的隶属度函数进行。 * 改进的模糊C均值方法的优缺点 比模糊c均值方法有更好的鲁棒性: 有野值存在的情况下得到较好的聚类结果 聚类结果对预先确定的聚类数目不十分敏感 对聚类中心的初值十分敏感(与确定性C均值算法、模糊C均值算法一样)。 为了得到较好的结果,可用确定性C均值方法或普通模糊C均值方法的结果作为初值。 如果在迭代过程中出现某个聚类中心距离某个样本非常近,则最后可能会得到只包含这一个样本的聚类。 为防止出现这种清况,可以对隶属度计算式中的距离运算加一个非线性处理,比如使距离最小不会小于某个值。 * C均值、模糊C均值和改进的模糊C均值方法的对比实验 * 三种不同数据分布情况下, C均值(“-”)、模糊C均值(“×”)和改进的模糊C均值(“.”)聚类结果的比较 (a)两类分开较远,3种方法效果相同; (b)两类比较靠近,有部分重迭,改进的模糊C均值的聚类中心不准。 (c)两类重迭,C均值和模糊C均值改算法将样本错误地分成两类,而改进的模糊C均值方法的只给出一个聚类中心,比较合理。 * 给定聚类数目(3类)与实际数目(4类)不符时各种方法聚类结果的比较 (a)正确聚类 ;(b) C均值;(c)模糊C均值;(d)改进的模糊C均值 结论: C均值和模糊C均值的聚类结果错误,而改进的模糊C均值能正确给出4个聚类中心的3个。 4.4.4 模糊K近邻分类器 当样本稀疏时,仅考虑K个近邻样本的多少,而不考虑他们的距离差别是不合理的。 模糊K近邻:通过引入隶属度函数来克服。 若得到K个近邻, 用如下隶属度 这里,μj(xi)表示已知样本xi对第j类的隶属度。可以为1或0,或根据某种方法给予的隶属度值。 决策:根据隶属度值大小进行分类决策。 在许多实验中,结果比普通K近邻法好。 * * 识别:E上有n个模糊子集 及另一模糊子集 。若贴近度 * 例1: 某农作物在A地生长很好,现准备把它移植到B地或C地,问B、C两地哪个最适宜? 已知: 论域X={x1,x2,x3},其中,x1气温;x2湿度;x3土壤。根据评定得到三个模糊集 A=(0.8,0.4,0.6);B=(0.9,0.6,0.3);C=(0.6,0.5,0.5) 计算: N(A,B)=0.60; N(A,C)=0.55 从而B地最适宜。 * * * 例2: 设有四本书A1,A2,A3,A4,考虑它们的以下特性:x1科学性;x2逻辑性;x3思想性;x4可读性;x5表述明确性。 设论域X={x1,x2,x3,x4,x5}, A1=(1,0.8,0.8,0.7,0.4);A2=(0.7,0.9,0.7,0.7,0.5); A3=(0.6,0.8,0,0.5,0.6);A4=(0.7,0.9,1,0.6,0.6)。 现要在四本书中找出一本,使之比较符合要求: B=(0.9,0.8,0.7,0.7,0.5). 计算: N1(A1,B) =0.70; N1(A2,B) =0.65 ; N1(A3,B) =0.60 ; N1(A4,B) =0.60 从而,A1最符合要求 * * * 例3: 企业的经营管理状况可以由以下指标反映: u1:生产;u2:销售; u3:材料; u4: 存储; u5: 运输. 因此, 企业状况可以表示为U={u1,u2,u3,u4,u
文档评论(0)