荷叶母亲阅读练习题附答案.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模糊聚类的有效性第七章 初始化、加权指数、聚类类数m 对加权指数的研究}??m?{J:1的Dunn在模糊聚类目标函数引入了加权指数m,使中,Bezdek(81)m2?m,但是如)聚类准则变成的出现不自然也没有必要(Li 95时的特例。从数学上看参数m果不给隶属度乘一个权重,那么从硬聚类准则函数到模糊聚类目标函数的推广则是无效的。要实现模糊因此,Bezdek 81),参数m又称为平滑因子,控制着模式在模糊类间的分享程度( 的选取目前尚缺乏理论指导。m,然而最佳m聚类就必须选定一个合适的5?1?m1.;)(Bezdek给出过一个经验范围76;后又从物理解释上得出m=2时最有意义Bezdek之间;的最佳取值应在1.25~1.75(92)从汉字识别的应用背景得出mChan 和Cheung有关的结论,建议nm的取值与样本数目等(87)从算法收敛性角度着手,得出和Hathawayn(n?2)m的最佳选取区m则从聚类有效性的实验研究中得到的取值要大于95);Pal等(间应为[1.5, 2.5],在不做特殊要求下可取区间中值m=2。 上述有关m的取值和范围,大都来自实验和经验,均为启发式的,既不够系统,也没有给出具体的优选方法。此外,也还缺乏最优m的检验方法。这一系列的开放问题,都值得进一步的探索,以便奠定m优选的理论基础。 聚类算法的性能是与数据集密切相关的,没有万能的聚类算法。这也是新的聚类算法层出不穷的原因。聚类分析的最主要的缺陷是,不管所给数据集的结构如何,它总能将数据集进行分类。因此,人们在运用聚类算法之前,需要对数据集的结构进行检测。由于我们面临??x??,x,X,需的是无标签数据集,没有关于数据集的先验知识,对于要聚类的数据集n1要考虑下面三个问题。 无 标 签 数 据 集 断 言 数 据 集 是 否 有 聚 类 否: 停止 是 聚 类 否 有 效 性 ? 图2 无标签数据集处理过程 c1?c?nXX是否有聚类结构。(,是否是随机的?即对于类数 )1 问题:X有聚类结构,如何确定这个结构?:如果 问题2X被聚类,如何确定聚类结果的有效性?:一旦 问题3 问题1称之为“聚类趋势”,问题2称之为“聚类分析”,问题3称之为“聚类有效性”。 图2给出无标签数据集的处理过程。 关于“聚类趋势”问题,我们可以采用一定的技术来检测数据集是否是随机的。Jain和 Dubes[60,200],Windham[185],Smith[175]对这一问题有详细地叙述。 关于“聚类分析”问题,目前我们可以用硬聚类[62],模糊聚类[14]和可能性聚类[129]等聚类方法来确定数据集的聚类结构。但聚类分析的结果与所采用的数据密切相关,不同的算法可能会产生不同的结果。关于不同算法的分类性能,已引起人们的关注,如Hirota和Pezdrcy[92]通过概率集来评价不同的聚类方法,Backer和Jain[6]通过模糊集分解来评价不同的聚类方法,Windham[85]通过一致性测度对不同参数对聚类结果的影响进行评价。最近,Analed S.A1-Sultan和M.Maroof Khlan[115]对c-均值聚类算法,模拟退火算法,遗传算法和Tabu搜索算法进行了对比实验。结果表明,尽管c-均值聚类算法的分类性能总体上不如其它三种 方法,但其运算速度等是其他三种方法无法相比的。 对于给定的数据集,如果已经确认该数据集具有结构,则需要用聚类算法来确定这个结构。大多数聚类算法需要事先确定数据集的分类数。如果分类数选取的不合适,我们可能使划分的结果与数据集的真正结构不相符。使得某一类被划分的或大或小。关于数据集的最佳 分类数问题属于聚类有效性问题。 历史上,关于聚类有效性问题的研究是基于硬c-均值聚类算法和模糊c-均值聚类算法进行的。如Dunn的分离性指标[63],Davies和Bouldin的分离性测度[52],Vogel和Wong提出的PFS聚类方法[183]等都是基于硬c-均值聚类算法的。基于模糊c-均值聚类算法的有效性函数有Dunn的划分

文档评论(0)

sunhongz + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档