- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别Ch8-非监督学习方法
* 在类别数未知情况下使用C—均值算法时,可以假设类别数是逐步增加的,例如对c=1,2,3,…分别使用该算法。 准则函数 是随c的增加而单调地减少的。如果样本集的合理聚类数为c类,当类别数继续增大时,相当于将聚类很好的类别又分成子类,则 值虽然继续减少但会呈现平缓趋势,如果作一条 值随c变化的曲线,则其拐点对应的类别数就比较接近于最优聚类数。 【C均值算法-类别数未知】 钙荷谗剑糯舍锦戒凋边瞅绳隆帕掷犹看岛奋社涧塌血逼芍荣循肆秃芝魁驳模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 但是并非所有的情况都能找到明显的转折点。在无明显的转折点时,这种选择最佳分类数的方法将失效。一般需要利用先验知识对不同的聚类结果进行分析比较。 【C均值算法-类别数未知】 桨辑围判讣饯封睹篆唐袒雀碾啮寿韭巴冗硝烧豹吭修顶池卜恨盲纽塞跑眼模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * C 均值算法比较简单,但它的自我调整能力也比较差。这主要表现在类别数必须事先确定,不能改变,这种主观确定数据子集数目并不一定符合数据集自身的特点,受代表点初始选择的影响也比较大。 类似于C 均值算法,ISODATA算法的聚类中心也是通过样本均值的迭代运算来决定。与C均值算法不同的是, ISODATA算法 将硬性确定聚类数目改成给出这个数目的期望值,作为算法的一个控制量。在算法中又加上分裂与合并机制,增加了一些试探性步骤和人机交互的“自组织”处理方式,因而能使聚类结果比较适应数据集的内在特性。 ISODATA算法与C 均值算法相比,在下列几方面有改进。 1.考虑了类别的合并与分裂,因而有了自我调整类别数的 能力。 合并主要发生在某一类内样本个数太少的情况,或两类 聚类中心之间距离太小的情况。 【迭代自组织的数据分析算法-ISODATA】 拯般承屁茂聚渊榴韧楔沫陈肿垫会捌虹蕊商重剥瞳惑堤辱建需措舆拖款响模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 分裂则主要发生在某一类别的某分量出现类内方差过大的现象,因而宜分裂成两个类别,以维持合理的类内方差。给出一个对类内分量方差的限制参数 ,用以决定是否需要将某一类分裂成两类。 2.由于算法有自我调整的能力,因而需要设置若干个控 制用参数。 迭代自组织算法流程图如图5-7所示。 【迭代自组织的数据分析算法-ISODATA】 迭警沦汞玫惨奎畅吝匆均切暑蛀屯赋幅纸劈注疟琴套丽擒蹭毯麓狂妮晒溃模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * ISODATA算法的具体步骤如下: 【迭代自组织的数据分析算法-ISODATA】 榜绞伴仆湿装君熄昆开老明描脏侣竞卧丘果禹沧辟换亚采纲涌纫壳止阴熬模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 【迭代自组织的数据分析算法-ISODATA】 弯理岿阉嫡别麦纱孕龋甸可乍嘛拜直棋诱遥艾乳戮昏蚕午搅积符浸依漫裂模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 【迭代自组织的数据分析算法-ISODATA】 邱诲皑襟孟谅姬挡坐哺悔幼碰跪夺哨靳躺昧免捞谊祁晒裔较粘庚肘珐淹天模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 【迭代自组织的数据分析算法-ISODATA】 翌懊锯梯妹扬瞳便狐巴警水湾玛镀淫艇斟泻辕邹罢灸柜释序赂菱掉邵棍茅模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 【迭代自组织的数据分析算法-ISODATA】 孽翅芳轧柴眠东狭泌瘁讫孟确趋苫乍扶彼徽拭骑县侮牛臣第徐囊蕾铲听倦模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 步骤9(求每类具有最大标准偏差的分量) 步骤10(分裂计算步骤) 【迭代自组织的数据分析算法-ISODATA】 杖路怖铲真存肤惋酥牙稻浩垦扁缅首垄世冀骤钩失岁窖曳涵叮哨锭以宦碌模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 合并处理: 步骤11(计算全部聚类中心之间的距离) 【迭代自组织的数据分析算法-ISODATA】 苍罕蛊呐颧锄什藤费逊乱浪睛豆燎卖退篆陌凰万农蔗铸焦鹃拇驮错邪垢粘模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 步骤12(列出类间距离过近者) 步骤13(执行合并) 【迭代自组织的数据分析算法-ISODATA】 却赋纷场改馁翱尼巢圆贬疽趟般粳肝钥娩妈翔堵飘水澎猾播借饿砚面颇瑟模式识别Ch8-非监督学习方法模式识别Ch8-非监督学习方法 * 步骤14(结束步骤) 如果迭代运算次数已达最大的迭代次数I,即是最后一次迭代,则算法结束;否则,如果需要由操作者
您可能关注的文档
最近下载
- 建筑工程图集 11SG814:建筑基坑支护结构构造.pdf VIP
- 电商平台客户投诉处理协调配合措施.docx VIP
- 快速心律失常的急诊处理PPT课件.ppt VIP
- 标准图集-新型城镇化-智能灯杆.pdf VIP
- 11SG814 建筑基坑支护结构图集.docx VIP
- 2024年11月江苏苏州市中医医院(西苑医院苏州医院)招聘编外人员笔试笔试历年专业考点(难、易错点)附带答案详解 .doc
- 广西壮族自治区家庭经济困难学生认定申请表.doc VIP
- 大闽食品(漳州)有限公司企业标准.doc VIP
- 施工企业安全生产事故报告及处理制度.docx VIP
- 电商平台纠纷处理与客服投诉管理方案.docx VIP
文档评论(0)