机器学习 课件 5.5基于约束的聚类和在线聚类.pdf

机器学习 课件 5.5基于约束的聚类和在线聚类.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于约束的聚类和在线聚类

聚类分析

基于约束的聚类

①个体对象的约束

②聚类参数选择的约束

③距离或相似度函数的约束

④用户对各个簇的性质指定约束

⑤基于“部分”监督的半监督聚类

聚类分析

基于约束的聚类

含有障碍物的对象聚类

思考:如何不游泳而使用河对面的自动取款机。

聚类分析

基于约束的聚类

含有障碍物的对象聚类

障碍物问题的实质是对距离函数产生约束。

划分的聚类方法是解决障碍物问题的一种较好的选择,因为它

最小化对象和它们的簇中心之间的距离。

如果选择K-means方法,在障碍物存在的情况下,簇中心可能

是不可达的。

聚类分析

基于约束的聚类

用户约束的聚类分析

一家快递公司的快递送达服务满足约束:

思考:

(1)每站至少服务100个高价值客户;

(2)每站至少服务5000个普通客户。

如何确定共服务n个客户的k个服务点的位置,使客户和

服务站之间的路程最小。

聚类分析

基于约束的聚类

用户约束的聚类分析

这本质上,可以认为这是一个受约束的最优化问题。

用数学规划方法解决这个问题的代价是巨大的,比如要联立数百万的方程。

聚类分析

基于约束的聚类

用户约束的聚类分析

一种有效的方法是采用一种微聚类的思想

Ø通过把数据集划分为k组寻找一个初始“解”,每组满足用户指定的

约束。

Ø再把对象从一个簇转移到另一个簇来迭代的改进这个解,同时还要满

足那些约束。

聚类分析

基于约束的聚类

半监督聚类分析

基于约束的半监督聚类

半监督聚类方法

基于距离的半监督聚类

聚类分析

在线聚类

针对数据随时间会发生变化的数据集,研究者提出在线聚类算法处理这类问题。

在线学习产生的问题

聚类结果常常表现出对于准则函数中参数变化过于敏感,特别是当这些方法用于

在线学习时,可能会出现聚类结构不稳定的问题,簇的波动或者漂移。

如果数据内部结构不稳定而且新获得的信息会造成较大的结构重组,那么问题就

会变得比较复杂,因而就不能把问题只归因于特定的聚类描述。(稳定性/可塑性

两难问题)

聚类分析

在线聚类

“竞争学习”

“竞争学习”只对与新到样本最相似的一个聚类中心进行调整。

因此与该样本无关的其它类的性质得以保留。

竞争学习源自神经网络,在线聚类方法是多种思想结合的产物。

TheEnd

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档