- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
譜聚类的推导
谱聚类的推导
两类别谱聚类
样本集合,输入空间到特征空间的映射,对应的核函数,假设在特征空间中的样本为规范化的样本,即:。
K为对应的核矩阵:
定义一个n维样本聚类标示矢量,对应中元素为-1的样本标示为一个类别,+1的样本标示为另一个类别。假定两个类别的样本数量相等,即:
选择类间离散度准则进行优化:
此准则的意义是寻找一种对样本集合的划分(由标示矢量确定),使得不同类别之间的样本距离平方和最大。
其中用到,。
由于,因此优化问题等价于最小化:
其中第一项与无关,因此优化问题可以表示为矩阵形式:
Subject to ,
直接求解上述优化问题是一个组合优化问题,属于NP难题。这里对上述问题进行松弛,首先不再要求的元素必须是-1或者+1,同时也不再要求两个类别的样本数相等,而是转而约束的长度为1,这样上述问题可以转化为一个无约束的Raleigh商的优化问题:
参考PCA的推导过程,最优矢量为矩阵对应最大特征值的特征矢量。为了最终得到对样本的聚类结果,可以对中的元素阈值化,大于阈值的对应样本为一个类别,小于阈值的对应样本为另一个类别。
多类别谱聚类
令为样本矩阵,每一行一个样本,是一个的矩阵,n为样本数,d为特征维数(可以是无穷);是一个的指派矩阵,m是聚类的个数,A的每一行中只有一个元素为1,其他元素为0,1的位置表示对应样本被指派到该类别;是一个的对角矩阵,其对角线元素为被指派到对应类别的样本数的倒数,矩阵依赖于矩阵。
可以验证维的矩阵的每一列是对应聚类的均值。而维矩阵的每一列为对应样本被指派聚类的均值。
选择类内离散度平方误差准则:
其中矩阵的范数采用的是Frobinus范数,即所有元素的平方和。这一准则的目标是使的所有的样本到其被指派的聚类中心距离的平方和最小。
令为n维的单位矩阵,则有(见附录1),因此:
上式第1项与无关,核矩阵,因此优化问题可以转化为:
可以验证,令,则变成如下优化问题:
Subject to
由于,可以证明(见附录2):,因此可以对进行优化。
分别将和写成行矢量和列矢量的形式:
,
因此:
约束条件表明的列矢量是单位正交矢量,因此引入拉格朗日乘子,建立优化准则函数:
对的第k个列矢量求导:
其中:,因此有:,所以最优解的m个列是对应于核矩阵最大m个特征值的特征矢量。而最大值为,是由大到小排列的的特征值(参见PCA的推导)。
上述结论只是表明可以通过核矩阵的特征值确定聚类的数目,样本的具体类别划分还需要根据相应的特征矢量采用其他方法得到。
附录1
证明:
矩阵是一个的矩阵,其主对角线元素是对应样本所属类别(第k类别)样本数的倒数,如果第i个样本和第j个样本属于不同类别,则第(i,j)元素为0,否则为所属类别样本的倒数。矩阵的主对角线元素为,其他的0元素仍为0,非零元素变为。
矩阵的主对角元素为:
其他的0元素仍然是0,非0元素为:
因此有:
附录2
证明:
是一个维的矩阵,是一个维的矩阵:
,
因此:
计算可以得到:
其中外层(对k求和)是在对角线上求和,内层(对j求和)是每一行同自身的内积求和。
同时:
因此:
其中外层(对k求和)是按行求和,内层(对j求和)是按列求和。
因此有:
您可能关注的文档
- 證券投资学_股票基本分析.docx
- 證券投资学复习讲义.doc
- 證券投资学上机实验报告.doc
- 證券投资学复习讲义1.doc
- 證券投资学复习重点.doc
- 證券投资学实验报告.doc
- 證券投资学实验报告10级高职.doc
- 證券投资学实验报告行业与公司分析.doc
- 證券投资学总结.doc
- 證券投资学期末复习资料.doc
- 1 阳光工程引导性培训基础知识课件-高一《蔬菜生产技术》同步教学(北理工版).pptx
- 第5章 瓜类蔬菜种植与病虫害防治课件-高一《蔬菜生产技术》同步教学(北理工版).pptx
- 6 茄果类蔬菜种植课件-高一《蔬菜生产技术》同步教学(北理工版).pptx
- 项目五茄果类蔬菜生产任务三辣椒生产(一)(课件)-高二《蔬菜生产技术》同步教学(机械工业出版社).pptx
- 9.2人格形成的生物学因素(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 2.2 蔬菜栽培的理论基础知识 生长与发育(课件)- 高一《蔬菜生产技术(南方本)》同步教学(中国农业大学出版社).pptx
- 6.2句子发展(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 6.3语言获得理论(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 13.2儿童和青少年逆反(课件)《儿童发展心理学》(华东师范大学出版社).pptx
- 项目二设施的环境特点及调节控制(课件)-高二《蔬菜生产技术》同步教学(机械工业出版社).pptx
最近下载
- 2025年金融风险管理师期货保证金制度成功案例分析专题试卷及解析.pdf VIP
- 围术期血流动力学监测1.ppt VIP
- 2025年拍卖师创新能力基础理论专题试卷及解析.pdf VIP
- 2025年信息系统安全专家云数据安全策略专题试卷及解析.pdf VIP
- 2025年房地产经纪人佣金“阴阳合同”的法律风险与规避专题试卷及解析.pdf VIP
- 二十四节气ppt模板.pptx VIP
- 2025至2030中国大米加工行业市场深度调研及投资前景与投资策略报告.docx VIP
- SH╱T 3101-2017 石油化工流程图图例.pdf VIP
- 2025CSCO肾癌指南精要.pptx
- 2025年房地产经纪人带抵押过户(“带押过户”)登记新模式专题试卷及解析.pdf VIP
原创力文档


文档评论(0)