- 1、本文档共77页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
数据采集频率增加导致出现了具有“函数”性质的数据,函数型数据分析
(FunctionalDataAnalysis,FDA)应运而生,其中函数型聚类分析(Functional
Clustering)成为探索函数型数据的重要工具。目前,对于函数型聚类分析的研究
大多采用“曲线拟合+聚类”的两步法实现,存在提取最优类别信息效果不佳、
计算成本高等问题,这会影响聚类效果的准确性和效率。为了解决这些问题,本
文在非负矩阵分解(Non-negativeMatrixFactorization,NMF)的框架下,采用函数
型数据分析方法,侧重研究基于非负矩阵分解的函数型聚类一步法,主要研究内
容包括以下三部分:
(1)为了有效利用数据的非线性和低维流形结构,提出了基于双随机图正
则化矩阵分解的函数型聚类算法(FunctionalClusteringAlgorithmBasedon
Bi-stochasticGraphRegularizedMatrixFactorization,BSMFFC)。引入图正则化技
术,构造最近邻图来模拟流形结构,结合双随机矩阵动态更新图,从而充分利用
了数据的固有几何结构信息。同时,给出了模型的优化求解算法,并计算了时间
复杂度。模拟实验结果验证该算法可行性,实例应用验证了该算法的实用性。
(2)针对含有噪声和异常值的情况,提出了基于鲁棒图正则化矩阵分解的
函数型聚类算法(FunctionalRobustManifoldNonnegativeMatrixFactorization,
FRMNMF)。利用范数来定义损失函数,从而减弱数据中噪声或异常值的影响,
并利用流形学习,保证了数据的局部不变性。给出更新算法,并证明了算法收敛
性和计算复杂度。在合成数据和真实数据上的实验结果表明,该算法在函数型聚
类任务中具有一定的鲁棒性。以城镇居民人均可支配收入数据应用为例,其聚类
结果表明该算法的可行性、合理性及实际应用价值。
(3)针对多视角函数型数据出现缺失的情况,提出一种自加权不完整多视
角函数型聚类算法(AdaptiveIncompleteMulti-viewClusteringforFunctional
dataset,AIMFC)。将多视角学习、非负矩阵分解以及矩阵填充进行融合,采用
自加权方法为每个视角分配相应的权重。给出算法更新公式,借助模拟实验,验
证了该算法的可行性。此外,对于针对北京市空气污染物小时浓度数据所得出的
聚类结果而言,改进后的算法在缺失数据聚类问题上表现出了优异的效果。
关键词:函数型数据聚类分析非负矩阵分解鲁棒性缺失值多视角学习
Abstract
TheincreasingfrequencyofDatacollectionhasledtothe
emergenceofFunctionaldata,andFunctionalDataAnalysis(FDA)has
emerged,inwhichFunctionalClusteringhasbecomeacrucialinstrument
forexploringfunctionaldata.Currently,mostresearchesonfunctional
clusteranalysisadoptthetwo-stepmethodofcurvefitting+clustering,
whichhasproblemssuchaspooreffectofextractingoptimalcategory
informationandhighcomputingcost,whichwillaffecttheaccuracyand
efficiencyofclusteringeffect.Inordertosolvetheseproblems,thispaper
adoptsfunctional
文档评论(0)