网站大量收购闲置独家精品文档,联系QQ:2885784924

面向时间序列的鲁棒模糊聚类研究.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

随着计算机信息技术的迅速发展,时间序列数据的应用在金融、生物、医学、气象、

电力、工业和农业等各个领域不断兴起。为更好地发现时间序列数据中的有效信息,时

间序列聚类技术受到研究人员的广泛关注。对时间序列聚类的研究中,由于时间序列数

据的高维性和复杂性,致使传统的聚类方法在处理这类数据时存在很多局限性。而模糊

聚类提供了更灵活的聚类标准,对难以定义集群之间清晰边界的时间序列数据提供更多

可解释性,这使得时间序列模糊聚类研究被普遍重视。在时间序列数据集中不可避免地

会存在一些噪声或异常值,模糊聚类对噪声数据敏感的问题便成为研究重点之一。综上,

本文将针对时间序列的鲁棒模糊聚类展开研究,主要研究内容如下:

(1)针对时间序列模糊C均值聚类算法对噪声数据敏感,及其未能将数据中少量已

标记数据所包含的监督信息进行有效利用的问题,提出了一种改进的鲁棒性半监督模糊

C均值聚类算法(SRFCM)。该算法使用马氏距离提出一种样本不确定性分析方法,并

加入到半监督模糊C均值聚类建模中,以消除噪声点的影响。其次改进半监督模糊C

均值聚类的部分监督机制来加大已标记数据的监督能力。采用能够弹性度量时间序列相

似性的时间扭曲编辑距离代替欧氏距离进行聚类。通过对7组公开的时间序列数据集进

行实验对比,结果表明所提算法具有良好的聚类效果。

(2)数字信息的快速增长产生了大量具有丰富特征的时间序列数据,大多数时间序

列数据都是有噪声的,并包含一些异常样本,这导致了聚类效果的下降。为有效地发现

时间序列数据中隐藏的统计信息,提出了一种基于P-Splines的快速加权模糊C-medoids

聚类算法(PS-WFCMdd)。该算法使用P-Splines方法来拟合与原始时间序列数据相关

的函数数据,并将获得的平滑拟合数据用作聚类算法的输入,以增强聚类过程中处理数

据集的能力。然后,在加权模糊C-medoids聚类过程中定义了一种新的加权方法,以避

免孤立点的影响,提升算法的鲁棒性。提出使用Mueen相似性搜索算法来快速准确地测

量时间序列之间的相似性,以提高聚类效率。将PS-WFCMdd算法与其他几种主流时间

序列聚类算法进行了比较,在不同类型的时间序列实例上对该算法的性能进行了实验评

估。实验结果表明,所提算法可加快时间序列数据处理速度,在各聚类评价指标下的综

合性能较好。

关键词:模糊聚类,半监督聚类,时间序列,相似性度量

ABSTRACT

Withtherapidprogressofcomputerinformationtechnology,theapplicationoftimeseriesdatahas

beenrisinginvariousfieldssuchasfinance,biology,medicine,meteorology,electricity,industry,and

agriculture.Inordertobetterextractandfindtheusefulinformationinthesetimeseriesdata,timeseries

clusteringtechnologyhasbeenwidelyconcernedbyresearchers.Inthestudyoftimeseriesclustering,due

tothehighdimensionandcomplexityoftimeseriesdata,traditionalclusteringmethodshavemany

limitationswhendealingwiththiskindofdata,fuzzyclusteringprovidesamoreflexibleclustering

standardandprovidesmoreinterpretabilityforthetimeseriesdatathatisdifficu

文档评论(0)

论文资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档