关于边界距离的时间序列聚类.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
http :// 基于边界距离的时间序列聚类 李俊奎, 王元珍, 李新萍 华中科技大学计算机科学与技术学院(430074 ) E-mail :jkltk2000@126.com 摘 要:聚类的关键是定义对象之间的相似度或不相似度。提出了一种基于边界的时间序列 距离度量DLB _ HUST ,较之已存在的基于边界的时间序列距离度量DLB _ Keogh ,DLB _ HUST 更下界且 是对称的距离度量,因而可以应用于时间序列聚类。引入了基于聚类边界的时间序列聚类方 法,每次新加入时间序列到簇中后更新簇的边界,使新簇中各个时间序列对簇边界施加影响。 实验结果表明,基于边界距离度量DLB _ HUST 的时间序列聚类方法优于基于Euclidean 距离和 DTW 距离度量的聚类方法,其是有效可行的。 关键词:时间序列, 聚类, 边界, 对称距离 1. 引 言 时间序列是一种重要的高维数据类型,它是由某个物理量在不同时间点的采样值按照时 间先后次序排列而组成的序列。在科学、工程和商业领域具有广泛应用。如:股票市场每天 的股票收盘价格数据、每季度乘坐某次航班的旅客数、电话公司每小时的话务量等都是时间 序列数据。近年来,对于时间序列数据的挖掘激发了越来越多的研究人员的研究热情[9] 。本 文主要讨论时间序列数据的聚类。 聚类是根据数据的不同特征,将其分组成为不同的数据类或簇(Cluster),使得同一簇个 体之间的距离尽可能地小,而不同簇个体之间的距离尽可能的大[5] 。给定一个数据集 ,将其划分为 个相似的子集簇 ,其中 ,且 k 。聚类的关键 X {x ,x ,...,x } k {C ,C ,...,C } C ⊆ X C X 1 2 n 1 2 k i ∪ i i 1 是定义对象之间的相似度或不相似度。目前时间序列之间的相似度研究主要集中在对于时间 序列的距离度量上。 Agrawal 等人[1]率先使用等长时间序列的Euclidean 距离度量时间序列间的相似度,后面 [6] [4] [7] [12] [11] 基于此衍生出DFT ,Haar ,PCA ,PAA ,APCA 等时间序列以及子序列相似度度 量。但是Euclidean 距离度量对于时间序列的突变比较敏感,对于不同步时间序列的相似度度 量则会出现较大的偏差。 Berndt 等人[2]则引入在语音识别中被广泛使用的DTW 距离作为时 间序列的相似度度量距离。 Keogh 等人[10]分析了DTW 距离的特性,针对时间序列索引和查 询提出了基于时间序列边界的DLB _ Keogh 距离,这是目前最好的时间序列度量距离,它下界于 Euclidean 距离和DTW 距离。但是DLB _ Keogh 距离不是一种对称的时间序列距离度量,所以并不 适合直接应用于时间序列的聚类。针对这个问题,我们提出了一种对称的基于边界的时间序 列距离度量DLB _ HUST ,并且证明了它下界于DLB _ Keogh ,从而为基于边界的时间序列距离度量应 用于时间序列聚类奠定了基础。 时间序列是一种特殊的高维数据,它具有随时间变化的幅度等特性,当前时间序列聚类 中用簇中一个对象或变种来表示簇中心并不能完全反映簇中所有时间序列的影响。于是我们 针对时间序列的这些特性,引入了时间序列簇的边界概念,并且证明分处两个时间序列簇的 - 1 - http :// 时间序列的

文档评论(0)

00625 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档