网站大量收购闲置独家精品文档,联系QQ:2885784924

基于符号表示的时间序列分类综述.pdfVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于符号表示的时间序列分类综述--第1页

基于符号表示的时间序列分类综述

武天鸿;翁小清;单中南

【期刊名称】《《河北省科学院学报》》

【年(卷),期】2019(036)003

【总页数】10页(P11-20)

【关键词】时间序列;符号表示方法;符号序列分类

【作者】武天鸿;翁小清;单中南

【作者单位】河北经贸大学信息技术学院河北石家庄050061

【正文语种】中文

【中图分类】TP391.4

0引言

时间序列通常是指按时间顺序排列而成的一组数据,任何有序的实值型数据都可以

当作时间序列处理[1]。时间序列分类是数据挖掘的基本任务之一,是指根据训练

集中对象所构建的分类模型判别被分类对象所属的类别[2]。时间序列分类已经被

广泛应用于模式识别、医疗诊断、工业控制、异常检测等生活的各个方面,时间序

列数据维度高,分类难度大。

时间序列符号表示是指在保持和反映时间序列数据基本特征的前提下,将高维多噪

声的连续实值型数据表示成低维直观的符号序列数据。时间序列符号表示方法不仅

具有简单、高效和离散化的优点,还可以有效消除噪声,使时间序列具有较强的可

基于符号表示的时间序列分类综述--第1页

基于符号表示的时间序列分类综述--第2页

读性,允许研究人员利用来自文本处理、信息检索和生物信息学等领域的算法。基

于符号表示的时间序列分类方法具有更高的分类性能和效率。

本文从基于趋势、基于聚类或进化计算、基于文本、基于频率域等方面,对符号时

间序列分类的研究进行了比较归类,并简要介绍了其在实际中的应用。

1基于趋势的符号表示方法

Lin等[3~4]提出的符号聚合近似表示方法SAX(SymbolicAggregate

approXimation)是一种经典的时间序列符号表示方法。SAX首先利用PAA方法

将规范化后的时间序列(均值为0,标准差为1)分段求均值,且假设PAA值服从高

斯分布,根据高斯曲线下的分段点将PAA值离散映射到相应符号空间。SAX方法

虽然简单高效,能够较好地体现时间序列的整体趋势,但是仅用分段的均值并不能

很好的描述时间序列的局部特征,无法区分具有相同均值不同趋势的时间序列,完

全不同的时间序列可能会得到相似的符号表示,且该方法只适于服从高斯分布的时

序数据。SAX的MINDIST距离度量认为字母表中相邻两个字母间的距离是0,这

种处理方式会造成不同字符串之间的距离误判为0,且下界距离的紧性较差,容易

产生误报。针对SAX存在的缺陷,很多学者对其进行了改进。在距离度量方面,

Fuad等[5]对查找表进行改进,考虑了相邻字母之间的距离,提出了UMD距离

(TheUpdatedMinimumDistance),在下界紧性(TightnessofLowerBound)

和分类性能方面,UMD都好于SAX的MINDIST距离。Bai等[6]提出的rSAX

(RandomShiftingbasedSAX)表示方法,通过随机小距离移动几次分段点,得

到一组合适的分段点,使得彼此接近的点以更高的概率映射到相同符号,与SAX

相比,rSAX具有更好的下界紧性。在局部特征描述方面,Lkhagva等[7]使用每

个分段的均值、最大值和最小值,提出了ESAX(ExtendedSAX),分类效果好于

SAX,但字符串长度增加为SAX的三倍,维数约简性能稍有下降。Malinowski

等[8]提出的符号表示方法1d-SAX,将每个分段(segment)的线性回归(主要是均

基于符号表示的时间序列分类综述--第2页

您可能关注的文档

文档评论(0)

xin999 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档