新型时间序列相似性度量的方法的研究.docVIP

  • 15
  • 0
  • 约4.54千字
  • 约 10页
  • 2018-10-17 发布于福建
  • 举报

新型时间序列相似性度量的方法的研究.doc

新型时间序列相似性度量的方法的研究

新型时间序列相似性度量的方法的研究   摘要:基于时间序列符号化后的特点,创造性地提出了一种新型相似性度量方法――符号化的统计向量空间法(SAX[1] Statistical Vector Space,SSVS)。将这种度量方法用于SP500指数的股票数据聚类实验,并与经典相似性度量方法比较,结果表明这种新的方法能够高效地从整体趋势的角度度量时间序列的相似性,有很好的实际意义和应用前景。   关键词:时间序列; 相似性度量; 数据挖掘; 符号化   中图分类号:TP391.41文献标志码:A   文章编号:1001-3695(2007)05-0112-03      近年来,随着数据不断丰富,人们对强有力的数据分析工具的需求增加,数据挖掘开始得到广泛的应用[1]。例如对海量数据进行分析处理,挖掘其中蕴涵的各种信息,对于揭示事物发展的规律,发现不同的事物发展之间的相互关系等具有重要的实际意义。其中,时间序列数据会随着时间的推移规模不断扩大。因此针对时间序列数据的数据挖掘研究一直以来受到了学术界和工业界的广泛重视,成为了一个具有重要理论和实际价值的热点研究课题。??   时间序列的相似性度量是衡量两个时间序列的相似程度的方法;它是时间序列分类、聚类、异常发现等诸多数据挖掘问题的基础,也是时间序列挖掘的核心问题之一。欧氏距离(Euclidean)和动态时间弯曲(Dynam

文档评论(0)

1亿VIP精品文档

相关文档