网站大量收购独家精品文档,联系QQ:2885784924

时间序列相似搜方法的研究.pdf

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时间序列相似搜方法的研究

时间序列相似搜索方法的研究 摘要 时间序列相似搜索的研究 专业: 计算机软件与理论 硕士生: 涂宇 指导老师: 刘玉葆副教授 摘要 时间序列数据泛指随时问或空间有序变化的数据,这些数据往往采用等时间 或等空间间隔测量。时间序列数据广泛应用于商业、经济、地质、生物医药、太 空探测等诸多科学工业领域中。如何充分有效地管理和利用这些时间序列数据, 从中发现隐藏的规律和知识,受到广泛关注。由于时间序列数据具有高维性、噪 声干扰及波动性等特点,因此时间序列数据挖掘成为数据挖掘中的一个重要研究 方向。 时间序列数据挖掘大体可以分为时间序列表示和挖掘两个阶段。时间序列表 示是提取时间序列的主要特征,在更高层次上对时间序列重新描述。挖掘是指对 表示后的时间序列做进一步的数据挖掘工作。本文主要在时间序列表示和相似搜 索方面做了相关研究。本文主要工作为如下几个方面: 1.时间序列的表示是时间序列数据挖掘研究的基础。重要点的分段表示法 (IP)是目前应用最为广泛的时间序列特征提取方法之一,具有较好的数据压缩和 去除噪声能力,但参数的选择对时间序列的近似效果有很大的影响。基于多分辨 率的重要点检索分段方法(MIP)也是一种时间序列特征提取方法,该方法能很好 的近似时间序列,但运行效率比较低。为了改进以上两种方法的不足,我们提出 了一种改进的序列分段的方法:基于重要点的多分辨率检索表示法。针对时间序 列的benchmark做了大量的实验,从误差,压缩率、效率等方面来衡量本文方法 和前面两种方法。实验表明,与基于重要点的分段方法相比,MRIP方法能对时 间序列进行更好的压缩,误差更小,有更好的近似效果;与基于多分辨率的重要 点检索分段方法相比,在近似效果相当的情况下,运算效率更高。 2.基于BIRCH聚类特征及凝聚层次聚类的思想和时间序列数据相邻的点有 内在的依赖关系,本文提出了基于聚类特征的时间序列划分算法(Segmentation fortimeseriesbasedonBIRCH algorithm Clustering,简称SBC)。对时间序列的 l 时间序列相似搜索方法的研究 摘要 benchmark做了相关划分实验,并和经典的SW划分算法进行实验对比。通过实 验结果分析,本文划分方法能达到很好的划分性能。 3.采用基于重要点的多分辨率检索表示法提取特征模式后,对提取的模式 序列提出了基于斜率模式的动态时间弯曲距离度量(Slope)WTD.于基用采。 BIRCH聚类特征的时间序列划分算法提取特征模式后,对提取的模式序列介绍了 基于均值模式的动态时间弯曲距离度量(Mean 实验,本文提出和介绍的距离度量有很好的过滤性能。与全序列DTw搜索相比, 只对极少量满足过滤条件的序列与待搜索序列进行全序列DTW距离计算,在时 间性能上有很大的提高。 关键字:数据挖掘时间序列划分算法相似搜索 Ⅱ 时间序列相似搜索方法的研究 ABSTRACT Researchon inTime SimilaritySearching SeriesDatabase and SoftwareTheories Major:Computer Name:砌翰 ProfessorLiuYubao

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档