一种基于动态时间弯曲距离的快速子序列匹配算法.docVIP

一种基于动态时间弯曲距离的快速子序列匹配算法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于动态时间弯曲距离的快速子序列匹配算法   摘 要: 动态时间弯曲距离在用于计算时间序列间的距离时是极其耗费时间的,尤其是处理较大规模的时间序列数据库中的子序列匹配问题时,时间消耗更是难以忍受。该文提出一种新的低边界距离,能够快速滤掉不满足结果条件的时间序列,以提高查询速度,并证明该低边界距离不会丢弃真实的结果。一种基于水平边界区域的索引技术被用于进一步提高查询效率。分别以真实数据集和人造数据集作为实验数据来测试该文所提出的算法的性能,结果表明该算法在数据库规模上和序列长度上都有良好的健壮性。   关键词: 时间弯曲距离; 低边界距离; 范围查询; 数据库   中图分类号: TN911?34; TP311.13 文献标识码: A 文章编号: 1004?373X(2017)06?0025?06   Abstract: It is very time?consuming to calculate the distance between time sequences by using dynamic time warping distance, especially when the subsequence matching in large time?series databases is concerned. A new method of lower bound distance is presented in this paper, which can quickly filter the time sequences which are unable to satisfy the result condition, so as to improve the query speed. It is proven that the true results can not be lost if the method is used. To further increase the query speed, a technique for building an index based on skyline bounding region is also proposed. Some experiments with the data from real data set and synthetic data set were carried out to verify the performance of the methods. The results reveal that the method has robostness in the scale of database and sequence length.   Keywords: time warping distance; lower bounding distance; range query; database   0 引 言   时间序列是由一些在特定时间点上采样得到的实数组成。在现实世界中,有很多时间序列的例子,如股票的价格、天气的变化情况、商品的销售记录。时间序列间的相似性查询就是从时间序列数据库中发现与给定查询序列有相似的变化模式的序列,该操作在很多新的数据库应用领域(数据挖掘、数据仓库)中是很重要的,它能用于预测未来发展趋势、识别新的模式、发现规则[1?3]。例如,可能需要找出一天的股票价格中的特定模式来预测未来发展趋势;也可能需要找出历史上与今天有相似磁暴模式的日子来预测地球磁场的变化。   通常,时间序列相似性查询可以分为两类:全序列匹配和子序列匹配。全序列匹配是给定一条查询序列,在数据库中找出与其相似的完整数据序列,而子序列匹配是在数据库中找出与其相似的部分数据序列,即子序列。全序列匹配又可以看成是子序列匹配的一种特殊情况[3?5],故子序列匹配比全序列匹配有更广泛的应用。本文重点研究子序列匹配。   子序列匹配就是在给定一变长时间序列数据库、一长度为N的查询序列Q和阈值ε的情况下,从数据库中找出所有与查询序列相似的子序列(即子序列与Q之间的距离小于ε),并返回这些结果。   1 子序列匹配   在介?B子序列匹配前,先说明本文所用到的符号以及它们的定义,见表1。   1.1 动态时间弯曲距离   动态时间弯曲(Dynamic Time Warping,DTW)距离不要求时间序列中的元素与元素之间进行一一对应匹配,允许序列中的元素自我复制后再进行对齐匹配。当时间序列沿时间轴发生弯曲时,可以在弯曲部分进行自我复制,使两条时间序列之间的相似波形进行对齐匹配。DTW距离很好地解决了时间序列发生时间轴伸缩和弯曲后的相似

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档