排序的子序列相似查询方法-燕山大学学报.PDF

排序的子序列相似查询方法-燕山大学学报.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
排序的子序列相似查询方法-燕山大学学报

卷 期 燕山大学学报 年 月 文章编号:1007-791X (2009) 05-04 17-05 排序的子序列相似查询方法 鹤,赵 威,余 靖,金顺福,刘国华 (燕山大学 信息科学与工程学院,河北 秦皇岛 ) 摘 要:时间序列数据的高维性是影响数据查询代价的主要因素,降维技术是时间序列数据查询优化的有效手 段。原有降维技术近似体积的无界性,造成索引阶段不能充分实现点过 ,影响了查询效率。首先,利用近似 体积有界的非线性降维技术解决了点过滤问题。然后,引入提前终止技术,减少了原始序列距离计算阶段的冗 余计算。在此基础上,提出排序的子序列相似查询算法。实验结果表明,排序子序列相似查询方法具有较高的 效率。 关键词:排序;非线性降维;提前终止技术;紧密下限 中图分类号:TP311 文献标识码:A 计算和 代价高昂。因此时间序列相似性 引言 查询方法是采用降维技术首先对原始序列降维,在 时间序列是按照时间先后顺序排列的观测记 确定索引方式后, 据查询标准进行时间序列的相 录的有序集合,广泛应用于商业、经济和科学等领 似查询。 域。时间序列相似查询是在时间序列数据库中查找 文献 首次提出了子序列的相似查询算法, 与给定序列模式相似的序列。很多领域都涉及时间 为了支持不同长度的子序列相似查询,采用离散窗 序列相似查询,例如金融决策、股票分析、瓦斯数 口分割查询序列,滑动窗口分割数据序列,滑动窗 据监测、地震数据分析、视频流的关键帧提取等。 口分割数据序列造成大量特征数据点存储在索引 时间序列相似性查询是时间序列数据挖掘的基础, 结构中,使得遍历索引阶段不能很好进行点过 。 广泛应用于时间序列的分类、聚类等领域 。 为了克服文献 的缺点,文献 采用离散窗 据序列长度,时间序列相似查询可以分为两 口分割数据序列,滑动窗口分割查询序列。离散窗 类 :全序匹配,所有时间序列的长度相等,查询 口分割数据序列,大大减少了存储点的数量,提高 的目的是从数据库中找到与查询序列相似的时间 索引阶段的点过 ,减少原始序列距离计算。文献 序列;子序列匹配,当查询序列的长度小于数据库 、 都是采用离散傅立叶变换的降维方法实现 中时间序列的长度时,找出序列数据库中与查询序 序列降维,但是离散傅立叶变换平滑了许多原始序 列相似的子序列。 列信息,不能精确表示原始序列。文献 分析 了目前时间序列降维技术的主要缺陷在于会造成 据查询标准,时间序列相似查询可以分为两 近似体积的无界性,使得原始序列计算次数过多, 类 : 最近邻查询,找出个与查询序列最相似 算法效率较低。然后提出一种近似体积有界的非线 的序列或子序列;范围查询,找出与查询序列的距

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档