网站大量收购独家精品文档,联系QQ:2885784924

时间序列挖掘相算法研究及应用.pdf

  1. 1、本文档共110页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时间序列挖掘相算法研究及应用

摘 要 随着计算机与信息技术的普及和大容量存储技术的发展,人们在日常事务处 理和科学研究中逐渐积累了大量的宝贵数据。这些数据背后蕴藏着对决囊有重要 参考价值的信息。如何充分有效地利用这些历史数据,从中提取出用户需要的信 息正成为当今数据挖掘领域广泛关注的热点问题。 时阃序歹1j数据反映了属性值在时间或空问顺序上的特征。利用时间序列数据 SeriesData 挖掘(Time Mining,简称TSDM),可以获得数据中蕴含的与时间相 关的有用信息,实现知识的提取。由于时间序列的数据类型复杂且具有高维性、 噪声干扰及波动性等特点,因此时间序列挖掘是数据挖掘中的一个重要研究方 向。目前重点的研究内容包括时间序列的模式表示、时间序列的相似性查询、时 间序歹|j的聚类积分类、时阊序歹{j的异常检铡等。 本文在国内外时间序列数据挖掘最新研究的基础上,以石油工业领域中测井 和录井色谱数据序列的分析处理为实际应用背景,对时间序列挖掘中的线性拟 合、在线划分、相似性度量、时态频繁模式挖掘四个方面的问题进行了研究分析, 提出一些算法和解决方案,取得一定成果。主要工作和创新之处有: l。提出了一种基于关键点的时间序列线性拟合表示方法。该算法在扫描数 据的过程中利用单调序列中三个连续数据形成的夹角和非单调序列中的极值点, 从序列中挑选反映趋势变化的关键点,实现时间序列的线性拟合。实验结果表明 该算法拟合效果蘸好,剔除了嗓音干扰,并能够精确定位单调序列中的突变转折 点,发现序列中的尖蜂状态。 2.提出了一种基于层次聚类的在线序列分割算法。该算法利用数据序列的 有序性特征,构造了一种存储划分特征的链表结构,一次扫描数据库完成数据序 列的在线划分,时间复杂度为O(rt)。同时,利用链表结构中保存的划分特征信息, 历史信息的快速查询成为可能。实验结果表现此算法具有良好的划分性能和可扩 展性能。 3.提出了一种基于关键点动态时间弯曲距离的相似性度量方法.该方法在 时间序列线性拟合的基础上,仅使用序列中的关键点用于弯曲距离矩阵计算。实 验结果表明:基于关键点的动态时间弯曲距离度量方法在准确性上优于欧氏距 离,与经典的动态时间弯曲距离近似,但明显提高了捡索速度。 4.对FP.growth算法进行改进,使之适用于时态约束下的频繁模式挖掘。 由于经典的频繁模式挖掘算法FP-growth没有考虑时间向量的影响,无法直接应 时问序列挖掘相关算法研究及应用 用于时态频繁模式的挖掘。改进后的算法构造了一种用于存储频繁模式时态属性 的双树结构。利用这种双树结构,两次扫描数据库实现时态频繁项目的有效挖掘。 实验结果表明该算法是有效的和可扩展的。 5.针对目前石油工业领域中各类数据序列的特点和实际的应用需求,给出 时间序列挖掘算法在测井和录井数据序列中的应用样例。实验结果显示:①数据 序列在线划分算法实现了测井曲线的快速粗划分和分段信息的快速查询;②数据 序列线性分段拟合方法能够有效捕获色谱和测井数据序列中的尖峰予序列,准确 定位序列中的变化转折点,忽略变化细微的数据点,在保持序列形态不变的同时 极大地降低了数据存储量。 全文共分为七个章节,第一章对时间序列挖掘进行了综述,包括其应用背景、 国内外研究进展等;第二章至第五章从四个方面展开了算法研究探讨:时间序列 的线性拟合、时间序列的在线划分、时间序列的相似性度量和时态频繁模式挖掘; 第六章在上述研究的基础上,给出了序列挖掘算法在石油测井和录井数据序列中 的应用实例;最后一部分,即第七章,对全文进行总结,并提出了进一步的研究 。 思路。 关键词:时间序列,线性拟合,关键点,在线划分,划分特征链表,相似性查询, 时态频繁模式 ABSTRACT Witllthe of and information the popularitycomputer technology,andgreat of of amountofdataisaccumulated developmentstoragetechniq

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档