- 1、本文档共110页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时间序列挖掘相算法研究及应用
摘 要
随着计算机与信息技术的普及和大容量存储技术的发展,人们在日常事务处
理和科学研究中逐渐积累了大量的宝贵数据。这些数据背后蕴藏着对决囊有重要
参考价值的信息。如何充分有效地利用这些历史数据,从中提取出用户需要的信
息正成为当今数据挖掘领域广泛关注的热点问题。
时阃序歹1j数据反映了属性值在时间或空问顺序上的特征。利用时间序列数据
SeriesData
挖掘(Time Mining,简称TSDM),可以获得数据中蕴含的与时间相
关的有用信息,实现知识的提取。由于时间序列的数据类型复杂且具有高维性、
噪声干扰及波动性等特点,因此时间序列挖掘是数据挖掘中的一个重要研究方
向。目前重点的研究内容包括时间序列的模式表示、时间序列的相似性查询、时
间序歹|j的聚类积分类、时阊序歹{j的异常检铡等。
本文在国内外时间序列数据挖掘最新研究的基础上,以石油工业领域中测井
和录井色谱数据序列的分析处理为实际应用背景,对时间序列挖掘中的线性拟
合、在线划分、相似性度量、时态频繁模式挖掘四个方面的问题进行了研究分析,
提出一些算法和解决方案,取得一定成果。主要工作和创新之处有:
l。提出了一种基于关键点的时间序列线性拟合表示方法。该算法在扫描数
据的过程中利用单调序列中三个连续数据形成的夹角和非单调序列中的极值点,
从序列中挑选反映趋势变化的关键点,实现时间序列的线性拟合。实验结果表明
该算法拟合效果蘸好,剔除了嗓音干扰,并能够精确定位单调序列中的突变转折
点,发现序列中的尖蜂状态。
2.提出了一种基于层次聚类的在线序列分割算法。该算法利用数据序列的
有序性特征,构造了一种存储划分特征的链表结构,一次扫描数据库完成数据序
列的在线划分,时间复杂度为O(rt)。同时,利用链表结构中保存的划分特征信息,
历史信息的快速查询成为可能。实验结果表现此算法具有良好的划分性能和可扩
展性能。
3.提出了一种基于关键点动态时间弯曲距离的相似性度量方法.该方法在
时间序列线性拟合的基础上,仅使用序列中的关键点用于弯曲距离矩阵计算。实
验结果表明:基于关键点的动态时间弯曲距离度量方法在准确性上优于欧氏距
离,与经典的动态时间弯曲距离近似,但明显提高了捡索速度。
4.对FP.growth算法进行改进,使之适用于时态约束下的频繁模式挖掘。
由于经典的频繁模式挖掘算法FP-growth没有考虑时间向量的影响,无法直接应
时问序列挖掘相关算法研究及应用
用于时态频繁模式的挖掘。改进后的算法构造了一种用于存储频繁模式时态属性
的双树结构。利用这种双树结构,两次扫描数据库实现时态频繁项目的有效挖掘。
实验结果表明该算法是有效的和可扩展的。
5.针对目前石油工业领域中各类数据序列的特点和实际的应用需求,给出
时间序列挖掘算法在测井和录井数据序列中的应用样例。实验结果显示:①数据
序列在线划分算法实现了测井曲线的快速粗划分和分段信息的快速查询;②数据
序列线性分段拟合方法能够有效捕获色谱和测井数据序列中的尖峰予序列,准确
定位序列中的变化转折点,忽略变化细微的数据点,在保持序列形态不变的同时
极大地降低了数据存储量。
全文共分为七个章节,第一章对时间序列挖掘进行了综述,包括其应用背景、
国内外研究进展等;第二章至第五章从四个方面展开了算法研究探讨:时间序列
的线性拟合、时间序列的在线划分、时间序列的相似性度量和时态频繁模式挖掘;
第六章在上述研究的基础上,给出了序列挖掘算法在石油测井和录井数据序列中
的应用实例;最后一部分,即第七章,对全文进行总结,并提出了进一步的研究
。
思路。
关键词:时间序列,线性拟合,关键点,在线划分,划分特征链表,相似性查询,
时态频繁模式
ABSTRACT
Witllthe of and
information the
popularitycomputer technology,andgreat
of of amountofdataisaccumulated
developmentstoragetechniq
您可能关注的文档
- web中文信息取技术与命名实体识别方法的研究.pdf
- web信息内容其特征提取方法研究.pdf
- web信息资源价及分类的研究.pdf
- web协同编辑标注的一致性维护技术研究.pdf
- web持久层的究与应用.pdf
- web数据管理的分布式图数据存储和查询.pdf
- web数据库重估计技术研究.pdf
- web搜索引擎搜索结果聚类研究.pdf
- web日志挖掘术应用研究.pdf
- web服务合成统中参数库优化算法的研究.pdf
- 2025年沙洲职业工学院单招职业倾向性考试题库推荐.docx
- 2025年广元中核职业技术学院单招综合素质考试题库及参考答案.docx
- 2025年浙江纺织服装职业技术学院单招职业倾向性测试题库学生专用.docx
- 2025年新星职业技术学院单招综合素质考试题库及参考答案.docx
- 2025年江西陶瓷工艺美术职业技术学院单招职业技能测试题库汇编.docx
- 2025年江西应用技术职业学院单招职业倾向性考试题库学生专用.docx
- 2025年内蒙古科技职业学院单招职业适应性考试题库汇编.docx
- 2025年山东化工职业学院单招综合素质考试题库及参考答案1套.docx
- 2025年郴州职业技术学院单招职业适应性测试题库新版.docx
- 2025年湖南电气职业技术学院单招职业倾向性考试题库最新.docx
最近下载
- 2024年江苏省淮安市中考数学试卷附答案解析.docx
- 2025山东省高校毕业生“三支一扶”计划招录1000人左右笔试备考题库及答案解析.docx
- 2022年口腔主治医师《专业实践能力》口腔内科学口腔黏膜病.doc
- DBJT14-101-2013 膨胀玻化微珠浆料复合保温板外墙外保温系统应用技术规程 .docx VIP
- 江苏省淮安市小升初数学试卷(上午场).doc VIP
- 江苏省淮安市小升初数学试卷.docx VIP
- 2025年山东省烟草专卖局校园招聘笔试备考试题及答案解析.docx
- 牙周病学思维导图.pdf VIP
- 江苏省淮安市2024届小升初数学试卷.doc VIP
- 计算机辅助药物设计专家讲座.pptx
文档评论(0)