- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
!旦型!鱼旦翌苎塑生兰型!!垫 堕塑壁型墼塑塑堡塞垄里墨塑塑查鎏堡壅
摘要
数据挖掘(Data
Mining)是人工智能领域和数据库领域相结合的热点研究课题,其
目标是在数据库中提取隐含的、先前未知的、潜在有用的知识。
时间序列数据反映了属性值在时间顺序上的特征。现实世界中大量数据的采集与时
间相关,数据具有时间上的关联性。因此,时间序列的知识发现是数据挖掘中的一类非
常重要的问题。利用时间序列的数据挖掘,可以获得数据中蕴含的与时间相关的有用信
息,实现知识的提取。在许多实际应用中,研究时间序列局部特征的变化并识别表示重
大事件发生的局部模式很有意义,比如在股市数据中识别出和股票价格骤然变化相关的
模式非常重要,模式的正确识别有助于对数据趋势的分析和对未知事件的预测。因此从
时间序列数据中挖掘时序模式并根据这些模式进行预测,是一个具有十分重要的理论与
实践意义的课题。
本文全面和深入的探讨了时间序列数据挖掘问题:讨论了该领域的研究现状、最新
技术和进展,研究了时间序列的模式匹配、规则发现、事件检测和预测问题,分析了现
有的一些算法并在此基础上提出了新的解决问题的方法。具体来说,研究内容主要包括:
模式匹配,模式的自动发现和事件预测。它们之间存在一定的依赖和关联,并且和具体
时间序列的特征表示紧密相关。
相似模式匹配的研究涉及特征提取、相似性度量、多维索引结构、查询匹配算法等。
我们分析了现有的时间序列特征抽取方法和多维索引结构的优缺点,提出了新的时序特
征抽取方法一事件序列,本文的大部分工作都是基于事件序列进行的;改进了现有的
多维索引结构,提出和实现了相应的模式匹配算法,该算法和现有方法相比能够提高模
式查询的精度。我们还通过实验研究了小波分析方法在时间序列模式匹配中的应用。
在模式的自动发现方面,由于时间序列数据和时间紧密相关,我们对传统的基于事
务数据库的关联规则挖掘方法进行了改进,使之适用于事件序列的数据挖掘,抽取出和
事件的发生趋势和变化率相关的规则,并采用一些评估方法对规则进行过滤和排序。同
时提出了一种新的基于聚类方法的模式生成算法,挖掘出有代表性的相似模式集合,通
过实验和传统的聚类方法进行了比较。
在时间序列的预测研究中,传统方法预测的是下一个点的值,而我们预测下一个重
要事件的发生。提出了一种基于事件特征的预测模型:首先将事件序列转换为一个特征
序列,然后通过特征选择对未来事件的特征进行预测,同时分析和定义了时间序列在不
同尺度上的可预测性,最后将对特征的预测还原为对未来事件的预测。特征选择是很多
机器学习算法包括预测算法有效执行的前提,数据中冗余的信息直接影响到算法的性
能,文中在讨论现有特征选择方法的基础上,提出了一种改进的基于分形维数的特征选
择方法。
本论文对上述这三个方面进行了深入研究,从时间序列数据库中搜索相似的模式,
中国科学技术大学博士学位论文 时间序列数据的模式发现及预测方法研究
自动抽取出潜在的时序模式,对时间序列的未来事件进行预测。
本文的主要工作和创新点如下:
1.提出了新的时间序列特征表示方法一事件序列,基于该表示方法提出和实现了一
种改进的多维索引结构和相应的相似模式匹配算法,并通过实验证明在一定程度上
提高了模式查询的精度:
2.基于事件序列,提出并实现了基于关联规则和聚类方法的模式发现算法。事件序列
是一种和时间相关的序列,需要对传统的基于事务数据的挖掘方法进行很多改进;
3.提出和实现了一种新的基于事件特征的预测模型,定义和分析了事件序列的多尺度
性和可预测性,对时间序列未来事件的发展趋势进行预测。提出了一种改进的基于
分形维数的特征选择方法,从数据集中抽取出最具有代表性的属性子集。
文中我们使用一些经典的时间序列数据和现实数据如股票数据,对上述研究结果进
行了测试和验证。同时我们开发了一个基于电力数据的负荷预测系统,通过对大量和时
间相关的历史负荷数据和气象数据进行挖掘,抽取出一些有价值的信息,并将其用到短
期负荷预测中。
关键词:数据挖掘,时间序列,事件序列,模式匹配,模式发现,事件预测
Ⅱ
!里型堂垫查奎兰堡主兰堡堡茎
原创力文档


文档评论(0)