- 1、本文档共53页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
时间序列的聚类关联规则挖掘研究
型燮鲨型茎. ㈣哕燃必
摘 要
信息技术的高速发展导致了海量数据的产,生。如何在这些海量数据中发现有用的
知识,是我们目前面临的最主要问题。数据挖掘技术的出现,为解决这一问题提供了
有力的工具。在这些海量数据中,有一类很重要的数据对象——时|’日J序列。所谓时fnJ
序列就是按照时间先后顺序排列各个观测记录的数据集,众多领域中的数据集都具有
这个特点。由于时间序列可以准确反映事件随时问变化的过程,近几年来已经成为了
数据挖掘领域研究的热点之一。动态性、高维度、高特征相关性和火量噪音是时I日J序
列的独特结构,这种特征使许多经典的处理静态数据的算法难以发挥作用,极大地增
加了挖掘算法的研究难度。因此,开展时间序列的数据挖掘研究,是~个具有挑战性
的、且有理论价值和实际意义的研究课题。
现实中的大量系统可以用复杂网络来刻画。一个典型的网络是由许多节点与连接
两个节点之间的边组成,其中节点用来代表真实系统中不同的个体,而边则用来表示
个体之间的关系。近年来,复杂网络的研究受到了越来越多的关注,并渗透到从fj然
科学到工程科学共至社会科学的多个领域。复杂网络具有的特征之一是社闭结构,诸
多学者从不同角度对如何发现网络中的社团结构问题进行了研究。事实l:,发现网络
中社团的过程就是聚类的过程。如何利用复杂网络解决时|’自J序列的聚类I、uJ题,足。个
值得研究的课题。
聚类和关联舰则挖掘是数据挖掘领域研究的基本I、uJ题。本文通过对序列F1_l的H扑iJ
进行加权和结合复杂网络理沦,开展了如下的研究:_I:作。
提出了…种基于Normal矩阵谱平分法的时问序列聚类算法。该算法首先对时f¨J序
列数据进行向量形式转化,计算出各个时间序列I’日J的相似度并构建复杂网络,然后利
用基于Normal矩阵的谱平分法进行社团划分,相似的时|’只J序列被划分到一个礼团,即
实现对时问序列数据的聚类。为了验证该方法的有效性和町行性,将其应用丁实惭:的
股票时间序列数据聚类分析中,取得了较好的实验结果。
在时间越近越重要原贝0指导下,对记录进行时l’日J加权,通过给出加权的公式,提
出了一种基于背景的加权关联规则挖掘方法。该算法可以针‘埘用户感兴趣的时间一地,_
背景进行关联规则挖掘。相比传统挖掘方法,该方法通过从低层次到高层次概念的序
列映射,可以分析U{不同粒度层次的相关信息,有利于决策者做出更准确的决策分析,
制定更优的策略。
关键词:数据挖掘;时间序列;聚类;关联规则;复杂网络
基丁.时间序列的聚类和关联规则挖掘
of and Rule in
The ClusterAssociation TimeSeries
Study Mining
Abstract
The ofinformation data.anditis
rapiddevelopment technologybringshuge important
howtomineuseful inthesedata.Thedata seemstobea toolto
knowledge mining powerful
withthis
deal thesemass ofthe data is
data,one time
文档评论(0)