金融领域时间序列挖掘技术中研究.docVIP

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
金融领域时间序列挖掘技术研究 [摘 要]数据挖掘技术近年来被广泛用于时间序列分析,时间序列挖掘技术主要包括关联分析、序列分析、分类分析、聚类分析和异常检测等五类。由于金融领域的时间序列具有一些重要的特征,因此将各种挖掘方法与金融时间序列的特征,以及各种传统的时间序列分析模型相结合,是目前金融时间序列挖掘领域的研究热点。   [关键词]时间序列;金融;数据挖掘       一、引 言      在金融领域,时间序列是一种重要的数据类型,对时间序列的分析是金融数据分析的一个重要内容。作为数理统计学的一个分支,时间序列分析自1960年代起就已经得到了广泛的研究。传统的金融时间序列分析方法主要包括基本分析、技术分析以及各种数理统计学方法等。随着近年来数据规模的不断增长以及分析任务的日益复杂,数据挖掘技术开始被运用到金融时间序列的分析中。   所谓数据挖掘是指从大规模的数据中抽取隐含、未知、有潜在使用价值的规则的过程。作为一门交叉学科,数据挖掘集成了许多学科中成熟的工具和技术,包括数据库技术、统计学、机器学习以及人工智能等。广义地说,所有从海量数据中发现新的规律的方法都可以统称为数据挖掘技术。   本文在对传统的金融时间序列分析方法进行简单回顾的基础上,对当前主要的金融时间序列挖掘技术进行综述,并指出相关方法的优缺点和需要进一步研究的问题,为该领域的进一步研究提供基础。      二、金融时间序列传统分析方法      基本分析与技术分析是最常见的分析方法,主要用于证券与期货市场中的时间序列分析。基本分析主要通过对影响证券市场供求关系的基本因素进行分析,从而判断股票价格的走势。技术分析则通过对历史数据进行一些简单的计算,得到相关的技术指标和图表,从而判断序列未来的变化趋势。   另一类主要的金融时间序列分析方法是数理统计方法,这类方法主要包括各种统计特征的检验分析、相关分析、线性/非线性回归分析、自回归移动平均(ARMA)分析以及分形分析等,此外,各种多元分析方法也被广泛用于金融时间序列分析,如判别分析、主成分分析以及因子分析等。限于篇幅,本文不再详细讨论这些方法。      三、时间序列挖掘方法      近年来数据挖掘技术在时间序列分析领域开始得到广泛的研究与应用,已有大量的文献提出了各种时间序列挖掘算法。需要指出的是,虽然这些文献本质上属于对通用的基础算法进行研究,并不是专门针对金融领域的时间序列,然而其中许多方法都是以金融时间序列为例,来说明算法的有效性、准确度或性能,因此这些算法也在金融领域得到了应用。时间序列挖掘方法主要包括以下几个方面。      1.关联分析与序列分析   关联分析与序列分析的目的都是发现数据间的各种相关联系,不同的是,关联分析用于发现同一时间段内的各种联系,而序列分析用于发现在时间上具有先后关系的联系。   使用关联与序列分析方法,能够发现同一序列的前后变化或不同序列变化间的复杂关系。由于传统的关联与序列挖掘算法主要适用于符号型数据,因此在对数值型金融时间序列进行关联与序列分析时一般需要先对序列进行符号化。将序列划分为多个子序列,根据子序列的形状进行聚类并符号化,在此基础上采用序列挖掘算法发现符号间的规则。多个股票在不同时段的涨跌关系转换为具有双时间维约束的关联规则模型,并提出相关的挖掘算法,用于挖掘“当某几种资产的收益率变动超过一定幅度时,哪些资产会在同时(或间隔一段时间后)有同样(或相反)的表现”这类复杂的规则。一种基于“重要点”的方法将时间序列逐段符号化,并提出了一种基于互关联后继树模型的时间序列关联规则发现算法。      2.相似性查找   相似性查找是时间序列挖掘领域的一个重要研究方向。所谓相似性查找是指对于给定的目标序列Q,根据某种相似性度量函数,寻找与Q最相似的序列Qk。时间序列的相似性查找分为全序列匹配和子序列匹配两大类,全序列匹配是指所查找的序列与目标序列Q具有相同的长度;子序列匹配则是指在一个更长的序列中,寻找与目标序列Q相似的所有子序列。相似性查找在金融领域典型的应用是,根据图形上的相似性,寻找与某种资产的价格(或收益率)变动情况比较接近的其他资产。   由于金融时间序列一般都跨越较长的时间段,理论上甚至具有无限长度,因此这类数据都表现出高维甚至是超高维的特征。由于大多数相似性度量函数(如欧氏距离函数)在处理高维数据时性能都急剧下降,因此对于这类数据,一般先采用某种方法对序列进行维约简,即将原始序列变换到低维空间,在此基础上再比较序列间的相似性。常见的时间序列维约简方法包括离散傅立叶变换、离散小波变换、逐段线性描述等。除了维约简方法,相似性度量函数也是这一问题的研究热点。      3.聚类分析   聚类分析的目的是把整个目标

文档评论(0)

xiongdihao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档