事务间关联规则挖掘在股价期货价格预测中应用.docVIP

事务间关联规则挖掘在股价期货价格预测中应用.doc

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
事务间关联规则挖掘在股价期货价格预测中应用

事务间关联规则挖掘在股价、期货价格预测中的应用   [摘要]关联规则作为数据挖掘的一种重要分析方法,在近年来发展日趋成熟。在金融领域,一些研究已开始关注利用关联规则挖掘不同金融产品价格间的关联性、不同市场变动趋势之间的关联性等。然而,前人的研究主要集中在事务内相关性挖掘发面。引入事务间关联规则的概念,并利用FITI算法研究中国股票市场、债券市场、期货市场变动的关联性,以及不同国家间股票市场的关联性。   [关键词]数据挖掘 FITI算法 事务间关联规则 板块联动   中图分类号:F22文献标识码:A 文章编号:1671-7597 (2008) 0220051-02      一、引言      关联规则的概念由Agrawal和Imielinski (1993)提出,是数据中一种简单但很实用的规则。给定一个项的集合,X、Y分别表示两个项集,则关联规则表示为X Y〔1〕。   传统的关联规则挖掘算法只能挖掘出现在同一事务或同一序列中项间的关联规则。如R1:”若TCL与长虹的股价同时上涨,则当日海信的股价上涨的可能性为80%”。然而股票投资者可能更关心类似R2的规则。R2:”若TCL与长虹的股价在第一个交易日同时上涨,则两日后海信的股价以80%的概率上涨”。   规则R1显示了同一事务内不同项间的关系,而R2显示了不同事务中在特定维属性上的关联。根据文献〔2〕,称经典的关联规则(如R1)为事务内关联规则,称后者为事务间关联规则。文献〔3〕提出跨事务或事务间关联规则的概念,并将其应用在证券市场分析中。文献〔2〕提出了FITI算法,利用频繁事务内项集产生频繁事务间项集。   本文利用事务间关联规则挖掘方法研究中国金融市场股票、债券、期货、汇率等指标的相关性,并尝试预测的可能性。      二、问题描述      定义1 定义 表示项目的集合,D是一组非负整数的集合称为域属性。事务数据库是事务的集合,   是的子集。事务记为, ,。 d表示维属性,E 表示项集。   定义2事务数据库中的滑动窗口由属性域D上的w个连续区段组成,从区段d0开始以使包含位于区段d0处的事务。称W中的每个区段dj 为W的子窗,记为W[j], 其中j=dj-d0.记j为W中的的子窗数〔3〕。   本文引入滑动窗口意在描述事务间关联规则所涵盖到的区段个数。为了关联规则挖掘的效率,我们引入maxspan( )这一参数来表示滑动窗口的大小。   定义3. 设u表示中的事务个数,表示滑动窗口的大小。定义巨事务M为:.   定义4. 定义一个巨事务中的所有项为扩展项,记所有扩展项的集合为:   定义 5. 定义项集为事务内项集,项集为事务间(或跨事务)项集。   定义 6. 事务间关联规则是形如的蕴涵式,并且满足条件:   定义 7. 设X 、Y是满足定义6的扩展集,则事务间关联规则的支持度(support)与置信度(confidence)定义为:      以下为举例解释上述定义。表1为含有5项事务的事务数据库,这5个事务分别位于区段1,2,4,5,6。令w=4, 则有5个滑动窗口W1, W2, W3,W4和W5 ,分别位于地址1,2,4,5,6。每个滑动窗口包含4个子窗。如W1包含子窗W1[0](含项 a,b),W1[1](含项b,d),W1[2],W1[3](含项 a,b,c,d)。   每个滑动窗口形成一个巨事务,该巨事务为滑动窗口中所有项的集合。在表1中,W1中的巨事务为{a[0],b[0],b[1],d[1],a[3],b[3],c[3],d[3]}。而 ={a1[0],b1[0],b1[1],d1[1],a1[3],b1[3],c1[3],d1[3],b2[0],d2[0],a2[2],b2[2],c2[2],d2[2],b2[3],c2[3],a3[0],b3[0],c3[0],d3[0],b3[1],c3[1],a3[2],b4[0],c4[0],a4[1],a5[0]}.   为了能从该事务数据库中挖掘事务间关联规则,我们设定两个必要的参数minsup(最小支持度)与minconf(最小置信度)。令minsup=0.4,minconf=0.8,我们可以从表1中挖掘出的一条规则为:    (support=0.4, confidence=1).   表1事务数据库         三、事务间关联规则挖掘      与传统关联规则挖掘方法类似,事务间关联规则挖掘包括两步:   (一)找到支持度高于最小支持度的频繁跨事务项集;   (二)对每个频繁跨事务项集L,生成满足如下条件的关联规则   (1)   (2)   (3)规则的置信度高于最小置信度。   根据文献〔3〕, FITI

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档