- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元时间序列中 关联规则的发现 史忠植 董泽坤 中国科学院计算技术研究所 * 第一页,共二十九页。 多元时间序列的关联规则分析 关联规则:设 是项的集合。任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合, 。每个事务有一个标识符,称为TID。设A是一个项集,事务T包含A当且仅当 。关联规则是形如 的蕴含式,其中, , , 。 第二页,共二十九页。 关联规则的算法OptimizedApriori 优点:只读取一次数据库 OptimizedApriori是在ArioriTid的基础上,将数据结构由TID,{IID}变换为{IID},{TID},从而迅速减少了系统的I/O操作。 在构造候选1-项集时,每一个项(IID)携带了它在数据库中出现的位置记录集合({TID}),使得以后的操作可以脱离数据库。 构造k-项集时,新的项目集合( {IID} )由两个k-1项集的项目集合求并集得到,记录号集合( {TID} )由两个k-1项集的记录号集合求交集得到。 缺点:消耗大量的内存 大型数据库操作时会受到处理器内存容量的限制,数据可能无法一次装入。 第三页,共二十九页。 多元股票时间序列的关联规则(1) 数据预处理 1.数值离散化 s1=3,4,3,2,4,2,0,3,4,4 s2=2,3,2,3,3,4,3,1,1,4 s3=0,3,4,1,0,1,3,3,3,4 0(深跌) 1(跌) 2(平) 3(涨) 4(大涨) 0 1 2 3 4 5 6 7 8 9 股票S1 股票S2 股票S3 第四页,共二十九页。 多元股票时间序列的关联规则(1) TID ITEMS 0 s1.3,s2.2,s3.0 1 s1.4,s2.3,s3.3 2 s1.3,s2.2,s3.4 3 s1.2,s2.3,s3.1 4 s1.4,s2.3,s3.0 5 s1.2,s2.4,s3.1 6 s1.0,s2.3,s3.3 7 s1.3,s2.1,s3.3 8 s1.4,s2.1,s3.3 9 s1.4,s2.4,s3.4 2.序列合并 多元时间序列合并集:设时间序列的集合S={s1, s2,…, su}, Ti 是在时刻i对S的观察值集合,Ti={s1(i),s2(i),…su(i)}(1≤i≤n),多元时间序列合并集D定 义为:D={T1,T2,…,Tn}。D中每组观察值作为一个事务,各分配一个识别号TID。 ↑ ↑ ↑ s1 s2 s3 第五页,共二十九页。 多元股票时间序列的关联规则(2) 规则挖掘 设:最小支持度20%,最小信任度50% 规则: s1.3 ? s2.2:股票1涨?股票2平(20%,66.7%): s1.4 ? s2.3:股票1大涨? 股票2涨(20%,50%); s2.1 ? s3.3:股票2跌? 股票3涨(20%,100%); 测试集 中国证券市场1997-2001共五年间近500只股票的收盘价时间序列集(以下同) 第六页,共二十九页。 多元股票时间序列的关联规则(3) 测试结果 中纺机和二纺机属于典型的纺织机电企业,而陕长岭属于家电企业,他们之间为什么会出现相同的下跌走势呢?而且,用肉眼观察实际走势图,它们之间的形态也有很大差距,这个现象如何解释?在经过仔细分析后,我们发现:陕长岭中很大的一项主营业务是生产纺织机电。这项业务和纺织企业有着密切的联系,这几年间国家对纺织机电的政策也有大的调整。所以,这几只股票的下跌走势比较相同是有内在联系的。这种关系很难从实际走势图中识别,但是关联分析做到了这一点。 中纺机↓1,陕长岭↓1 ?二纺机↓1 (21.6%,84.1%) 第七页,共二十九页。 多元时间序列的跨事务关联规则分析(1) “跨事务”特性的特点: 强调的是出现在不同事务中各项目之间的关联关系,应用到时间序列中就是不同时刻各序列的数据特征之间的关系,如: A公司的股票在第一天上涨,B公司的股票在第二天下跌,那么,C公司的股票会在第三天上涨。(s%,c%) 这种规则包含了时间特性,规则的前件可以用来作为后件的预测条件,它们的实际使用价值是很明显的。 第八页,共二十九页。 多元时间序列的跨事务关联规则分析(2) 多元时间序列的跨事务关联规则: 设∑={ e1(0),…,e1(w-1),e2(0),…, e2(w- 1)
您可能关注的文档
最近下载
- STEAM跨学科课程整合的理念、模式构建与实施挑战研究.docx VIP
- 产学合作协同育人创新创业教育改革项目申报书模板(包含内容).docx VIP
- 110千伏输电线路工程专业监理实施细则.doc VIP
- 智慧乡村、智慧农业产供销一体化、可追溯平台建设方案.pdf VIP
- 17J008 挡土墙(重力式、衡重式、悬臂式)(最新).pdf VIP
- 产学合作协同育人教学内容和课程体系改革项目申报书模板—基于计算思维的大学计算机课程思政案例构建与实践(包含申报书内容、合作方案、合作协议).docx
- 智能建造系统架构与发展路径.docx VIP
- 智能建造系统架构与发展路径.docx VIP
- 制药公司生产安全事故应急预案.docx
- 产学合作协同育人教学内容和课程体系改革项目申报书模板—工科程序设计类课程的课程思政教学探索(包含申报书内容、合作方案、合作协议).docx
文档评论(0)