600-多元时间序列中关联规则发现 史忠植 董泽坤中国科学院计算技术研.docVIP

  • 4
  • 0
  • 约5.12千字
  • 约 7页
  • 2015-12-25 发布于江苏
  • 举报

600-多元时间序列中关联规则发现 史忠植 董泽坤中国科学院计算技术研.doc

600-多元时间序列中关联规则发现 史忠植 董泽坤中国科学院计算技术研.doc

多元时间序列中 关联规则的发现 史忠植 董泽坤 中国科学院计算技术研究所 * 多元时间序列的关联规则分析 关联规则:设 是项的集合。任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合, 。每个事务有一个标识符,称为TID。设A是一个项集,事务T包含A当且仅当 。关联规则是形如 的蕴含式,其中, , , 。 关联规则的算法OptimizedApriori 优点:只读取一次数据库 OptimizedApriori是在ArioriTid的基础上,将数据结构由 TID,{IID} 变换为 {IID},{TID} ,从而迅速减少了系统的I/O操作。 在构造候选1-项集时,每一个项(IID)携带了它在数据库中出现的位置记录集合({TID}),使得以后的操作可以脱离数据库。 构造k-项集时,新的项目集合( {IID} )由两个k-1项集的项目集合求并集得到,记录号集合( {TID} )由两个k-1项集的记录号集合求交集得到。 缺点:消耗大量的内存 大型数据库操作时会受到处理器内存容量的限制,数据可能无法一次装入。 多元股票时间序列的关联规则(1) 数据预处理 1.数值离散化

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档