- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2010年10月 北 京 邮 电 大 学 学 报 Oct.2010
第33卷 第5期 Journal of Beijing University of Posts and Telecommunications Vol.33 No.5
摇 摇 文章编号:1007鄄5321(2010)05鄄0121鄄05
数据流中的频繁标记闭子树的批量挖掘
冯摇 博,摇 徐雅静,摇 赵摇 娜,摇 徐惠民
(北京邮电大学 信息与通信工程学院,北京 100876)
摘要:在频繁模式挖掘(FPM)的研究中,为了在海量数据流中有效地挖掘子树结构的频繁模式,根据数据流和子
树模式的特点,提出了一种基于数据流的频繁标记闭子树挖掘(SFCLTreeMiner)算法. 该算法首次对动态数据流中
频繁标记闭子树的挖掘进行研究,给出了在数据流中标记闭子树集合添加、删除的批量挖掘方法,并结合时间衰减
模型,有效保证了结果的时效性. 实验结果表明,该算法在挖掘性能,如挖掘时间和内存占用等方面,比类似算法有
较大提高.
关摇 键摇 词:频繁子树挖掘;数据流;时间衰减;标记闭子树;批量挖掘
中图分类号:TP311摇 摇 摇 摇 文献标志码:A
A Batch Mining Algorithm for Frequent Closed
Labeled Trees in Data Streams
FENG Bo,摇 XU Ya鄄jing,摇 ZHAO Na,摇 XU Hui鄄min
(School of Information and Communication Engineering,Beijing University of Posts and Telecommunications,Beijing 100876,China)
Abstract:Comparedwiththeclassicfrequentpatternmining (FPM)algorithms,thedynamic FPMalgo鄄
rithms on fast and massive data streams have become top research nowadays. A new batch mining algo鄄
rithm in data streams called stream frequent closed labeled tree miner (SFCLTreeMiner) is proposed.
SFCLTreeMiner uses a kind of adding鄄removing method between closed tree sets. Also it provides a time
decay module for reasonable data updating. Experiment shows that SFCLTreeMiner is efficient in data
streams mining by reducing consuming dramatically.
Key words:frequent subtree mining;data streams;time decay;labeled closed subtree;batch mining
随着数据流的涌现,在海量、动态、高速变化的数据
0摇 引言
流中挖掘频繁模式成为数据挖掘领域的一个新的热
FPM是数据挖掘的重要方面,由此而生的关联 [5] [6]
点. Moment 算法和滑动窗口挖掘(MSW) 算法
文档评论(0)