- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第36卷第3期 东南大学学报(自然科 学版 ) Vol36 No3
2006年5月 JOURNALOFSOUTHEASTUNIVERSITY(NaturalScienceEdition) May2006
半结构化文档数据流的快速频繁模式挖掘
赵传申 孙志挥
(东南大学计算机科学与工程学院,南京210096)
摘要:为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了
一种半结构化文档数据流的快速频繁模式挖掘算法———FStreamT.该算法针对利用集合存储候
选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有效地提高对候选频繁模式集
合进行查找和更新的效率,同时利用频繁模式的单调性和枚举树的特点减小了维护负边界的搜
索空间,从而提高了整个算法的效率.理论分析和实验结果表明,算法FStreamT与算法StreamT
相比具有较高的效率,是有效可行的.
关键词:数据挖掘;频繁模式;数据流;枚举树
中图分类号:TP311 文献标识码:A 文章编号:1001-0505(2006)03045205
Fastminingfrequentpatternsinsemistructureddatastream
ZhaoChuanshen SunZhihui
(SchoolofComputerScienceandEngineering,SoutheastUniversity,Nanjing210096,China)
Abstract:Toimprovetheefficiencyofthesemistructureddatastreammining,afastalgorithmfor
miningfrequentpatternsfromsemistructureddatastream,FStreamT,isproposedbasedonStre
amT.Tosolvetheproblemoflowefficiencyofstoringfrequentpatternsinset,thisalgorithmstores
frequentpatternsinenumerationtree,whichismoreefficientwhensearchingandupdatingthefre
quentpatternset,andatthesametimereducesthesearchspaceofmaintainingthenegativeborder
usingthemonotonicityoffrequentpatternandthecharacteristicsofenumerationtree.Theoretical
analysisandexperimentalresultsshowthattheFStreamTalgorithmisfeasibleandmoreefficientthan
theStreamTalgorithm.
Keywords:datamining;frequentpattern;datastream;enumerationtree
[2]
近几年由于网络技术和WEB技术的发展,数 SOAP 通过 Internet传送不同种类的弱结构数
据流应用迅速发展起来.此时数据不像原来那样完 据.由于传统的数据挖掘方法不能直接应用到此类
整地存储在数据库中,而是以序列(流)的形式到 数据流的挖掘中,因此如何高效地在这类数据流中
达.在数据流的应用中,无法控制数据到达的顺序, 挖掘有用信息非常重要.
也不能将流数据完整地存储在本地.数据流的应用 半结构化数据中的频繁结构挖掘有不少学者
领域比较广泛,例如传感器网络中各类传感器检测
您可能关注的文档
- 第三节 文献型经济信息的检索.ppt
- 隐函数和其微分法.ppt
- 第二章C - 进程的通信及线程.ppt
- 4.第五节 燃气设施.pdf
- 第03节 汇编语言2007-4.ppt
- 基于MasterCAM三大类型五轴机床后处理程序编制方法.pdf
- JTAG仿真器DIY(Mega8+Mega16)内附万用板制图、程序固件与熔丝位截图.pdf
- 用VC++6.0编写一个完整Windows屏幕保护程序.pdf
- 使用IntelliJ Idea 13.1.3打包成可执行JAR.doc
- C程序设计第8节.ppt
- 2.2.2动物的结构层次.ppt
- 2025年人教版一年级上册数学第四单元综合检测试卷及答案 (2).pptx
- 2025年人教版九年级上册数学第二十一章一元二次方程【方法技巧专题】配方法的应用.pptx
- 2025年人教版九年级上册数学每周测试训练7(25.1~25.2).pptx
- 2025年人教版一年级上册数学期末综合检测试卷及答案 (1).pptx
- 2025年人教版九年级上册数学第二十四章圆【方法技巧专题】求圆中阴影部分的面积.pptx
- 2025年人教版九年级上册数学第二十四章圆【方法技巧专题】圆中常见辅助线的作法.pptx
- 2025年人教版九年级上册数学第二十四章综合检测试卷及答案.pptx
- 2025年人教版一年级上册数学期末——数与运算.pptx
- 2025年人教版九年级上册数学第二十三章旋转【教材变式专题】中考旋转作图专练——教材P62习题23.1第4题的变式训练.pptx
文档评论(0)