- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于覆盖模式的频繁子树挖掘方法FrequentSubtree-计算机应用
JournalofComputerApplications ISSN 1001-9081 2016- 【-10
计算机应用,2017,*(*):1-6 CODEN JYIIDU
doi:10.11772/j.issn.1001-9081.2016. .0000
【
基于覆盖模式的频繁子树挖掘方法
1 1*
夏英 ,李洪旭
(1.重庆邮电大学 计算机科学与技术学院,重庆 400065)
(*通信作者电子邮箱565268915@)
摘要:无序树常用于半结构化数据建模,对其进行频繁子树挖掘有利于发现隐藏的知识。传统的频繁子树挖掘方法常常
输出大规模且带有冗余信息的频繁子树,这样的输出结果会降低后续操作的效率。针对传统方法的不足,本文提出了一种用
于挖掘覆盖模式的算法(MiningCoveragePattern,MCRP)。MCRP 算法首先采用宽度孩子数编码对树进行编码,然后通过基于
最大前缀编码序列的边扩展方式生成所有的候选子树,最后在频繁子树集和 -覆盖概念的基础上输出覆盖模式集。与传统的
挖掘频繁闭树模式和极大频繁树模式的算法相比,该算法能够在保留所有频繁子树信息的情况下输出更少的频繁子树,并且
15% 25%
将处理效率提高了大约 到 。实验表明,该算法能有效减小输出频繁子树的规模及冗余信息,在实际操作中具有较高
的可行性。
关键词:无序树;频繁子树;最大前缀编码;边扩展;覆盖模式
中图分类号:TP391.4 文献标志码:A
Frequent SubtreeMiningMethodBasedonCoveragepattern
1 1*
XiaYing ,LiHongXu
(1.School ofcomputer scienceandtechnology, ChongqingUniversity ofPostsandTelecommunications,Chongqing400065,China)
Abstract:Unordered tree iswidely used for semi-structured datamodeling, frequent subtreesmining on it hasbenefit for finding
hidden knowledge. The traditional methods of mining frequent subtrees often output large-scale frequent subtrees with redundant
information, such an output willreducethe efficiency
文档评论(0)