- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 26 卷 第 1 期 广西师范大学学报: 自然科学版 V o l. 26 N o. 1
2008 年 3 月 Jou rn a l of Guan gx iN o rm a l U n iver sity:N atu ra l Scien ce Ed it ion M ar. 2008
有序树的频繁子树挖掘研究
吉根林, 朱颖雯
(南京师范大学 计算机系, 江苏 南京 2 10097)
摘 要: 对各种主要的频繁子树挖掘算法进行综述与分析, 主要包括频繁 In duced 子树挖掘与频繁 Em bedded
子树挖掘; 讨论了挖掘算法中使用的两种技术: 基于候选生成测试的方法和基于模式增长的方法; 对各典型
算法的性能进行了实验分析比较。
关键词: 数据挖掘; 频繁子树; 频繁 In duced 子树; 频繁 Em bedded 子树
中图分类号: T P 3 11 文献标识码: A 文章编号: 100 16600 (2008) 0 1020705
频繁模式的挖掘是数据挖掘研究的重要内容之一。在过去的十多年中, 事务数据和序列数据的频繁模
式挖掘已深入研究, 但 挖掘、生物信息挖掘、 挖掘等研究还不够深入, 其涉及频繁子树挖
W eb XM L GM L
掘。频繁子树挖掘可以分为基于有序树的频繁子树挖掘、基于无序树的频繁子树挖掘以及基于自由树的频
繁子树挖掘。本文主要针对有序树的频繁子树挖掘算法[ 1~ 8 ] 进行探讨与分析。
1 频繁子树挖掘的基本方法
目前提出的频繁 、 子树挖掘算法比较如表 1 所示, 其挖掘的基本方法可以分为两
Induced Em bedded
类: 基于候选生成测试( ) 的方法和基于模式增长( ) 的方法。
Cand idate Generate and T est P attern Grow th
表 1 频繁 、 子树挖掘算法比较
Induced Em bedded
. 1
Tab Com par ison of f requen t induced or em bedded subtrees m in ing a lgor ithm s
算法名称 文献 发表年 子树类型 树的正则表示 挖掘方法 F k 生成F k+ 1 的方法
L eftm o st ch ild
FR EQ T [ 1] 2002 In duced 候选生成测试 Ex ten d
an d R igh tsib ling
文档评论(0)