- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
序列模式挖掘支持度阈值的确定方法
第36 卷 第8 期 计 算 机 工 程 2010 年4 月
Vol.36 No.8 Computer Engineering April 2010
·软件技术与数据库· 文章编号:1000—3428(2010)08—0093—03 文献标识码:A 中图分类号:TP311
序列模式挖掘支持度阈值的确定方法
王翠青,陈未如
(沈阳化工学院计算机科学与技术学院,沈阳 110142)
摘 要:通过对不同支持度下序列模式挖掘产生模式个数分布的研究,利用曲线拟合技术,提出一种支持度与序列模式个数的关系模型。
在对客户序列数据库子集进行预挖掘的基础上,利用该模型为用户在挖掘前确定支持度阈值提供参考。在不同类型数据集上采用该方法,
得到预期结果,表明该方法是正确有效的。
关键词:数据挖掘;序列模式挖掘;支持度
Method of Determining Support Degree Threshold
in Sequential Pattern Mining
WANG Cui-qing, CHEN Wei-ru
(School of Computer Science and Technology, Shenyang Institute of Chemical Technology, Shenyang 110142)
【Abstract 】By studying distribution of the pattern number in sequential pattern mining using different support degree, this paper proposes a relation
model of support and numbers of sequential pattern. Based on mining on subset of custom sequential database, it uses the relation model to provide
users with the reference for determining threshold of the support degree. It uses this method in several different data sets, which gets the expected
results, and demonstrates this method is correct and efficient.
【Key words 】data mining; sequential pattern mining; support degree
1 概述 com Anonymous Web Data[5]( 以下简称Web) ;(2)某零售商的
[6]
序列模式挖掘旨在寻找一定范围内出现频率较高的有次 销售序列,客户购买序列 ( 以下简称ORDER) ;(3)利用IBM
[1] 数据生成器生成数据C10T8S8I8 。其特性如表1 所示。
序关系的模式 。现有序列模式挖掘算法以用户给定支持度
作为基准阈值进行挖掘。然而,一般情况下用户对支持度阈 表 1 数据集特性
值并没有确切的认识,在挖掘过程中主
原创力文档


文档评论(0)