从交易资料库中探勘具代表性的频繁项目集-朝阳科技大学资讯学院.PDFVIP

从交易资料库中探勘具代表性的频繁项目集-朝阳科技大学资讯学院.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从交易资料库中探勘具代表性的频繁项目集-朝阳科技大学资讯学院

2009 年資訊科技國際研討會論文集 從交易資料庫中探勘具代表性的頻繁項目集 顏秀珍 李御璽 吳政瑋 銘傳大學 銘傳大學 銘傳大學 資訊工程學系 資訊工程學系 資訊工程學系 sjyen@.tw leeys@.tw silvemoonfox@ 摘要 1. 前言 探勘頻繁項目集(Frequent Itemset Mining) 資料探勘 (data mining) [1, 2, 4] 是從大量 是資料探勘 (Data Mining)中一門重要的研究方 資料中發掘出潛在、未知、且可能有用的資 向。從交易資料庫 (Transaction Database)中探勘 訊。從 交易資料庫(transaction database)中探勘 頻繁項目集 (Frequent Itemsets)的主要目的是找 頻繁項目集 (frequent itemset) [1, 2] ,在資料探 出資料庫中經常一起被購買的商品,也就是相 勘領域中是一個重要的研究議題。其相關的定 關的商品。然而,傳統的頻繁項目集探勘往往 義如下: 給定一個含有 N筆交易的交易資料庫 在探勘過程中產生太多的頻繁項目集,不僅降 D ,每一筆交易t ∈D代表顧客一次購買商品的 低執行速度並佔用許多記憶體。而且過多的頻 紀錄。令 I = {a ,a ,…,a } 為所有項目 (Item)的 1 2 M 繁項目集,往往造成決策者的困擾。因此有學 集合。每一個項目可視為一種商品。每一筆交 者 提 出 頻 繁 封 閉 項 目 集 (Frequent Closed 易 t = {i ,i ,…,i } ( i ∈I ,1≦j ≦m ) ,是由數個 1 2 m j Itemset)的觀念。頻繁封閉項目集是頻繁項目集 相異項目所組成,且每筆交易具有唯一的識別 的一種精簡表示法,且數量往往較頻繁項目集 碼稱為 Tid (transaction identifier) 。一個長度為 的數量少。在這篇論文中,我們提出一個從資 k的項目集 (k-itemset) X = {i ,i ,…,i } ( i ∈I ,1 1 2 k j 料庫中有效率探勘頻繁封閉項目集的演算 ≦j ≦k ) ,是包含k個相異項目的集合。一個項 法,以及一個有效率從頻繁封閉項目集產生所 目集 X的支持數 (support count)為資料庫中包 有頻繁項目集的方法。 含 X的交易筆數,以 SC(X)表示之;X的支持 關鍵詞 :頻繁項目集、頻繁封閉項目集、資料 度 (support)為 X的支持數除以總交易筆數。一 探勘、交易資料庫。 個項目集的支持度若不小於使用者定義的最 小支持度門檻值 min_sup

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档