- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
從大型資料庫中挖掘加權的關聯規則
Mining Weighted Association Rules from Large Databases
顏秀珍 邱鼎穎 李御璽
輔仁大學資訊工程學系 輔仁大學資訊工程學系 銘傳大學資訊管理學系
sjyen@csie.fju.edu.tw leeys@mcu.edu.tw
摘要 找尋關聯規則必須先找出常常一起被購
挖掘關聯規則 (Mining Association Rule)主 買的物品,因此,關聯規則的產生取決於物品
要是從交易資料庫中找尋物品間的關聯性,而 被購買次數的多寡,這是相當不公平的。舉例
加權的關聯規則 比一般的關聯規則多考慮了 來說:對於一個同時販賣電燈泡和電冰箱的家
物品在交易中的重要性,因此能比一般的關聯 電廠商來說,只計算被購買次數的話,那麼和
規則找出更多有利的資訊。但過去有關加權關 電燈泡有關的規則會列出一大堆,而和電冰箱
聯規則的研究相當少且執行效能很差,因此我 有關的資訊可能沒有,但是對於廠商來說,電
們提出一個有效率的演算法來解決這方面的 冰箱的利潤較高,其營業額反而才是他所關心
問題,此演算法不僅可以加快執行的速度,亦 的,但卻無法給予相關的訊息。因此這篇論文
可節省相當多的記憶體空間。我們從理論上分 加權的關聯規則 ,並提出一個非常有效
定義了
析我們的演算法與過去的演算法在執行速度 率的演算法求取加權的關聯規則,以解決上述
與所需記憶體空間的差異,並以模擬的資料庫 的問題。
進行實驗,證明我們的方法在執行速度上較過 在對問題做說明之前,我們先做一些簡
去的方法快很多。 單的定義。首先,一筆交易 (transaction)是指一
關鍵詞 :資料探勘,加權的關聯規則,交易資 個記錄,記載某一顧客某次所購買的商品項
料庫,頻繁項目集 目。而交易資料庫 (transaction database)則是由
許多交易所組成,因此交易資料庫中所記載的
1. 概論 資料包含了交易編號、顧客編號、購買時間及
在以往的時候資料的取得是相當困難 購買項目等。另外,一個項目集 (itemset)是由
的。因此若有新的資料,大多會馬上被納入資 項目 (item)所構成的集合,所以交易也算是一
料庫中妥善的保存。但隨著電腦與網路的日益 個項目集。而項目集的長度 (length)是指此項目
發達,資料的取得不再是件難事,比較嚴重的 集所包含的項目個數,若一個項目集長度為
問題反而是在於有過多的資料而無法判別哪 k ,則我們稱此項目集為k-項目集。假設有 A 、
些是重要的。因此 B 兩項目集,且B項目集中所有的項目皆出現
資料探勘技術 (data mining
technique)[3, 13, 15, 16]在資料庫相當龐大的 在 A中,則稱 B被 A所包含,且 B 為 A的子
今日漸漸的興起。透
文档评论(0)