从大型资料库中挖掘加权的关联规则.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
從大型資料庫中挖掘加權的關聯規則 Mining Weighted Association Rules from Large Databases 顏秀珍 邱鼎穎 李御璽 輔仁大學資訊工程學系 輔仁大學資訊工程學系 銘傳大學資訊管理學系 sjyen@csie.fju.edu.tw leeys@mcu.edu.tw 摘要 找尋關聯規則必須先找出常常一起被購 挖掘關聯規則 (Mining Association Rule)主 買的物品,因此,關聯規則的產生取決於物品 要是從交易資料庫中找尋物品間的關聯性,而 被購買次數的多寡,這是相當不公平的。舉例 加權的關聯規則 比一般的關聯規則多考慮了 來說:對於一個同時販賣電燈泡和電冰箱的家 物品在交易中的重要性,因此能比一般的關聯 電廠商來說,只計算被購買次數的話,那麼和 規則找出更多有利的資訊。但過去有關加權關 電燈泡有關的規則會列出一大堆,而和電冰箱 聯規則的研究相當少且執行效能很差,因此我 有關的資訊可能沒有,但是對於廠商來說,電 們提出一個有效率的演算法來解決這方面的 冰箱的利潤較高,其營業額反而才是他所關心 問題,此演算法不僅可以加快執行的速度,亦 的,但卻無法給予相關的訊息。因此這篇論文 可節省相當多的記憶體空間。我們從理論上分 加權的關聯規則 ,並提出一個非常有效 定義了 析我們的演算法與過去的演算法在執行速度 率的演算法求取加權的關聯規則,以解決上述 與所需記憶體空間的差異,並以模擬的資料庫 的問題。 進行實驗,證明我們的方法在執行速度上較過 在對問題做說明之前,我們先做一些簡 去的方法快很多。 單的定義。首先,一筆交易 (transaction)是指一 關鍵詞 :資料探勘,加權的關聯規則,交易資 個記錄,記載某一顧客某次所購買的商品項 料庫,頻繁項目集 目。而交易資料庫 (transaction database)則是由 許多交易所組成,因此交易資料庫中所記載的 1. 概論 資料包含了交易編號、顧客編號、購買時間及 在以往的時候資料的取得是相當困難 購買項目等。另外,一個項目集 (itemset)是由 的。因此若有新的資料,大多會馬上被納入資 項目 (item)所構成的集合,所以交易也算是一 料庫中妥善的保存。但隨著電腦與網路的日益 個項目集。而項目集的長度 (length)是指此項目 發達,資料的取得不再是件難事,比較嚴重的 集所包含的項目個數,若一個項目集長度為 問題反而是在於有過多的資料而無法判別哪 k ,則我們稱此項目集為k-項目集。假設有 A 、 些是重要的。因此 B 兩項目集,且B項目集中所有的項目皆出現 資料探勘技術 (data mining technique)[3, 13, 15, 16]在資料庫相當龐大的 在 A中,則稱 B被 A所包含,且 B 為 A的子 今日漸漸的興起。透

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档