- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
挖掘重要关联规则-以搭配销售为例
挖掘重要關聯規則-以搭配銷售為例
翁政雄
中臺科技大學資訊管理系
chweng@mgt.ncu.edu.tw
摘要
將產品或服務組合銷售在實務上已是極為普遍的行銷手法 。近年來,此種行銷手法
已經應用在網路商店中 ,藉以提升產品的銷售數量。關聯規則探勘技術是一項重要的資
料挖掘技術 ,這項技術可以從交易資料庫中挖掘資料之間的關聯性。大部分的關聯規則
探勘技術乃是以支持度 -信心度 架構為基礎 。雖然,支持度-信心度的架構可以過濾大多
數無意義的規則 ,然而,對使用者而言仍有多數的無意義的規則依舊被找到。除此之外,
對行銷人員而言 ,哪一項關聯規則較為重要呢?可以協助行銷人員制定適當行銷策略
(如搭配銷售) ,以提供較佳購買計畫以吸引消費者呢?為了解決上述問題,本研究提出
一種新的方法 ,嘗試從相關項目集中(relevant itemsets)找到有意義且重要的關聯規則 。
首先 ,本研究運用相關性指標(correlation measure)找出具有相關性的關聯規則 ,進而運
用重要性指標 (importance measure)篩選出重要的關聯規則 。本研究所提出的重要性指標
可以強化現有支持度 -信心度 架構 ,讓使用者透過重要性指標的高低衡量關聯規則的重
要性。實驗結果顯示本研究所提出的方法可以篩選重要且具有高度相關的關聯規則 ,以
協助行銷人員制定合適的行銷策略(如搭配銷售) 。
關鍵詞 :搭配銷售、資料探勘、關聯規則、關聯分析、重要性
挖掘重要關聯規則-以搭配銷售為例
壹、 緒論
關聯規則探勘技術是一項重要的資料挖掘技術 ,這項技術可以從交易資料庫中挖掘
消費者的購買行為的關聯性(Han and Kamber, 2006) 。Agrawal et al. (1993) 首先提出關聯
規則的 定義 :所有的關聯規則必須符合兩項門檻值,分別是最小支持度 (minimum
support) 及最小信心度 (minimum confidence) 。基本上,關聯規則探勘技術主要分成2
個步驟 :(1)以支持度為基準 ,找出大於最小支持度的高頻項目集,以及(2) 以信心度為
基準 ,從高頻項目集中,找出大於最小信心度的關聯規則。
Apriori演算法已經被廣泛用來從交易資料庫中尋找高頻項目集 。由於該演算法的成
功與廣泛使用 ,諸多不同改良型的演算法已經先後被提出,而這些演算法所處理的資料
型態可分為 :種類型資料型態(Agrawal et al., 1993; Agrawal and Srikant, 1994) 、序數型資
料型態(Chen and Weng, 2008) 以及數值型資料型態(Delgado et al., 2003; Lian et al.,
2005) 。
為了尋找更多的關聯規則 ,我們可以將最小支持度門檻值設的更低 。然而,當高頻
項目集 (符合最小支持度門檻值的項目集數量增加時) ,則關聯規則的數量所會隨之大量
增加 。除此之外,並非所有以支持度-信心度的架構為基礎所產生的關聯規則都是有意
義的 。因此,Aggarwal and Yu (1998) 以統計學上的相關性分析(correlation analysis)做為
另一項衡量指標 ,用以強化支持度 -信心度架構 ,期能找出有意義的關聯規則。一項有
意義的關聯規則表示成 :X⇒Y [support, confidence, correlation]] 。從此之後,各種相關性
]]
2
的衡量指標先後被提出 (Han et al., 2007) ,包括:lift, χ , cosine 與 all-confidence 。其中,
文档评论(0)