第6章关连分析基本概念和演算法.pptVIP

  • 5
  • 0
  • 约3.63千字
  • 约 41页
  • 2017-02-15 发布于湖北
  • 举报
(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 基本專有名詞 二元表示方式:購物籃資料可以被表示成二元格式 項目集:在關聯分析中,一堆0 或更多項目被稱為一項目集 支持個數:其代表交易中包含特定項目集之數量 基本專有名詞 關聯規則:關聯規則為 X→Y 的表示式,X 和Y 為無交集的項目集,即 。 強度由支持度( support )和信賴度(confidence)進行測量 支持度, 信賴度, 關聯規則探勘(1) 給定交易集合T,找尋支持度≧最小支持度(minsup)且信賴度≧最小信賴度(minconf)的所有規則。最小支持度和最小信賴度代表的是支持度和信賴度的門檻值 以窮舉法(brute-force approach)探勘關聯規則時會計算每一可能規則的支持度和信賴度, 初始步驟有助於改善關聯規則探勘演算法的執行,以減少計算支持度和信賴度的需求 關聯規則探勘(2) 關聯規則探勘的演算法將問題切割成二個主要的子工作: 高頻項目集的產生(Frequent Itemset Generation),尋找所有滿足最低支持度門檻值的項目集 規則產生(Rule

文档评论(0)

1亿VIP精品文档

相关文档