ROCK演算法探討.pptVIP

  • 8
  • 0
  • 约 26页
  • 2016-12-03 发布于天津
  • 举报
ROCK演算法探討

ROCK演算法探討 指導教授:許中川 博士 研究生:林勇助 報告大綱 動機 目的 傳統分群算法缺點 ROCK預先知識 ROCK演算法 實驗 結論 心得 動機 傳統演算法在分類屬性距離的不適用 目的 提出資料點間以連結為相似度之概念 提出依連結基礎及具強健性之演算法 傳統分群演算法缺點 分割式分群演算法 階層式分群演算法 分割式分群演算法 使用合適的函式將資料點分成k個群集 其中 為群集Ci的中心點,而 為 與 的幾何距離 最小化 E 區域最佳化 分割式分群演算法(續) 適用數字屬性資料 不適用類別屬性資料 行銷資料庫屬性多,每筆交易項目少,造成同群集中,交易相同項目少 階層式分群演算法 每個資料點當成一個群集,將相似者兩兩合併,至k個群集 適用類別屬性資料 階層式分群演算法(續) U={1,2,3,4,5,6} A={1,2,3,5} = (1,1,1,0,1,0) B={2,3,4,5} = (0,1,1,1,1,0) C={1,4} = (1,0,0,1,0,0) D={6} = (0,0,0,0,0,1) AB幾何距離最小( ) -合併 CD次小( ) -合併,但CD並無相同項目 不適用幾何距離 階層式分群演算法(續) 改用 但Jaccard係數僅測兩點之相似度,無法反映鄰居之

文档评论(0)

1亿VIP精品文档

相关文档