针对重要稀少性资料之一种有效率关联式探勘方法设计-GEBRC.PDF

针对重要稀少性资料之一种有效率关联式探勘方法设计-GEBRC.PDF

针对重要稀少性资料之一种有效率关联式探勘方法设计-GEBRC

資訊管理學報 第十七卷 第一期 133 針對重要稀少性資料之一種有效率 關聯式探勘方法設計 龔旭陽 國立屏東科技大學資訊管理學系 林美賢 國立中山大學資訊工程學系 林靖祐 國立屏東科技大學資訊管理學系 賴威光 國立中山大學資訊工程學系 摘要 關聯法則(Association Rules)廣泛應用於資料探勘研究方法 ,於過往研究中,大都針 對支持度(Support)較高之高頻項目集(Frequent ItemSets) 進行探勘 ,然而卻無法迅速且有 效探勘出支持度小但卻擁有重要關聯性之重要稀少性資料(Significant Rare Data) ,亦即 所謂之半高頻項目集(Semi-frequent ItemSets) 。現今有部份研究針對具備重要關連法則 之稀少性資料 ,進行相關探勘方法設計 ,其方法大都採用由下而上(Bottom-Up)搜尋方 式,但往往無法有效率探勘出最大半高頻項目集(Maximal Semi-frequent ItemSets) 。針對 上述問題 ,本研究提出與設計專門針對重要稀少性資料之最大半高頻項目集探勘演算法 (Maximum Semi-frequent Itemsets Algorithm, MSIA) ,MSIA可有效整合分群(Cluster)與分 解(Decomposition)探勘概念 ,並結合篩選法(Filter)與相對支持度(Relative Support)分析方 法 ,採由上而下(Top-Down)之搜尋機制進行高效率最大半高頻項目集探勘 。由效能實驗 結果可知 ,MSIA於探勘過程中可以有效降低原始來源資料庫(Source Database)讀取掃描 次數 ,提升探勘效能以節省探勘時所花費之時間成本 ,進而有效且快速取得重要稀少性 資料中之最大半高頻項目集。 關鍵字:關聯法則 、重要稀少性資料 、最大半高頻項目集、分群 、相對支持度 134 資訊管理學報 第十七卷 第一期 An Efficient Method for Mining Association Rules on Significant Rare Data Hsu-Yang Kung Department of Management Information Systems, National Pingtung University of Science and Technology Mei-Hsien Lin Department of Computer Science and Engineering, National Sun Yat-sen University Ching-Yu Lin Department of Management Information Systems, National Pingtung University of Science and Technology Wei-Kuang Lai De

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档