- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
OMARS系统中OLAM方体索引结构设计-义守大学.doc
PAGE 79
第一章 緒 論
1.1 研究動機與目的
在知識發掘與管理的領域中,資料採掘與資料倉儲系統的結合,已成為一重要的趨勢[6],其中資料採掘(data mining)的研究在於針對大量的資訊,粹取出具有意義的模式或規則[1],而資料倉儲(data warehouse)的建置,則為異質性的資料來源,與分散各處的資料庫系統,提供了整合、統一的解決方法[4]。
在1996年,J. Han等首度提出DBMiner架構[17],建構出類似OLAP分析的線上資料採掘平台,其藉由資料倉儲與資料採掘領域的整合,讓系統能利用OLAP分析所建構的資料方體(data cube),進行各種資料採掘分析,如:分群(cluster)、分類(classification)、關聯(association)等,成為資料採掘與資料倉儲整合的典範,但其雖然能提供分析者,在多維度資料環境下進行資料採掘,但因受限於OLAP資料方體的特性,無法快速地產生出多維度的關聯規則,換言之,其效率仍無法達到線上分析的要求。
有鑑於此,我們在過去的研究中,提出線上關聯規則採掘方體(On-Line Association Mining, OLAM Cube)與輔助方體的概念,和已知的OLAP資料方體相結合,形成一套線上多維度關聯規則採掘系統(Online Multi-dimensional Association Rules mining System),簡稱為OMARS[11][26][27],此系統能提供使用者在線上的環境下,任意地變換分析維度與參數,並快速地產生符合需求的關聯規則,其主要關鍵在於OMARS系統根據-預設的支持度(prims)[26],事先儲存資料倉儲綱要中各種維度屬性組合下的頻繁項目集,稱之為OLAM方體[26],再輔以另外儲存的部分非頻繁項目集,稱為輔助方體[26],可避免為產生符合使用者查詢需求的頻繁項目集,所需花費大量的計算處理時間。然而由於OLAM方體的資料範圍涵蓋了資料倉儲綱要中所有可能的維度屬性組合,而使OMARS系統內必須儲存大量各種屬性組合下的OLAM方體,如此一來如何由為數眾多的OLAM方體中依使用者的查詢快速地找出符合的OLAM方體,將是影響OMARS系統效率的關鍵因素,因此本研究主要目的在於如何根據使用者的查詢,有效、快速地找出符合的OLAM方體,並從中篩選出符合的頻繁項目集,使OMARS系統能在線上的環境中,對於使用者的查詢達到即時回覆的目的,而我們將此問題稱為OMARS系統中OLAM方體索引結構設計。
針對此一問題,我們提出一三層式的階層索引架構,在架構中我們首先採取前序樹與R-樹的資料結構設計出2種不同的索引結構,以解決屬性組合的搜尋問題,再藉由雜湊表的方式,根據交易屬性與採掘屬性的組合找出特定的OLAM方體,最後利用項目集的支持度建置二元樹,以找出OLAM方體中的資料切割點,將非頻繁項目集的資料刪除,藉此克服在關聯規則採掘過程中的問題,使OMARS系統能在線上的環境下,對於使用者的查詢,達到即時回覆的目的。
1.2 研究貢獻
本論文的主要貢獻如下:
透過維度屬性編碼的方式,利用前序樹的資料結構與改良R-樹資料結構所衍
生的R4-樹,發展出應用於維度屬性組合搜尋的多維度索引方法。
說明如何藉由雜湊表的方式,判斷屬性組合中的交易屬性與採掘屬性,以依據
使用者的查詢產生相對應的資料方體。
說明如何藉由二元樹的資料結構,找出資料方體中的資料切割點,將資料方體中小於支持度的項目集刪除。
1.3 章節安排
本論文其餘章節安排如下:在第二章中,我們將說明本篇論文的背景知識與回顧相關研究,以知識發掘的角度說明資料倉儲與資料採掘,在知識發掘的過程中所扮演的不可分割的角色,以重申資料倉儲與資料採掘的整合是知識發掘的未來趨勢,並進一步說明資料方體與關聯規則等相關重要的觀念。在第三章中,說明OMARS系統的架構,及過去的相關研究貢獻。在第四章中,我們將說明OLAM方體因所涵蓋的資料範圍及系統預設的最小支持度在小於使用者所定義的最小支持度的情況下,進行關聯規則採掘時所衍生的問題,其中如何搜尋使用者所定義的維度屬性組合是本論文所欲探討的主要問題,也是影響OMARS系統效能的關鍵因素。在第五章中,以三層式的階層索引架構說明,如何解決OLAM方體在進行關聯規則採掘時的三大問題,其架構涵蓋了本研究中所提出的前序樹索引與R4-樹索引,以及用於判斷交易屬性與採掘屬性的雜湊表,與如何搜尋OLAM方體中非頻繁項目集的切割點所建置的二元樹。而在第六章中我們將根據階層索引結構中,第一層所提出的前序樹索引與R4-樹索引及第三層中的二元樹,進行實驗,闡明實驗的設計與實驗結果的分析。最後在第七章中,我們將根據實驗結果與本研究所發現的結論,及本研究貢獻與後續研究
您可能关注的文档
最近下载
- 2024年城市管理网格员四级-中级理论知识试题及答案.docx VIP
- 2024年城市管理网格员三级(高级)理论知识考试试题及答案.docx VIP
- 2020-2021学年北京师大二附中实验学校九年级上学期期中数学试卷(含解析).pdf VIP
- 2025年城市管理网格员三级(高级)理论知识考试试题及答案.docx VIP
- 压力性尿失禁的护理查房PPT课件.pptx VIP
- 2024-2025学年辽宁铁道职业技术学院单招《英语》试卷及答案详解【典优】.docx VIP
- 辽宁铁道职业技术学院单招考试文化素质数学通关考试题库(完整版)附答案详解.docx VIP
- 学年西城区四中初三上学期期中数学试卷.pdf VIP
- 2019-2020学年北京四中九年级(上)期中数学试卷--含详细解析.docx VIP
- 中国餐饮企业发展报告.pptx VIP
文档评论(0)