- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
OLAP技术概述
第 四 章 OLAP技術4.1 OLAP技術概述4.2 OLAP與多維度分析 4.3 OLAP的執行4.4 多維度與關聯式OLAP4.5 OLAP技術評估習題 OLAP技術主要有兩個特色: 線上(On_Line),其呈現方式為對客戶申請的快速回應和互動式操作,它的執行是由客戶端╱伺服器架構完成的; 多維分析(Multi_Analysis),這也是OLAP技術的重點所在。 4.1.1 OLAP的發展 在1960年代末期,E.P.Codd提出關聯式資料模型,促進了關聯式資料庫與線上交易處理的發展。 E.F.Codd在1993年將這類技術稱為OLAP。 OLAP主要是針對特定問題的線上資料查詢和分析。 4.1.2 OLAP的特色 快速性 需求系統能在數秒內對客戶的多數分析需求作出反 應。 可分析性 OLAP系統應能處理與應用有關的邏輯及統計分 析。 多重維度性 多維性是OLAP的關鍵屬性。系統能夠提供對資料分 析的多維視覺圖和多維分析。 資訊性 不論資料量有多大.也不管資料儲存在何處,OLAP 系統應能即時獲得資料,並且管理大容量資訊。 4.2 OLAP與多維度分析4.2.1 多維基本概念 維度(Dimension) 資料倉儲中的維度,一般具有水平階層和垂直階層。水平階層由維度階層中相同級別的欄位值構成,例如圖4.1中的北部、中部和南部階層。 垂直階層則由為度階層架構中具有不同級別的字元值所構成,例如圖4.1中的北部、台北階層。 多維度資料集合 多維度資料集合是決策支援的支柱,也是0LAP的重 點,有時也稱為立方體或超立方。OLAP展現在客戶 面前的是一幅幅多維度視覺圖。 維度成員 維度成員是維度的一個取值,如果維度已經分成了若干個維度,那麼維度成員就是不同維度階層取值的組合。例如,某一公司的銷售資料有市、區、里地理維度的三個階層,那麼”台北市”就構成了地理維度的一個維度成員。 維度成員並不是一定要在維度的每一個階層上都取值。例如,“台北市”、“文山區”都是地理位置維度的維度成員。維度成員的值並不是人們在資料倉儲中所關心的物件,人們常常是用這些維度成員去描述他所關心的主題。 多維資料集的度量值 在多維資料集中有一組度量值,這些值是多維資料 集中事實表導向的一列或多列,這些值應該是數 字。 群集(Agrregation) 群集或聚合是指收集了基本交易資料的結構。在一 個立方體中包括很多階層,這些階層可以向客戶提 供某一階層的一般化資料。 4.2.2 多維分析 多維的切片 在切片的概念中,有兩個重要的概念必須確實掌 握: 一個是多維資料集的切片數量的多少 是由所選 定的那個維的維成員數量的多寡所決定的。 另一個是進行切片操作的目的是使人們能夠更好地了解多維資料集。 多維的切塊 實際上,切塊操作也可以看成是進行了多次切片操 作之後,將每次切片操作所得到的切片重疊在一起 而形成的。 旋轉 在對資料倉儲中的多維資料集進行顯示操作過程 中,客戶常常希望能夠對多維資料集改變其顯示的 維度方向,也就是說進行多維度資料的旋轉(rotate) 操作。 其他OLAP操作 在OLAP的分析中,還有”上捲”(roll_up)、”下鑽” (drill_down)、”鑽過”(drill_across)和”鑽透” (drill_through)等鑽取操作。 4.2.3 維度的階層關係 4.2.4 維度的類別關係 4.2.5 OLAP與資料倉儲的關係 從OLAP使用效率的角度考量,在設計資料倉儲時應該考量這樣一些因素: 可能使用星形架構,如果採用雪花結構,就要最小化事實表底層維度表之後的維度表的數量。 為客戶設計包含事實表的維度表,這些維度表應該包含有意義的、客戶希望瞭解的資訊。 維度表的設計應該符合通常意義上的範式限制,維度表中不要出現相關的資訊。 事實表中不要包含匯總資料,事實表中所包含的客戶需要存取的資料應該具有必須的粒度,這些資料應該是同一階層的資料。 對事實表和維度表中的關鍵字必須建立索引,同一種資料可能使用一個是事實表。 保證資料的參考完備性,史事時表中的所有資料都出現在所有的維度表中,避免事實表中的某些資料行在立方體進行群集運算時沒有加進來。 4.3 OLAP的執行 這種三層客戶端╱伺服器的架構通常將資料倉儲、 OLAP伺服器與客戶端區隔分開。系統的主要處理 (例如資料存取、後端資料處理、報表的預先處 理)都是由OLAP伺服器上的應用完成,而不是由客 戶端完成。 4.4 多維度與關聯式OLAP 如果採
文档评论(0)