资料仓储的OLAP操作方法.PPTVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

*DataMining*資料倉儲的操作方法(轉軸)轉軸(pivot)(又稱旋轉:rotate)方法讓使用者可以轉動2D切片或是3D的立方體,從不同的視角來觀看資料。例如將前頁圖之子立方體做一90度的旋轉。食品五金服飾Q12003Q22003Q32003Q4北部客戶140,000260,000280,000300,000140,000160,000180,000200,00040,00060,00080,000100,000140,000260,000280,000300,000*DataMining*資料倉儲的查詢處理(1/5)資料倉儲基本上是建立在一個多維度資料庫結構上的一個儲存體,而多維度資料分析的核心是如何有效率的計算出多個維度集合上的統計值(例如2003年每一季,每個區域服飾的銷售金額),以支援快速查詢之用。若是使用一般關聯式資料庫,就是利用「groupby」語法來求得這些統計值(groupby季、分店、服飾),只是SQL的groupby指令是在執行時,才即時去計算結果,當資料量大時,則可能需要等待上一段時間。*DataMining*資料倉儲的查詢處理(2/5)範例一的多維度結構包含時間、商品、客戶區域三個維度與一個銷售金額量值,使用者可能使用下面任何一種的查詢方式來分析資料:(1)依照時間、商品、區域分組來計算銷售總金額(形成時間、商品、區域三維度的立方體)(2)依照時間、商品分組來計算銷售總金額(形成時間、商品二維度的立方體)(3)依照商品、區域分組來計算銷售總金額(形成商品、區域二維度的立方體)(4)依照時間、區域分組來計算銷售總金額(形成時間、區域二維度的立方體)*DataMining*資料倉儲的查詢處理(3/5)(5)依照時間分組來計算銷售總金額(形成時間一維度的立方體)(6)依照商品分組來計算銷售總金額(形成商品一維度的立方體)(7)依照區域分組來計算銷售總金額(形成區域一維度的立方體)(8)所有銷售總金額(形成0維度的立方體)*DataMining*資料倉儲的查詢處理(4/5)上面8種查詢分組是將三個維度所有可能的查詢組合都排列出來,這些分組查詢形成該資料立方體的【晶格】(lattice)。*DataMining*資料倉儲的查詢處理(5/5)為了快速回答查詢,可以將所有可能組合查詢的彙總資料都事先計算並加以儲存,計算的過程可以由下而上聚集而成。若是記憶空間足夠,可以事先將以上所列的3D~0D資料立方體的彙總資料,全部事先算出並加以儲存,若是空間不夠,則可以只計算部分彙總資料,遇到查詢時,再及時由下層資料立方體以聚集方式快速算出。一般關聯式資料庫遇到每一次查詢,都必須一筆一筆慢慢累積計算,在效能上自然無法跟已經事先計算出彙總值的多維度資料庫結構相比。*DataMining*資料倉儲建置程序需求分析:訪談主管,得到系統需求。資料來源:內部資料或是外購資料資料整理:正確資料,才能提供有用資訊資料倉儲架構設計事實資料表設計維度資料表設計*DataMining*資料倉儲的架構設計(1/4)一個資料倉儲主要是由「事實資料表」與「維度資料表」所構成,兩者之間透過索引鍵建立關聯。事實資料指的是經過整理的原始交易資料,在事實資料表中,儲存的是各種事實與量值的詳細數值。*DataMining*資料倉儲的架構設計(2/4)例如一個事實資料表可能存放如此一筆紀錄:各月份、各商品與各客戶購買的金額與數量,前三個欄位(月份、商品與客戶)是事實資料也是索引鍵欄位,將利用他們分別關聯到其他三個維度資料表(時間維度、商品維度與客戶區域維度資料表)。剩下銷售數量與金額兩個欄位則是量值欄位,主要是用來做統計數量的運算,例如計算2003年銷售金額為多少?為了將來資料分析,事實資料表必須包含最低層級的資料列(例如提供統計銷售金額資訊最小細到以週為單位、則事實資料表最低層級也必須是週,而不能是月)。DataMining*DataMining*操作型資料庫系統在業界廣為應用的資料庫軟體,常用到的功能不外乎為執行線上交易或是查詢處理,因而也稱為線上交易處理系統(On-LineTransactionProces

文档评论(0)

177****8321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档