資料庫系統專題課程期末報告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
資料庫系統專題課程期末報告

資料庫系統專題課程 期末報告 線上分析處理 (On-Line Analytical Processing, OLAP) 李建祥 D954020001, 張珀銀 D954020007 導論 線上分析處理(On-line Analytical Processing,後文簡稱OLAP)是一種多維度資料分析的方法。從企業決策的角度來看,常需要從日常的交易資料中,了解銷售量或金額多寡,作為製造或促銷的決策依據。而銷售結果需要從各種角度加以分析,才能看出有變異或趨勢,進而理出有助於決策的有用資訊。以汽車銷售為例,我們想要了解汽車的銷售情形,首先,以時間維度分析各年度的汽車銷售量,從圖一來看,從1990到1992年,各年度的汽車銷售量很穩定都是69輛。 圖一:以時間維度分析各年度的汽車銷售量 從時間維度來看汽車銷售量似乎沒有差異,此時,銷售經理可能想進一步了解,不同車型是否仍然有相同的銷售量。於是,加上一個車型維度,進一步交叉分析銷售量的變化,其結果如圖二所示。從圖中,我們可以看到,Chevy車型的銷售量呈現逐年遞增的現象;反之,Ford則表現出逐年遞減的趨勢。 圖二:以時間和車型等二維度分析汽車銷售量 加上車型維度的分析所表現出的銷售量異常現象,可能給予銷售經理一個新的思考方向,為何Ford 銷售會降低而Chevy銷售量會提升?是否要採取一些促銷策略來提昇Ford車型銷售?哪些促銷對象較適當?對於這些問題,銷售經理可能會再加入一個客戶維度,來分析這些歷史銷售的客戶年齡層,以作為擬定促銷對象的參考,或針對車型進一步分析客戶對顏色的偏好,如圖三所示,不論是Chevy或Ford客戶似乎較喜愛購買白色車子。 圖三:針對車型維度進一步分析顏色子維度在各年度的銷售量 從上述的簡單例子來看,企業決策者在分析問題的過程中,常需要以不同的維度分析資料,以發掘出有意義的資訊,而且多個維度的交叉分析,或進一步分析某個維度的子維度的資料變化情形,也是在發現異常現象時,所採取的分析方式。雖然,這些分析所需的資訊,可以透過報表系統來呈現,但報表的產生需要固定的格式,無法迎合決策者視問題內容,隨時變換分析維度的需求;且這些資訊可能牽涉上百萬筆交易記錄的讀取與彙總,整理資料所需的空間耗用與時間耗費,不是報表系統在合理的反應時間內所能提供的。 為此,要滿足多維度的彈性與大量資料的彙總等分析需求,目前主要資料庫管理系統和ERP大廠,如:甲骨文(Oracle)、微軟(Mircrosoft)、和思愛普(SAP)等公司,也都提供了OLAP解決方案,協助其企業客戶解決大量資料分析的問題。 為說明OLAP相關的概念與實作方式,本報告的章節組織如下:首先我們將介紹OLAP功能特色,闡述OLAP為滿足企業大量資料分析需求,所提供的獨特功能;接著,介紹描述OLAP產物─資料立方體(data cube,後文簡稱cube)的維度模式,以及如何將關連資料庫的實體關係模式轉化成維度模式的步驟;另外,也將介紹資料庫儲存cube的常用方法,並比較其優劣;最後,介紹一種能存取cube的語言─Multi-Dimensional Expression, 簡稱MDX),說明除了透過圖形化的使用者操作介面外,如何使用查詢語言存取cube上的資料。 功能特色 根據Thomsen的歸納,OLAP具有以下的功能特色(Thomsen, 2002): 含階層式的多維度結構:提供多維度的分析是OLAP最主要的特色,而且任一個維度也可以包含多個層級的子維度,而成為階層式的結構關係,如圖四所示。圖中的量值(measure)表示分析所需的彙總欄位,如銷售量,而維度包含多個層級,而每個層級必須從屬於其父層級或維度。層級只是是抽象概念,其實體內容稱為成員(member)。以時間維度為例,它底下有「年」,而「年」底下可在分成「季」,「季」包含「月」,「月」包含「日」,所以時間維度可形成年、季、月、日等四個階層維度,其結構如圖五所示,而「年」的成員如:2001、2002、...等等。 圖四:階層式的維度結構 圖五:以時間維度為例的維度層級 有效的交叉比較與分析規格:多維度的分析除了能以各種不同維度彙總交易資料中的某些欄位(如:第一節的汽車銷售量)外,也能提供多個維度交叉比對的結果,就如同第一節描述的以時間和車型等二維度,交叉分析汽車銷售量,可呈現如表一的分析結果。另一種狀況是,分析的資料可能不是來自於單個來源資料欄位的彙總,而是要合併多個維度的成員之彙總資料,計算而得的資訊,例如:銷售成長率,必須將時間維度中各年度成員的銷售量與前一年度成員的銷售量相除,以得到如表二所示的成長率。OLAP能透過定義量值的計算屬性,得到類似成長率的推導量值(derived measure)。 表一:以時間和車型等維度的汽車銷售量交叉分析 1991 1

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档