- 1、本文档共111页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
维度资料表Dimensiontable
新增資料到大維度資料表 當維度資料有更動時,在理論上第二型技術的方法最好,但是此技術卻不適合使用在龐大且經常變動的維度資料表中。 所謂的大型維度資料表是指維度資料表中欄位數目很多,通常超過 150 且維度資料表中的筆數也很多,通常是數以百萬計,如圖 3-36 所示。 在變動快速龐大型維度資料表環境下使用第二型技術來追蹤過去維度資料所有的歷史資料會造成資料筆數大量增加,而使原來資料筆數就很多的大維度資料表的情況雪上加霜。 解決方法就是分離 (Break off) 原來維度資料表中經常改變維度屬性值的欄位 圖3-36 變動快速龐大型維度資料表 新增資料到大維度資料表 分離 (Break off)技術 從原來的龐大型維度資料表中找出值較常改變的欄位,並將其安排到另一個維度資料表,並將此表直接與事實資料表相聯結 這一個被分離開且規模較小的維度資料表稱為迷你維度資料表 (Mini-dimension table) ,如圖3-37所示。 迷你維度資料表技術可以很容易在快速龐大型維度資料表環境中追蹤歷史變動的資料,但是分離技術的過程中如何讓迷你維度資料表技術更有效率,則需要有配套措施。相關主要配套措施有三種方式 帶狀值 (Banded values) 嚴格限制成長 (Restricted growth) 分離核心維度 (Separation from core dimension) 圖3-37 迷你維度資料表 新增資料到大維度資料表 帶狀值 (Banded values) 將人口統計欄位中的連續型數值欄位帶狀化 (Banded),使成為帶狀值後再儲存到迷你維度資料表中 例如圖 3-32中客戶年收入本來為一數值,且變動很快,如果將年收入改成三個等級,等級 A 為 210,000~400,000,等級B 為 410,000~600,000,等級 C 為 610,000~800,000,高中低如此帶狀式的級距化轉換可以讓經常變動的年收入狀況穩定下來 範例中的 7 個人口統計資料欄位,假設每一個欄位有 5 種可能值,則迷你維度資料表中僅會產生 57 (=78125) 筆資料,與龐大維度資料表中數百萬筆的資料量相較之下可看出資料量小很多。 新增資料到大維度資料表 嚴格限制成長 (Restricted growth) 當第一次分離出一個迷你維度資料表時,如果迷你維度資料表的資料量還是成長很快,則需要進行第二次分離,另外成立第二個迷你維度資料表(Second mini-dimension table) 例如客戶人口統計維度資料表中可以將消費與信用人口統計欄位再次分離出來,如圖 3-38 所示,如此可以再次降低維度資料變動所產生的資料量。 圖3-38 兩次分離的迷你維度資料表 新增資料到大維度資料表 分離核心維度 (Separation from core dimension) 隨著時間改變,客戶人口統計資料也會在迷你維度資料表中緩慢地增加,由於客戶維度資料分別儲存在不同的兩個維度資料表中,如此會造成查詢的複雜度,因此可在客戶維度資料表中複製一份最新的人口統計資料,如圖 3-39 所示,可以增加查詢效率。 圖3-39 最新客戶人口統計資料儲存兩份 新增資料到大維度資料表 迷你維度資料表可能無法與原來的維度資料相連 即兩個維度資料表必須經由事實資料表才能聯結,而原來合在同一維度資料表上時並無這問題。 客戶的人口統計資料只有在產生消費後才能與客戶產生關聯。 建議新增空的交易資料來處理。 簡報大綱 學習目標 3.1 簡介 3.2 維度模型初探 3.3 事實資料表 3.4 維度資料表 3.5 匯流排架構 3.6 維度模型的其他特殊議題 3.7 結論 結論(I) 本章主要介紹建置 BI 系統所需使用到的資料模型理論基礎 Dimensional Model 事實資料與維度資料表 確定每一個維度模型的顆粒度,不同顆粒度的事實資料要放在不同維度模型中 如建多部門資料超市,則需建構一致的維度 (Conformed dimensions) 資料與事實 (Conformed facts) 資料 結論(II) 規劃維度資料表時盡量使用代理鍵 (Surrogate key) 機制當主鍵,避免後續不必要的更動 時間維度可獨立儲存或縮減成數值儲存到事實資料表 變動緩慢的維度邏輯上以第二型處理最好 ERP學會簡介 本會於91年1月26日成立。 使命: 整合產官學研資源,協助華人地區推動以ERP為基礎的企業e化。 目標:藉由統合與發展知識 協助廠商提高e化效率 協助軟體公司發展適合華人e化軟體 協助台灣成為華人地區最佳e化顧問供應地 認證起緣 企業面臨狀況 眾多的企業、軟體與顧問公司無法找到有企業e化核心知識的管理人才 台灣有獨步華人地區的製造業管理與運
您可能关注的文档
- 策略性领导.PPT
- 简易DC-DC系统设计方法1引言LQ2指标定义与元件选型.PDF
- 策略规划之程序.PPT
- 等离子弧堆焊镍基球形碳化钨涂层摩擦磨损研究-表面技术.PDF
- 管幕冻结特殊布管形式稳态温度场解析解-中国公路学报.PDF
- 管路与零件连接处断裂.DOC
- 管窥噶玛兰契约文书一得-中华科技史学会.PDF
- 粤东区域性职教教师专业化研究的理论与实践-北京农业职业学院学报.PDF
- 糖都戏曲文化行-云林故事馆!.DOC
- 糸状菌放线菌细菌-制品评似技术基盘机构.DOC
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)