- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
缓慢改变维度种类
本章學習重點 概念模式 邏輯模式 實體模式 資料正規化 維度模式 緩慢改變維度問題 資料模式特點 一個設計良好的資料模式有以下的特點: 能將組織的業務流程清楚地表達出來 能正確地建立不同資料之間的關係。 有足夠的彈性來反應一些未來可能會發生的改變。 資料模式設計階段 資料模式的設計有三個階段: 概念資料模式(Conceptual Data Model) 邏輯資料模式(Logical Data Model) 實體資料模式(Physical Data Model) 資料模式術語 個體(Entity):個體是一類重要的東西。這個東西可能是具體的或是抽象的。 關係(Relationship):關係代表個體與個體之間的關聯。關係的型態有以下幾種可能:一對一、一對多、和多對多。 屬性(Attribute):屬性是對個體的描述。 主鍵(Primary Key):主鍵是一種特別的屬性。主鍵是可以用來辨認不同的資料。 概念模式 概念資料模式的目的是讓我們可以大致瞭解資料的內容。 一個概念資料模式有以下的特性 只包括重要的個體以及關係 屬性不會被顯示出來 主鍵並不會被定出 可包含多對多的關係 在資料倉儲系統的建置過程中,通常會將設計概念模式與邏輯模式合在同一個步驟裏。 邏輯模式 輯資料模式的目的是讓我們可以對資料的內容有詳細的瞭解。 一個邏輯模式有以下的特性: 包括所有的個體和以及不同個體之間的關係 每個個體中的屬性都會被列出 主鍵會被定出 外來鍵會被定出 資料正規化是在邏輯模式這一層做出 邏輯模式設計步驟 找出所有的個體。 定出個體的主鍵。 找出所有個體之間的關係。 找出每一個個體的所有屬性並制定屬性的類別。 解開多對多的關係。 資料正規化。 資料定義域 資料定義域是這個屬性中的資料所可能涵蓋的範圍。 舉例來說,我們假使決定性別這個屬性是用M代表男、F代表女、以及U代表不確定,我們就可以說性別這個屬性的資料定義域為{M、F、U}。 實體模式 實體模式是我們將邏輯模式依實際運作上的考量建置在某一個資料庫及硬體平台上的結果。 一個實體模式有以下的特性: 包括所有的表格及欄位。 由外來鍵的設定來建立表格與表格之間的關聯。 依據使用者需求,資料模式可能被反正規化。 實體模式設計步驟 將邏輯模式中的個體轉換為實體模式中的表格。 將邏輯模式中的關係在實體模式中以外來鍵顯示。 將邏輯模式中的屬性轉換為實體模式中的欄位。 將實體模式依實際運作上的考量來做調整。 資料正規化 資料正規化是一種將資料以有效率的方式存在資料庫中的過程。 資料正規化的目的有二: 避免同樣的資料存放好幾次,造成處理上的不便。 增進交易系統的效率。 資料正規化型式 資料正規化有好幾級的型式: 第一正規形式 第二正規形式 第三正規形式 Boyce/Codd 正規形式 第四正規形式 第五正規形式 一般的慣例是將第三正規形式視為目標。 第一正規形式 要符合第一正規形式,資料必須滿足以下的條件: 不能有重複的欄位。 每個欄位必須代表資料最小的單元。 每一筆資料都有自己的主鍵。 第二正規形式 要符合第二正規形式,資料必須滿足以下的條件: 符合第一正規形式。 只有完全與主鍵有關的資料才會被存放在同一個表格中,其餘的資料必須放到另一個表格裏。 不同表格之間的關係由外來鍵來展示。 第三正規形式 要符合第三正規形式,資料必須滿足以下的條件: 符合第二正規形式。 所有主鍵外的欄位都必須是用來描述主鍵本身的屬性。 第三正規形式並不適合於做為分析系統的資料模式 傳統的第三正規形式並不適合於做為分析系統的資料模式。原因如下: 在做資料查詢時,表格連接的次數偏高。 當需要的資料分散在不同表格時,我們會發現一個報表的產生可能有好幾種資料查詢法都可行。 對使用者而言,第三正規形式不易理解。 分析系統資料模式需符合的條件 將表格連接次數降到最低。 當需要的資料分散在不同表格時,確認只有一種路徑來連接不同的表格。 易懂。 維度模式 符合上述條件的資料模式就是維度模式(Dimension Model)。 在維度模式的架構中,所有的表格被歸納為兩個類型:維度表格(Dimension Table)以及事實表格(Fact Table)。 維度模式術語 維度模式表格 維度表格 維度表格可以被看做是使用者分析資料的窗口。維度表格包含一個主鑑,而其他的欄位則是用來描述這筆資料的屬性的。 事實表格 事實表格包含的欄位有兩種:第一種是計量,第二種是與基本細量相符的
文档评论(0)