第03章 数据仓库设计开发应用.pptVIP

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.5 数据仓库的实施 例3-5 试根据例3-3和3-4的设计结果创建警务数据仓库。 解:根据例3-3和3-4的设计结果,我们以Windows 身份验证登录SQL Server2008 R2的数据库引擎服务器,并在SSMS环境中创建数据仓库HuangDW_Hotel,具体创建步骤如下。 1、创建数据仓库名称HuangDW_Hotel 2、创建维度表 按照以下顺序分别创建DimDate,DimCaseType,DimAddress,DimPolice,Dimpeople和DimHotel等6张维度表。 第 * 页 3.4 数据仓库的设计 (6)需求说明 在需求调查和分析整理基础上,依据一定的规范撰写需求分析说明书。其主要内容有: 1)数据源:包括数据源的数据结构,数据源的位置,数据源的计算机环境,可用的历史数据,数据抽取方案; 2)数据转换:数据仓库中的数据为决策分析服务,而数据源所在系统的数据为业务处理服务,因此,需求说明书需要描述如何正确地将这些数据源转换成适合数据仓库存储的数据; 3)数据存储:数据仓库所需数据的详细程度,即数据所在维的最低层次,还包括关于存储需求足够的信息,估计数据仓库需要多少历史和存档数据。 第 * 页 3.4 数据仓库的设计 例3-1:某市警务数据仓库系统 1、 需求调查 (1) 最近几天或者一周,在指定派出所或公安分局辖区内宾馆住宿的旅客主要从哪些地区而来; (2)有没有犯罪前科人员,他们所犯前科类型是什么(大类、小类还是子类)? (3)住宿的人次,平均住宿天数等; (4)以上问题还可能是以小时为单位的查询,比如周六晚上11点至凌晨2点之间辖区内的宾馆入住人员数量等。 (5) 数据来源于6个不同的数据库应用管理系统:户籍管理系统(称为常住人口),暂住人口管理系统,酒店客房管理系统、治安管理应用系统、辖区旅馆基本信息管理系统等。 第 * 页 3.4 数据仓库的设计 2、分析整理 (1)确定主题:警务数据仓库的首个主题,并将其命名为“入住”,并用Hotel作为别名。 ① 主题涉及的事实有“入住人次”和“入住天数”等。相关的维度主要是入住宾馆的“人员”,“时间”和所入住的“宾馆”。 ② 旅客的来源地,可以从人员的户口所在地或籍贯信息获得,而旅馆所属治安管理的辖区从旅馆基本信息的所属派出所地址信息中找到。 第 * 页 3.4 数据仓库的设计 (2)确定数据源:根据确定的主题和警务信息管理处提供的可用原始数据库,我们确定了主题所需的数据源有8张基本表。虽然它们分别来自不同的应用系统,但为了教学方便,我们将它们统一放在一个名为OLTPHotel的数据库中。 ① 旅馆数据源表LGXX,共有65个属性描述旅馆的名称、电话、地址等基本信息。 ② 常住人口数据源表CZRK,共有128个属性描述常住人口的身份证号、姓名、性别等公民基本信息。 第 * 页 3.4 数据仓库的设计 ④ 暂住人口数据源表ZZRK,共有98个属性描述暂住人口的暂住证号、身份证号、姓名、性别等暂住人员基本信息。 ⑤ 犯罪类型数据源表FZLX,共有18属性描述我国刑法规定的犯罪类型,有大类、小类、子类和具体罪行名称等。 ⑥ 所属辖区数据源表SSXQ,共有12个属性描述了旅客或暂住人口户口所在的省市县名称等基本信息。 ⑦ 派出所数据源表PCS,共有10个属性描述了派出所的名称、编码、地址等基本信息。 ⑧ 人员前科数据源表SSXQ,共有8个属性描述了犯罪人员的身份证号、犯罪类型和时间等基本信息。 第 * 页 3.4 数据仓库的设计 表3-1 旅馆和常住人口数据源 第 * 页 3.4 数据仓库的设计 表3-2 旅馆入住和暂住人口数据源 第 * 页 3.4 数据仓库的设计 表3-3 犯罪类型与所属辖区数据源 第 * 页 3.4 数据仓库的设计 表3-4 派出所与人员前科数据源 (3)确定抽取频率 由于决策分析查询经常需要最近几天或一周的统计数据,因此,我们将旅客宾馆入住数据的抽取工作,设计为每天执行一次抽取。 第 * 页 3.4 数据仓库的设计 3.4.2 概念设计 概念模型设计任务:将需求分析阶段确定的各个主题,转换为概念数据模型表示,并为这些主题的逻辑数据模型设计奠定基础。 计主要有如下3个步骤。 (1)设计每个主题的多维数据模型,包括事实和维度名称; (2)设计每个维的层次及其名称; (3)设计每个主题的元数据,包括事实、维度等的类型、长度等; 第 * 页 3.4 数据仓库的设计 3.4.2 概念设计 例3-2 请根据例3-

文档评论(0)

文档精品 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档