- 0
- 0
- 约5.08千字
- 约 48页
- 2020-01-13 发布于湖北
- 举报
* 维层次(hierarchy) 在一个维中可以有多种分类方法,把每种分类方法叫做一个层次。 如:时间维的两个层次。 1)维-维层次 年 季度 月 星期 日 * 维属性(attribute) 维属性说明维成员所具有的特征。 如:在地区维的商店这一层定义“负责人”、“商店类型”等属性,在城市层上定义“人口”、“面积”等属性。 1)维-维属性 * 度量是要分析的目标或对象,是多维数据集的核心值,是最终用户在数据仓库应用中需查看的数据。 常见的度量有:销售量、供应量、营业额等。 通常是具体数据值。 2)度量 商品 城市 日期 牛奶 浴巾 毛巾 可乐 果汁 4 3 2 1 北京 上海 长沙 广州 武汉 究竟想了解什么? * 多维数据模型构成的多维数据空间称作为数据立方体(Data Cube,简记为cube)。 是从不同角度对同一数据进行观察得到的数据交点。 当观察的角度(参数)超过三个所构成的数据结果集称为超立方体,也称为超维数据集。 3)数据立方体 * 一个二维数据立方体对应的某地区商店销售额表 3)数据立方体 时间(季度) 产品类型 彩电 冰箱 洗衣机 家用电器 第一季度 500万 200万 240万 1500万 第二季度 200万 300万 420万 2100万 第三季度 240万 500万 250万 1000万 第四季度 80万 100万 320万 1700万 * 对应2009年商店销售额表的三维数据立方体 3)数据立方体 * 一个三维数据立方体(增加地区维)商店销售额表 3)数据立方体 时间(季度) 山东省所有商店销售额 河北省所有商店销售额 福建省所有商店销售额 产品类型 产品类型 产品类型 彩电 冰箱 洗衣机 家用电器 彩电 冰箱 洗衣机 家用电器 彩电 冰箱 洗衣机 家用电器 第一季度 500万 200万 240万 1500万 500万 200万 240万 1500万 500万 200万 240万 1500万 第二季度 200万 300万 420万 2100万 200万 300万 420万 2100万 200万 300万 420万 2100万 第三季度 240万 500万 250万 1000万 240万 500万 250万 1000万 240万 500万 250万 1000万 第四季度 80万 100万 320万 1700万 80万 100万 320万 1700万 80万 100万 320万 1700万 * 在一个数据立方体中,当每个维上都确定了一个维成员时,就会唯一地确定多维空间中的一个点,这个点称之为数据单元(cell)。 表示为: (维1成员,维2成员,...,维n成员,度量值1,度量值2,...) 结合前面实例,如:“山东省”、“2009年第一季度”、“彩电”时,销售额为500万,则表示为: (“山东省”,“2009年第一季度”,“彩电”,“500万”) 4)数据单元 * * 4.1 OLAP技术概述 4.2 多维数据模型 4.2.1 基本概念 4.2.2 星形、雪花和事实群模型 联机分析处理技术1 * 常见的多维数据模型有: 星形模型 雪花模型 事实群模型 4.2.2 星形、雪花和事实群模型 * 1.星形模型 星形模型是多维数据模型的基本结构,通常由一个很大的中心表(事实表)和一组较小的表(维度表)组成。 * 1.星形模型 * 1.星形模型 对于维内层次比较复杂的维,为了避免冗余过多,同时也为了支持针对不同层上的相同属性的查询,可以用多张表来描述一个复杂维,则产生了星形模型的变种--雪花模型。 * 2.雪花模型 * 2)雪花模型 星形模型和雪花模型的主要区别是雪花模型中的维表是规范化的。 维表不但易于维护,而且节省存储空间。 雪花模型在执行查询操作时需要进行较多的链接操作,可能会影响系统的性能。 * 3)事实群模型 在某些复杂应用中,可能需要多个事实表来共享维表,这种模型类似于星形模型的集合,被称之为星系模型或事实群模型。 销售事实表和货运事实表共享时间维、产品维和地区维举例。 * 3.事实群模型 淘宝的数据分析产品两者的区别 对各个模型再做简单描述。 说明为什么要采用多个模型,因为直接从现实世界到物理模型是很困难的。 说明各个模型的转换是由谁负责的。 * 第4讲 联机分析处理技术1 * 数据仓库产生的原因 数据处理的类型 操作型处理(OLTP):数据的收集、整理、存储、查询和增、删、改操作。 分析型处理(OLAP):数据的再加工,往往要访问大量的历史数据,进行复杂的统计分析。 * 数据仓库的四个基本特征: 数据仓库的数据是面向主题的(Subject Oriented); 数据仓库的数据时集成的(Integrate); 数据仓库的数据不可更新(Non-Volat
您可能关注的文档
- 数值计算方法第一章.ppt
- 数字图像处理 第四章 图像增强与平滑.ppt
- 数字图象处理_第8章像素(114).ppt
- 数字媒体技术基础 第二章 数字信号与信号编码与压缩.ppt
- 数字楼宇控制设备.ppt
- 数字测图原理与方法(第七章).ppt
- 数字化医学影像质量评价与质量控制PowerPoint 演示文稿.ppt
- 数字电子技术 第9章 半导体存储器.ppt
- 数字电子技术--数制与码制.ppt
- 数字电子技术(第三版)[高吉祥][电子教案]第四章.ppt
- 中航期货-铜月报-2026年2月.pdf
- 欧洲央行-资本缓冲能力的结构模型.pdf
- 国金证券-计算机行业专题研究报告-消费电子3D打印迎加速契机.pdf
- 民航局机场司现行有效文件目录.pdf
- 华西证券-钠电池行业专题报告-技术成熟+应用领域清晰,钠电池有望迎来放量.pdf
- 华鑫证券-传媒行业周报-传媒回调行情仍在,智能新纪元撬动注意力经济.pdf
- 国金证券-石油化工行业研究-美以对伊朗军事行动爆发.pdf
- 西部证券-建筑建材行业周报-中国化学重点推荐关注减碳技术服务商.pdf
- 欧洲电力行业联盟-Eurelectric对ENTSO-E 2025年欧洲资源充足性评估咨询的回应(英).pdf
- 欧洲银行体系中的风险传播:非银行金融机构和市场风险的放大效应-2026.pdf
最近下载
- 托育服务中心项目计划书.pptx VIP
- DL_T 596-2021 电力设备预防性试验规程.docx VIP
- 铝材厂跟单员培训课件.pptx VIP
- 2026年湖南电气职业技术学院单招职业技能考试题库附答案详解(培优).docx VIP
- (高清版)B-T 41261-2022 过程工业报警系统管理.pdf VIP
- 室间质评不合格原因分析及纠正记录表(2026版-).docx VIP
- GB 50870-2013 建筑施工安全技术统一规范.docx VIP
- 青少年户外营地(露营)教育教学课件:营地概论.pptx VIP
- 国家基本公共卫生中医药服务培训.ppt VIP
- 2021年磁粉检测高级证模拟实操试题-能中能.docx VIP
原创力文档

文档评论(0)