- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
注意:掌握的知识点可能出现在问答题目中,了解的知识点多出现在判断和选择题目中
=====操作部分=====
掌握运营型数据和分析型数据的差异
掌握ODS和EDW的差异
掌握EDA2.0规范中EDA的主要组成部分以及各自部分的内容
掌握元数据的概念以及分类
掌握多维数据模型上可以进行的OLAP的操作
掌握常用数据加载的办法
掌握多维数据分析(OLAP)和数据挖掘的区别点
掌握数据质量出现的常见原因
掌握日常数据稽核工作的内容
掌握EDA2.0规范中基础数据管理类的应用有哪些
掌握EDA2.0规范中数据平台的主要组成部分和各部分主要职责
掌握EDA2.0规范中基于数据仓库的主要数据集市有哪些
了解EDA的定义、目标、载体和规范
了解EDA在整个CTG-MBOSS中起到对企业数据整体的规范和管控作用。
了解ODS的定义、作用、以及数据来源。
了解中国电信EDA域是CTG-MBOSS的重要部分,主要系统为EDW、ODS。
了解OLTP和OLAP的概念提出者是E.F.Codd
了解数据仓库之父是Bill Inmon
了解关系数据库之父是E.F.Codd
了解到企业数据仓库不是用于实现跨系统的近实时报表和查询统计应用
了解数据集市是企业数据仓库的一部分,是为了满足某些专题领域的业务需求,针对某一特定领域的分析型数据而形成。
了解EDM的八大主题域
了解数据生命周期的五个阶段
了解企业的数据资源可分为运营型数据和分析型数据,以及产生于何处
了解需求分析是总体数据规划中的三个阶段中最重要的阶段
了解数据应用平台的分析应用需求具有不确定因素多、需求经常变化等特点。因此在实施和应用过程中需求的管理就显得尤为重要。要把握需求变化的尺度,避免两个极端:需求的一成不变和需求的反复修改。
了解概念模型设计最著名最常用的方法是P.P.S Chen于1976年提出的实体-联系方法Entity-Relationship Approach),简称E-R方法。它采用E-R模型将现实世界的信息模型统一由实体、属性以及实体之间的联系来描述。
了解逻辑模型设计阶段的主要任务是确定数据模型、将E-R图转换为指定的数据模型、确定完整性约束和确定用户视图。
了解联机采集凭借其相对于其他采集方式的优势,成为现阶段最主要的数据采集方式。
了解数据抽取接口包括数据库接口和文件接口等形式,对于不同数据平台、不同源数据形式、不同性能要求和业务量的业务系统以及不同数据量的源数据,采取不同的数据抽取接口。在数据抽取时需要重点考虑数据抽取的效率,以及对现有业务系统性能及安全的影响。
了解数据挖掘就是从海量的数据库中选择、探索、识别出有效的、新颖的、具有潜在效用的乃至最终可理解的模式以获取商业利益的非平凡的过程。
了解数据挖掘只是一个工具,不是万能的魔杖,其主要是通过构建模型发现特征模式和关系模型, 是事实的抽象表示,数据挖掘一般分为两类:描述和预测。描述性挖掘任务刻划数据库中数据的一般特性。预测性挖掘任务在当前数据上进行推断,以进行预测。
了解数据管理贯穿于企业的整体价值链,同时,数据管理也贯穿于企业数据的整个生命周期。
了解数据的应用主要是通过报表、动态查询、多维分析等手段实现。
了解雪花模型是星型模式的一个变种,其中的维表是规范化的。
了解中国电信营销分析系统提供了固定报表、预定义报表、图表、即席查询、多维动态分析等灵活多样的展现方式。
了解数据采集的任务是从数据源准确的抽取数据,是ODS/EDW获取数据最常用的手段之一。
了解接口方式可以分为文件接口、数据库直连、消息机制接口方式。
了解ETL是将数据由数据源系统向数据仓库加载的过程。
了解从功能上看,整个ETL包括数据抽取、数据转换、数据加载三个部分。
了解传统数据库中的数据字典是一种元数据。
了解数据整合层的功能可以在EDW中增加数据层实现,也可以在EDW之外由ODS实现。
了解数据抽取操作类型有哪些,流水型增长和变化更新各适合什么情况
了解经营分析模板的作用
了解针对性营销的定义
了解更新备份和增量备份的含义
了解衡量容灾系统的2各指标:RPO,RTO
了解“啤酒与尿布”案例是说的哪种数据挖掘类型
了解数据修正应遵循的基本原则
了解EDM的数据模型不能直接作为在建的某个系统模型
了解数据抽取需要考虑对源系统的性能影响
了解数据管理工作有四大关键功能领域:数据规划、企业数据架构、数据生命周期和数据管控;其中数据生命周期,包括数据产生、数据处理、数据存储、数据应用、数据归档和备份
了解运营型数据产生于OLTP(On Line Transaction Process 联机业务处理)系统当中,主要面向具体的业务过程
了解数据的产生。在操作环境,数据的产生直接来源于电信业务流程的运作之中,是对电信业务流程中所产生的量及其业务含义的捕获数据
文档评论(0)