- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业数据仓库
1、企业数据仓库
概述
企业数据平台是商业智能体系的基础,通过建立层次化的数据仓库体系结构、统一的数据模型,整
合企业生产系统的数据,从而为数据分析平台和 CRM等上层应用提供数据支撑。企业数据平台沉淀了企
业多年来的生产经营数据,数据按照存储粒度分为细节级、轻度综合级、汇总级,其数据量通常非常庞大, 少则几TB,多则上百TB,而且每天都有大量的生产数据被抽取、整合进入企业数据平台,并传送到数据 分析平台和其他系统,以满足其数据需要。如此庞大的数据量、吞吐量和复杂的业务逻辑,对企业数据平 台的存取效率、数据质量、易管理性,易维护性等均提岀了很高的要求。公司在多年的数据仓库建设过程 中研发岀一套适用于电信行业的统一数据模型(该模型中的核心部分已经被中国联通作为数据仓库模型的 标准规范)。基于统一数据模型、结合数据仓库技术、元数据技术,并对 ETL过程进行优化处理,公司
实现了电信行业海量数据仓库的标准化构建和高效运转。
企业数据仓库(EDW)是企业分析型数据的统一存储,它和运营数据存储一起构成企业的统一数据 平台。企业数据仓库在企业内部建立统一的数据架构和数据模型,沉淀来自运营数据存储、生产系统的数
据,采用多维分析和数据挖掘手段,细分市场和客户,为企业内各个部门、各个层面的使用者的信息查询获取、经营分析、决策支持等需求提供全方位的数据支撑服务。企业数据仓库从根本上解决了沉淀数据分 散重复、共享困难和信息孤岛问题,充分发挥数据资源价值,提高了企业在信息化建设方面的投资回报率。
系统架构
:8,:s:連戲盪库)罷寵尿讐啤站觎罢騎析报表 plFcations 严更°2 _史?加也四—OLAP ReEqrts_EIS- 客户 1 用户 账户L幅去票」輛域
:8,:s:連戲盪库)
罷寵尿讐啤站觎罢騎析报表 plFcations 严更°2 _史?加也四—OLAP ReEqrts_EIS
- 客户 1 用户 账户
L幅去票」
輛域
巻無舌勒
业务感
屈- iftA -
—汨育YI辱
| 一单一進
产品底
产吕资一评沽
|—
产品
鹤资谟巻島.卡类
业爵丄品牌
瞪坯^_L琢和
超 -
L貉
数娼对駅
过程
活算:或
割曲域
资範
胃 CRM
:亠虫
一二耳一吉兰
垢合网晉
元数据
管理
矢票分折
辭硼11
m摆
麴sn径 管理
系统功能
i.数据域划分
EDW的数据存储按域可以分为:客户域、产品域、市场营销域、服务域、业务域、竞争域。
客户域以三户模型为基础,客户域包含客户、客户对产品的订购等相关信息,如客户的基本属性、 衍生属性,客户的消费、欠费、缴费、行为、结算、服务、产品订购和业务订购等。数据加工主要是以
ODS中的营业域、计费域、帐务域、结算域数据进行整合,按照分层次、分类别、多维度进行数据汇总
产品域以产品模型为基础,包括产品的定价、产品基础信息、产品目录、产品生命周期、产品定位、 产品营销等信息。数据加工以 ODS 的营业域、计费域、帐务域、结算域等数据进行整合,按照分层次、 分类别、多维度进行数据汇总。
市场营销域包含营销活动、营销能力、营销过程、营销结果、渠道等信息。数据来源是 CRM 系统 的营销活动、营销计划、营销执行、渠道等内容,数据加工在 ODS 的营业域、帐务域、结算域等数据基 础之上按照分层次、分类别、多维度数据汇总加工。
服务域主要包含对主动服务和被动服务的信息的分析,包括服务能力、服务过程和服务结果等。数 据加工在 ODS 的客服域基础上进行主动服务和被动服务的数据汇总。
业务域从单一业务和组合业务的角度分析企业的经营信息,包含了各业务的发展、收入、使用等信 息。数据加工在 ODS 的客户域、营业域、计费域、帐务域、结算域等数据基础上,按照业务为主线进行 分层次多维度数据汇总。
竞争域包含竞争对手及其产品、营销、发展、话务等信息。数据加工在 ODS 的客户域、营业域、计
费域基础上,按照对端号码归属电信运营商进行多维度、分层次数据汇总加工。
2. 数据加工( ETL )
ETL 是英文 Extract-Transform-Load 的缩写,提供数据的抽取、转换和加载功能。从源系统中抽取目 标数据,按照一定的规则进行清洗、集成、转换、汇总等处理工作,并将处理之后的数据加载到数据仓库 的目标层中。为了利用目标数据仓库的并行处理能力,一般先抽取、加载,再做转换处理。
3. 数据模型支撑
企业数据仓库( EDW )是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起 来的关系型数据库,它的数据基于 OLTP 源系统。数据仓库中的数据是细节的、集成的、面向主题的,以
OLAP 系统的分析需求为目的。星型模型聚合快、分析效率高,雪花型模型结构明确,便于与其他数据交 互,所以 EDW 一般采用星
文档评论(0)