- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ETL-抽取规则 省公司 经营分析系统数据 ETL数据抽取引擎 元数据管理、系统管理、系统监控 省公司 BOSS系统数据 集团公司 BOSS系统数据 ●抽取策略:支持增量抽取方式 ●抽取规则:用户可根据实际需要自定义 抽取规则 P1 P2 P3 FILE 定义好的抽取程序脚本,包括源数据项、目标数据项、映射规则、转换规则、加载规则等内容,可根据实际需要调整。 经营分析 数据仓库 ODS ETL-执行方式 ETL数据抽取引擎 ●执行方式:定义好执行脚本,由系统调度、 自动执行 ●采集周期:采集的周期可以是日、周、月 或其他设定日期 P1 P2 P3 P1 P2 P3 23:30 00:30 01:30 定义好的任务执行脚本,包括执行脚本的执行周期、时间等。 业务系统 数据库 经营分析 数据仓库 ODS OLAP分析 经营分析 数据仓库 OLAP分析 Cube数据 联机多维分析使用户在随机的环境中通过不同的角度快速分析数据仓库中的信息( Slice/Dice. Drill-down/Drill up ) 分析问题的多维视角 多维矩阵管理数据(Cube, MOLAP ) 支持Drill-through, 可直接由MDB钻取到RDBMS, 平衡业务需求灵活性与性能 即席查询模块 经营分析 数据库仓库 1.选择查询内容 查询结果 2.选择查询条件 3.设定显示方式 查询目的: 查看某类数据的历史状态 进行随机统计、自由报表 查询方式: GUI界面、支持用户鼠标拖拽 用户自主设定查询内容、条件、结果显示方式 系统自动生成SQL语句、执行查询统计、显示查询统计结果。 支持用户自 定义SQL语句 监控子系统 ETL数据抽取引擎 元数据管理、系统管理、系统监控 P1 P2 P3 FILE ●负责监控ETL阶段各任务执行情况:包含任务名称、开始时间、结束时间、当前状态等。 ●负责监控分析预处理阶段各任务执行情况,自动维护ETL与分析预处理阶段数据的依赖关系,将ETL的失败局限在一定范围内。 ●记录各阶段任务处理日志,支持回滚、断点重载功能。 分析报表 汇总数据 数据挖掘 集成数据 OLAP分析 Cube数据 经营分析 数据仓库 ODS 元数据管理 管理数据仓库系统的数据 贯穿经营分析系统的各个环节 驱动数据的装载、存储管理和分析展现 数据源的描述 ETL调度,控制 数据仓库字典管理 OLAP结构描述 系统的处理单元由元数据驱动 系统管理 ●系统维护 包括功能模块数据抽取接口(数据源类型与数据格式)的定义功能、安全管理功能、数据备份策略的选择与实现等。 ●权限管理 对于普通用户来讲,可以管理其享有的资源及访问的范围等;对于系统管理员来讲,可以管理其拥有的权限,如:对信息发布、审批、撤消、编辑的权限等。 ●参数管理 参数管理主要是对系统中所需要的的各种参数及阈值进行管理,如进程调度参数、决策参数、数据管理参数等。 理解业务关系、数据分布, 组织挖掘数据 建立挖掘模型,模型调优、 评价,确定最佳算法 应用模型于数据仓库 对挖掘结果进行量化的评价 将量化结果应用业务系统 数据仓库 Mining Data 挖掘模型 评价 应用 时间序列 预测 分类…… 数据挖掘(寻找潜在规律) 数据挖掘应用 客户分类/价值评估( Customer Lifetime Value) 分析客户的综合价值,综合收益和风险 对客户消费进行分群 客户信用模型 客户流失分析(Churn) 分析主动离网客户的特征及因素,离网客户在这些因素上的分布情况; 得出潜在离网客户群(高离网概率的客户群); 客户挽留价值模型 挽留的概念:两个高,高费用、高离网概率、低欠费概率; 目的:挖出高消费群中主动拆机客户,这些客户能够带来高收益并且有离网趋势,最值得挽留 大客户分析模型 潜在大客户模型 离网客户模型 产品分析(Cross/Up Sell) 哪些客户群体倾向于使用特定的产品 增强客户分群及特征分析,及产品驱动的促销计划 多年的移动业务的积累 深刻理解移动业务,为挖掘提供优质的数据保证 实际的业务应用 积累大量的挖掘知识库 数据挖掘业务经验 为移动业务提供科学、合理、准确的挖掘模型 和业务系统完整的结合 利用多种分析手段方式,能过提供全面的信息 数据挖掘的基础和应用 前端展现 系统的用户接口,最终用户采用浏览器界面 位于B/A/S三层结构的瘦(Thin)客户端 以图形或报表的方式显示或打印,EIS 支持Dashb
文档评论(0)