- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
保险仓库数据模型设计资料
如何建立分析集市模型 业务驱动 根据固定报表和KPI、持续率、承保理赔、执行力、再保五个数据集市的业务需求,结合BI.Insurance DWM的建模方法, 建立Taiping EDW 分析集市模型 分析集市模型概念 维度建模 一种非规范化的关系模型 由一组属性构成的表所组成 表跟表之间的关系通过关键字和外键来定义 以良好的可理解性和方便的产生报表来进行数据组织,很少考虑修改的性能 通过SQL或者相关的工具实现数据的查询和维护 分析集市模型概念 事实表(一) 每一个事实表通常包含了业务需求所关心的一系列的指标值 每一个事实表的行包括 具有可加性的数值型的指标值 文本事实通常具有不可预见的内容,很难进行分析 与维表相连接的外键 通常具有两个和两个以上的外键 外键之间表示维表之间多对多的关系 分析集市模型概念 事实表(二) 事实表的特征 非常的大 ??包含几万、几十万甚至几百几千条的记录 内容相对的窄 ?? 列数较少 经常发生变化 ?? 现实世界中新事件的发生→事实表中增加一条记录 典型情况下,仅仅是数据的追加 事实表的使用 各类指标值的聚集计算 分析集市模型概念 维表(一) 每一张维表对应现实世界中的一个对象或者概念 ??例如:客户、产品、保单、标的、案件 维表的特征 包含了众多描述性的属性列 如保单维表里的销售渠道、保费区间、风险等级等 通常情况下,跟事实表相比,行数相对较小 通常 10万条 内容相对固定 几乎就是一类查找表 分析集市模型概念 维表(二) 维表的应用 基于维属性的过滤(切片、切块等) 基于维属性的各种聚集操作 报表中各类标签的主要来源 事实表通过维表进行引用 分析集市模型概念 Facts 属性个数少(窄) 记录行数多(大) 数值型指标 随着时间的推移,数据增长 分析集市模型设计步骤 模型在整个系统架构中的定位 分析层模型主题域 分析层模型每个主题域为同类的业务处理,共享相同的维度 承保理赔分析 记录安邦保险所关注的主要承保理赔业务指标。 收付费分析 记录财务收付中应收保费、实收保费、应收率、应付赔款、实付赔款等收付类信息。 核赔效率分析 记录理赔环节中查勘、定损、核损、缮制过程的相关指标。 分析层模型结构 收付费分析的星型结构 分析层模型介绍 “承保理赔分析事实表”、“收付费分析事实表”、“核赔效率分析事实表”都是经轻度汇总生成的表,它们全部都是事务型事实表 中间事实表都是经过版本化的历史表,保存最细粒度的数据 中间事实表主要用于生成轻度汇总表的过渡,除此之外,通过冗余相关属性,中间事实表的设计也考虑了其它无法从直接从分析层计算的指标的计算 事务型事实和快照型事实 中间层历史数据的版本化 数据仓库中的历史数据决不会被删除或覆盖,因此需要加入数据版本特性来区分随时间变化的业务信息,使得在任一给定时间点上都能检索到正确的数据。 数据是否需要版本化,首先依赖于实体是否有时变特性,比如“报案信息”通常是在某个时间点上发生,它就没有时变特性,因此就不需要版本化。 在实体中加入时间戳属性可以实现数据版本化,这个时间戳可以基于业务涵义,如对保单的某次批改的生效日期;也可以仅仅是技术上的,比如员工某项登记信息被修改,则生成新的员工记录,并指定该记录的有效(Valid)期间,ETL处理需要实现数据相邻版本时间戳的链接。 需要为版本化的实体找出一个锚ID来唯一标识每个数据实例,比如保单实体的锚ID可以是保单号,表明该实体中最原子的粒度是保单。 承保中间表场景示例 收付费中间表场景示例 理赔中间事实表场景示例 中间层的构建算法 请安邦项目组自行用Visio画出算法流程图,分页贴在此处 分析层模型未涵盖的特殊分析应用 需求中有部分的指标在计算上比较独特,且与其它指标没有太多的共享价值,因此未纳入分析层模型的考查范畴,这些指标主要有: 核保效率分析——用mid_policy_fact与核保信息表关联,再经过聚合计算可得到相应的分析指标 理财险网点活动率——该指标为非累计指标,不考虑安置在分析层,可在构建CUBE时按原始算法计算,但日、月、季、年的汇总值要分别计算 车贷险指标——该类指标的数据源比较特殊,不考虑建立分析层,可在构建CUBE时按原始算法计算 从中间层到分析层——承保理赔 签单类 只计算保单,口径为:核保日期在当期 and start_date=‘1900-1-1’ 主要指标有:保险金额、保单保费、保单
文档评论(0)