关于央行征信数据仓库系统建设的探讨.docxVIP

关于央行征信数据仓库系统建设的探讨.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于央行征信数据仓库系统建设的探讨

2015 年第 6 期总第 197 期征信CREDIT REFERENCENo. 6 2015Serial NO. 197■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■关于央行征信数据仓库系统建设的探讨相振宇1 ,赵相东2,3(1. 中国人民银行本溪市中心支行,辽宁 本溪 117000;2. 中国人民银行征信中心博士后科研工作站,北京 100031;3. 中国人民银行金融研究所博士后流动工作站,北京 100033)摘 要:开展数据仓库系统建设研究是实现信用数据互联互通的有效手段。 目前业内主流的数据仓库物理实现方 式包括:事务型数据库、并行数据库、数据仓库一体机和大数据仓库。 以中国人民银行征信中心的实际业务需求为 基础,参照央行征信数据仓库选型标准,对征信数据仓库系统的实现架构和架构中的各部分功能进行了初步设计。 关键词:征信中心;数据仓库;数据模型;信用信息;信息管理中图分类号:F832. 31文献标识码: B文章编号: 1674 - 747X(2015)06 - 0034 - 03根据国务院针对央行职能“ 三定” 方案规定,央 行负责建设、 运 行 和 维 护 征 信 系 统。 李 克 强 总 理 2014 年 1 月 15 日在国务院常务会议中指出要加强 社会信用基础建设,制定统一的信用信息采集和分 类管理标准,构建信息共享机制[1] 。 开展数据仓库 研究和建设是实现上述目标的有效手段,其目的是 通过对社会各部分信用信息的采集、保存、整合、加 工及再利用,实现信用信息的全生命周期管理,充分 挖掘数据间的规律,为社会大众提供信用增值产品 服务,推动我国社会信用体系建设。一、数据仓库概述( 一) 数据仓库概念数据仓库( Data Warehouse) 之父 Bill Inmon 将 数据仓库定义为:“ 数据仓库是一个面向主题的、集 成的、时变的、非易失的数据集合。” 经过 10 多年的 发展,Inmon 在技术发展及建设经验积累的基础上 提出了数据仓库 2. 0 的概念[2] ,其架构如图 1。DW2. 0 体现了对数据的精细化管理:非结构化 数据的引入完善了数据仓库的大数据处理能力;将 数据按时间划分为三部分,可以有针对性地实施不同的更新策略,支持数据仓库的流数据能力;数据仓 库不再采用单一的存储技术构建,内部各部分可以 采用适合的软硬件技术。 著名咨询公司 Gartner 也 已经更新了对数据仓库的定义:“ 数据仓库是一种解 决方案架构,可能由大量不同的技术组合而成。 但 其中最重要的是,任何供应商的产品或者产品组合 必须具备通过开放存取工具访问受管文件或者表格 的能力。”图 1 DW2. 0 架构图( 二) 数据仓库的数据模型数据模型是通过抽象的实体及实体之间的联系 来表示现实世界中事务的相互关系的一种映射。 数 据仓库模型是针对数据仓库应用系统的一种特定的收稿日期:2015 - 04 - 08基金项目:中国博士后科学基金资助项目( 2014M550925)作者简介:相振宇(1988—),男,满族,辽宁本溪人,助理经济师,经济学学士,主要研究方向为宏观经济、金融与征信管理;赵相东(1979—),男,满族,辽宁本溪人,中国人民银行征信中心博士后,主要从事征信系统建设、数据仓库、数据挖掘研究。数据模型。 在研究方面, Teradata 和 IBM 推出了面向金融行业的数据仓库模型,如 Teradata 的 FS-LDM 和 IBM 的 BDWM 模型。 FS-LDM 是统一的、共享的 基础数据集合,为各级机构的业务需求提供一致的、 规范的数据[3] 。 FS-LDM 按照银行业务主题域和第 三范式建模规则来组织数据,如客户、产品、合约、事 件等,可以涵盖银行的主要业务范围和相关数据。 金融逻 辑 数 据 模 型 是 构 建 征 信 数 据 模 型 的 重 要 参考。( 三) 数据仓库的物理实现目前主流的实现方式包括事务型数据库、并行 数据库( MPP)、数据仓库一体机和大数据仓库。1. 事务型数据库数据仓库兴起的早期,尚未出现专用数据仓库 系统,业界采用传统的事务性关系型数据库构建数 据仓库,如以 Oracle 或 DB2 数据库为存储核心的解 决方案。 通 常 采 用 数 据 库 集 群 架 构, 也 就 是 SMP ( Symmetric Multi Processing),如 Oracle RAC。 其特 点是通过负载均衡技术平衡各数据库实例的资源, 共享整个系统的内存和存储。 当集群内服务器的数 量达到一定规模后,增加服务器的数量对系统性能 的提升已不明显。 在业内, Yahoo 数据仓库的结构 化数据存储及淘宝结构化

文档评论(0)

zhuwenmeijiale + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档