- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2015年·第1期 信息化论坛
栏目编辑:梁丽雯 E-mail:liven_01@163.com Practice
异构金融数据整合与智能决策支持
的探索及应用
■ 中国人民银行西宁中心支行 宋旭景
在信息化社会,人类的生活、行为态度、互动与交 支”)从海量金融数据中萃取知识和观点的能力,实现
往等生产活动均以数据的形式被记录下来并永久存 数据驱动服务和数据辅助决策,既是本文的落脚点,也
在。随着移动互联、物联网等新技术的不断发展,人类 是本文期望解决的实际问题。
活动产生的数据集合规模将前所未有地膨胀,咨询公
司IDC的研究报告称,预计到2020年,全球的数据总量 一、金融数据利用现状及问题
将在现有规模的基础上增加14倍,达到40 ZB,但是,目 (一)源数据库类型及管理
前得到有效利用的数据仅占总量的0.4%,绝大多数的 运行在省级央行网络中的信息化系统已接近100
数据还处在待挖掘利用状态。为改变数据挖掘利用的 个,信息化基本覆盖了所有的业务活动,数据已经成为
现状,提高人们从复杂数据中提取潜在价值的能力,美 各项业务活动的重要载体,生产活动的信息基本以电
国政府于2012年宣布启动“大数据研究与开发计划”, 子化存在,每项业务系统或个人工作文档都对应着现实
将数据的挖掘利用上升到美国国家战略的最高层,认 的经济金融活动。从数据规模的视角看,全省各业务活
为大数据是“未来的新石油”,是国家的数字主权,事 动产生的数据量已达到TB级,主要是结构化数据;从
关国家安全。在国内,大数据研究也得到学者的广泛关 支撑各业务活动的数据库类型看,有Sybase,Db2,Sql
注和重视,围绕大数据的研究工作已全面展开,以李国 Server,Oracle等,主要是结构化的关系型数据库;从存
杰院士为核心的团队已经将模态多样、高速产生的海量 放的物理地点看,近年来随着两级数据中心、同城灾备
数据的利用从理论、算法、架构、应用等方面进行了综 中心和异地灾备中心的建设,数据基本上按业务分别集
述性研究,认为数据科学作为一门新兴的交叉学科正 中存储在两级(总行、省级)数据中心;从外关联对象
在形成。 看,各业务活动的服务或管理对象之间存在着交叉关联
总的来说,数据的管理、挖掘及分析利用已经进入 现象,复杂关联的数据产自相互交叉融合的生产活动。
大数据时代,各行各业的数据规模越来越大,对数据 (二)金融数据的收集和存储
的依赖性急剧增加,处理难度也越来越大,但对其进行 数据的收集和存储是数据分析利用的重要环节,
分析挖掘可能得到的价值更大。大数据是未来科学研 各项业务活动的信息化和数据化,为数据的产生和收
究的重要方向,也是许多行业进步和发展的创新驱动, 集奠定了基础。两级数据中心的建设,实现了数据存储
对数据资源的管理及分析能力将成为许多行业的核心 的物理集中,但从综合利用的视角看,数据存放在各业
竞争力,以大数据为代表的信息技术与新能源技术等 务系统的不同数据库中,相对分散,不利于我们分析数
的交叉融合正在引发新一轮的产业变革。在这样的背 据之间的复杂关联,丢弃了数据潜在的价值。
景下,从集中部署在两级数据中心的金融数据管理利用 (三)源数据存贮在门类众多、表结构各异的数据
的实际需求出发,如何以数据仓库、挖掘分析技术为核 库中
心,提高人民银行西宁中心支行(以下简
原创力文档


文档评论(0)