大数据资产管理系统设计与实现.docVIP

大数据资产管理系统设计与实现.doc

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据资产管理系统设计与实现

大数据资产管理系统设计与实现   摘要:伴随着大数据时代的到来,存储在云端的数百万的数据想要成为真正的具有价值的资产,就需要一个有效的管理系统对其进行管理,针对云端数据量大、结构复杂等方面的特点,设计并实现一个能够将数据从采集到处理再到清理最后直到产品化的整个生命周期进行管理的系统,并将这些杂乱无章的数据资产化。该系统使用kafka总结结构,将数据的资产化过程分为采集、清洗、产出等多个阶段,并配套的设计了多个丰富系统功能的子系统,能够大大的提高数据资产的使用率。本文介绍了系统的设计和实现过程,详细描述了对系统起到支撑作用的多个子系统,本系统易扩展,可兼容,研究具有一定的现实意义。   关键词:大数据;远程监控;资产化;运维系统   中图分类号:TP311.5   文献标识码:A   DOI:10.3969/j.issn.1003-6970.2016.02.013   引言   伴随着大数据时代的到来,存数在云端的数据数以万计。而这些成百上千的数据,在套上了大数据的背景之后,其价值被重新定位,可以说,在正确的管理下,数据就是无形的最有价值的资产。然而,数据本身并不具有资产属性,它需要一个有效的管理系统完成自动化的采集、处理、清晰、产品化等一系列流程才能具有价值。   就目前而言,无论是IT、金融或者其他部门,都无时不刻的产生着大量的数据,然而随着数据的增多,以及人员交接等问题,数据资源无法被使用,重复使用等问题大大增加了资源的管理成本,给管理部门造成了很多问题。针对这些问题,我们需要设计一个资产管理系统,众多的资源管理系统一样,本系统以计算机作为操作平台,采用B/S结构和分布是数据库对资源的整个生命周期(产生、采集、整理、盘点、报废进行全方位监管)。通过数据的资产目录建立,对数据质量的治理,使得数据能够被管理者应用,并设计实现了数据资产的后期运营,可以支持企业数据资产的分发、开放、交易等数据嫁接的实现,从而促进数据资产的价值实现。   1 系统架构设计   渐进的方式向资产运营目标过渡。系统大致分为数据目录管理模块,用来解决有哪些数据的问题,以及数据资产运营模块,用来方便后期运维,用户根据特定的资产稽核规则,这个数据资产管理系统的核心设计思路是从大数据资产治理人手,兼顾数据应用,以对系统中的资源进行监控,评测,保证数据在运行期的质量,方便生产部门将数据进一步加工成产品。系统大体的体系架构设计如图l:   (l)元数据库:用了存放系统中原始数据的数据库,各种类型的数据通过目录管理模块,形成统一的格式,存入元数据库中,此时的数据仅仅是数据,不具有资产属性,也不能变成产品,只有经过后续的加工才能成为产品,相当于一个原始数据的存储模块,只是规定了统一的接口。   (2)数据目录管理:系统的第一个子模块,建立并维护一个数据资产目录,目的就是将纷繁复杂的数据资源整合起来,在商定好统一的接口之后,发送给源数据库。   (3)数据资产质态库:元数据库中的数据进过接口汇集、产品加载等一系列流程(采集、校验、清洗、脱敏)处理,进入数据质态库,这里的数据可以称之为数据资产了,它具有统一的格式,形成相应的视图,并且需要对其属性进行长期监控   (4)数据质量稽核:由于该系统每天都要上报大量的数据,所以要对质态库中的数据质量进行分析,也就是数据资产的后期维护功能,他决定着系统能不能在第一时间发现并解决数据、设备故障的问题,是保证系统正常运行的关键。   系统的工作流程大致如下:数据资产目录模块负责整理云端的数据,并将其存入系统的元数据库,然而元数据库的数据作为原始数据,并不具有资产属性,经过处理和相应的盘点进入数据资产状态库,在通过对这些资产状态进行分析成为大数据资产,从而可以被相应的部门使用。   2 系统实现   如上一章中所提到的,系统由两个数据库和两个子系统实现,这两个子系统分别是目录子系统和稽核子系统,其中目录子系统负责解决系统由什么资源的问题,稽核子系统解决这些资源是否正常的问题,以下为详细介绍:   2.1 数据资产目录子系统   如前文所提到的该子系统维持了一个整理数据资产的方式,集中解决的是整理系统由哪些资源的问题:   所以在此模块的设计涉及到数据的存储模式:例如DPI类的数据、ODS类的数据如何定义成统一的格式,规定一个统一的接口,定义各个层级的功能和规范,还需要定义各资产的硬件存储环境,统一字段属性,并且最终形成资产目录视图。图2为资产目录子系统的总体设计思路:   (l)目录架构:此处定义了数据的分类以及数据所属的层次,下图3为目录架构表:   此表针对不同的数据类型,采用不同的目录结构。   (2)存储环境:此处定义各类数据在什么环境下存储。   (3)资产信息:此处规定目录中

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档