- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据资产目录建设之数据分类全解
01
数据治理“洗澡论”
其实他们之前做过数据一轮数据资产盘点,做了一个分类,也挂到系
统上了,但是后来就没有后来了。治理做一半,等于啥也没干。
我之前在群里开了一个玩笑,数据治理这种事情,就跟洗澡一样,首
先得勤快点洗。一天不洗澡,身上就臭了。
另外,标准也很重要,南方和北方对“洗干净”的定义不一样。南方洗
澡的时候,只要泡泡冲干净,就算洗干净了。北方洗澡的时候,身上
不搓下来二斤泥都不叫洗干净了。
还有,洗澡得全面,有些人洗澡不洗头还说得过去,但是洗澡只洗左
胳膊,这算咋回事?
最后,洗完澡得维护,水得擦干啊,衣服得换干净的,不要到外面踩
泥巴,要讲卫生啊!
但是很多人认为数据治理就是弄个项目就完事的。这就像是中世纪的
欧洲,一生就洗三次澡,出生一次,结婚一次,入殓一次。其他时间
都靠香水度日
所以数据治理不是立一个项目就完事的,要么在家弄个浴室,要么定
期去外面大众浴室,条件好可以再叫个搓澡的师傅,上个奶盐。
02
数据分类原则
这不,跟长时间没洗澡一样,长“数据虱子”了,各种指标爆炸、数据
质量低下等问题让数据部门的彭友非常难受,所以他们又要开始做数
据治理了。
首先要做的就是数据资产盘点,建立数据资产目录。盘点的时候好
说,就是各种整理呗。
但是到建立数据资产目录的时候就傻眼了,他们先是按照自己的理解
整了一版目录结构。
但是在把数据资产装进去的时候就发现有些数据资源不属于现有的任
何一个分类,然后又来调整,但是一会儿又发现有些数据资源放这里
也行,放在那里也行,这就蒙圈了
这是因为没有把握住数据分类的原则。具体可以分为:
1、全量:能够容纳组织全量数据资产;
2、系统:数据分类必须系统化、体系化,层次清晰、逻辑鲜明,形
成具有隶属和并列关系的分类体系,展示数据之间的联系和区别;
3、规范:目录名称要能准确的表达该类目的实际内涵和外延,在整
个目录中保持规范;
4、唯一:目录体系内,各自界限分明,尽可能保证不重复、不交
叉、相互独立且唯一;
5、稳定可扩展:建立的数据分类要保持一定的稳定性,保持一段时
间内的可持续使用,并保留可扩展的余地。
03
数据分类方法
数据分类其实来源于信息分类法,一共有三种:线分类法、面分类
法、混合分类法。
线分类法:简单来说,就是将数据按选定的若干个属性或特征,逐次
分为若干层级,每个层级又分为若干类别。
同一分支的同层级类别之间构成并列关系,不同层级类别之间构成隶
属关系。同层级类别互不重复,互不交叉。
线分类法适用于针对一个类别只选取单一分类维度进行分类的场景。
最典型的线分类法就是生物分类系统,有一个学科专门研究这个,叫
“生物分类学”。
你仔细看看上面的图,就知道线分类法有很大的局限:一个分类只能
描述单一的逻辑复杂一点就没法弄了,比如集团中有好几个不同的业
态...
面分类法:就是把数据依据各种属性或特征,分成相互之间没有隶属
关系即彼此独立的面,每个面中都包含了一组类别。
还可以将某个面中的一种类别和另外的一个或多个面的一种类别组合
在一起,可以组成一个复合类别。
比如服装,有材料、颜色、款式等多个面,可以自由搭配组成任意内
容。下面这个例子则是螺丝的面分类法,可以分为材料、直径、钉
头、表面处理:
面分类法是并行化分类方式,同一层级可有多个分类维度。面分类法
适用于对一个类别同时选取多个分类维度进行分类的场景。
混合分类法:顾名思义,就是线分类+面分类结合咯。一般来说,还
是得以某一个方法为主,另外一个为辅。
这下就能集合两种方式的优点,规避它们各自的缺点了。比如用面分
类法解决多业态的问题,再用线分类法细化;或者用线分类法搞定前
面几层,再用面分类法进行细化。
04
数据分类的层次关系
会后,彭友还找我要PPT。讲真,不是老彭我小气,关键是我还真没
有专门为这个事情
您可能关注的文档
最近下载
- 2025至2030年中国高透明型香烟包装膜数据监测研究报告.docx
- 2025至2030年中国花岗岩行业市场调查研究及投资前景预测报告.docx
- 齐岳山隧道F断层注浆截水帷幕施工技术.docx VIP
- 《光伏电站运行与维护》试题及答案二.docx VIP
- 三机的配套情况.ppt VIP
- 暑假衔接知识点专题13习作(讲义+试题)三升四年级语文(含答案)部编版.pdf VIP
- _第11课互联网服务应用广 课件+2024—2025学年人教版(2024)初中信息科技七年级全一册.pptx VIP
- 齐岳山隧道F11断层注浆截水帷幕施工技术.doc VIP
- 西师大版三年级下册数学填空题完美版.pdf VIP
- 合同管理审计 - 审计.docx VIP
原创力文档


文档评论(0)