- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据脱敏方案
2017-1-15
第 1 页
更改履历
更改的
版本号 修改编号 更改时间 更改简要描述 更改人 批准人
图表和章节号
第 2 页
目录
第 3 页
1. 概述
1.1. 编写目的
本文档描述了数据脱敏的研究成果和方法论。旨在为具有数据脱敏需求的开发人员
和项目提供参考和借鉴。
1.2. 数据脱敏的定义
敏感数据一般指不当使用或未经授权被人接触或修改会不利于国家利益或不利于
个人依法享有的个人隐私权的所有信息。工业和信息化部编制的《信息安全技术 公共
及商用服务信息系统个人信息保护指南》明确要求,处理个人信息应当具有特定、明确
和合理的目的,应当在个人信息主体知情的情况下获得个人信息主体的同意,应当在达
成个人信息使用目的之后删除个人信息。这项标准最显著的特点是将个人信息分为个人
一般信息和个人,并提出了默许同意和明示同意的概念。对于个人一般信息的处理可以
建立在默许同意的基础上,只要个人信息主体没有明确表示反对,便可收集和利用。但对
于个人敏感信息,则需要建立在明示同意的基础上,在收集和利用之前,必须首先获得个
人信息主体明确的授权。这项标准还正式提出了处理个人信息时应当遵循的八项基本原
则,即目的明确、最少够用、公开告知、个人同意、质量保证、安全保障、诚信履行和
责任明确,划分了收集、加工、转移、删除四个环节,并针对每一个环节提出了落实八
项基本原则的具体要求。
数据脱敏 (Data Masking),又称数据漂白、数据去隐私化或数据变形。百度百科对数
据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据
的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用
脱敏后的真实数据集。
敏感数据,又称隐私数据,常见的敏感数据有: 姓名、身份证号码、地址、电话号
码、银行账号、邮箱地址、所属城市、邮编、密码类 ( 如账户查询密码、取款密码、登
录密码等 )、组织机构名称、营业执照号码、银行帐号、交易日期、交易金额等。
随着大数据时代的到来,大数据商业价值的挖掘,用户的精准定位,大数据中蕴藏的
巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战 –个人隐私信息 的保护。
第 4 页
个人信息与个人行为 (比如位置信息、消费行为、网络访问行为)等,这些都是人的隐私,
也是我们所关注的一类敏感信息,在大数据价值挖掘的基础上如 何保护人的隐私信息,
也将是数据脱敏必须解决的难题。
1.3. 数据脱敏需求
随着国家电网数据应用的不断深入,有许多应用需要和外部系统对接,数据需要对
外提供服务才能体现出它的价值,大数据时代是数据融合的时代,如何在数据融合的过
程中,保证数据在开发、测试、生产、应用等各个环节的安全,成为信息安全部门的重
要任务。
国家电网数据脱敏需求包括:通过数据抽取、数据漂白、数据混淆等处理过程,用
来满足测试、开发、培训、数据共享和数据融合场景下的敏感数据保护需求,并使得数
据处理过程满足国家电网的敏感数据防护的政策规定。
具体脱敏需求包括:
防止生产库中的敏感数据泄漏
通过对生产库中的身份、地址、用户卡号、手机号等敏感信息进行混淆、打乱后再
提供给第三方使用,防止生产库中的敏感数据泄漏。
保证测试、开发、应用阶段的数据关联性
通过脱敏策略和算法,保证脱敏数据有效性(保持原有数据类型和业务格式不变)、
完整性(保证长度不变、数据含义不丢失)、关系性(保持表间、表内数据关联关系)。
以提升测试、开发、应用环节的数据真实性和可用性。
保证数据维护和数据共享的安全
对数据库访问者的用户名、I
原创力文档


文档评论(0)