- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
银行测试数据管理和隐私保护解决方案 上海旋程信息科技有限公司 www.shinechange. com 产品介绍:数据抽取和脱敏 数据抽取和脱敏 银行测试数据管理需求和难点 传统工作方式遇到的难以解决的问题 跨系统跨平台的测试数据难以准备,管理难度高 数据变形和脱敏手段缺乏或过于单一,且脱敏过程无法监控,测试数据安全性难以保证 手工处理方式效率低下,数据质量难以保证 测试数据版本管理难度大,复杂度高 难以保证如期提交高质量测试数据 复用测试数据的计划难以实现,经常需要反复准备数据,造成人力物力资源浪费 需要长期保持一支人员较多的数据准备团队,成本居高不下 难以统一记录数据准备过程中各项工作的日志,审计难度高 准备测试数据的最佳实践 需建立集中数据管理平台 测试数据集中管理平台架构 集中管理数据抽取、脱敏、和加载的优势 基于预定义条件或者抽样数据抽取,为目标测试环境创建大小合适、规模适中、保留业务特性的测试数据子集 对数据子集中的敏感数据完成脱敏操作,以保护数据隐私,同时保持业务相关上下文语义,不影响数据的完整性 智能比较脱敏前后数据的差异变化,预防兼容问题 缩减测试数据准备时间,加快测试进程,提高效率 脱敏后的测试数据子集压缩存储,可反复使用,能随时加载到指定的数据库中,降低业务系统的压力 与生产系统隔离,支持用户权限管理和日志审计,保证敏感数据安全,遵从合规要求 本地支持服务协助用户配置子集抽取,有效降低用户繁琐的初始化和持续设置工作量 案例某国有银行研发中心数据脱敏方案 智慧数据脱敏与还原 无需依赖于预先定义的元数据或其它数据标识,智能识别发现敏感数据并自动处理 银行测试数据准备中常见的脱敏需求 智慧发现 语义保持 不依赖元数据或其它数据标识,智能扫描数据内容发现敏感信息,支持结构特征明显的数据、以及自然语言文本 正确识别客户信息和交易信息等:身份证、地址、电话号码、邮件地址、银行账号、信用卡号 能正确识别多个敏感数据组合在同一字段,如“身份证+姓名+信用卡号” 隐藏在注释或者文本列中的敏感信息 数据脱敏后仍能正确通过有效性验证,如身份证的校验码和生日区间 取值范围合理,如信用卡号变换后仍是本行卡号区间等 脱敏策略可以保持业务需求的特定信息,如按年龄段进行业务分析 保持数据长度、可读性、完整性、上下文数据关联性等 可根据安全策略设置进行全局变换或局部变换 附录:智慧数据安全产品简介 采用新技术解决困扰银行的海量数据管理难题 自动数据分类分级 基于内容识别的、机器智能的、可处理海量数据的、实时自动的数据分类分级 信息安全国际标准认为,不同数据的重要性各不相同,高价值的数据需要更严格的保护机制 数据分类分级是信息安全风险评估流程和数据安全治理中的一个重要组成 国资委《中央企业商业秘密保护暂行规定》中要求对商密数据分类,实施分级管理,并进行标识 银监会《十二五信息科技发展规划监管指导意见》明确要求推进信息资产分类分级管理 工信部《公共及商用服务信息系统个人信息保护指南》2013年2月1日实施 领先的内容识别技术 正则表达式组合 自然语言处理 简单关键字 使用自然语言处理、数据挖掘、和机器学习技术的聚类/分类器,对以中文撰写的例如公文、会议纪要、经营计划等非结构化文档的分类效果十分出色 可根据客户行业特点和自身业务要求,划分至更加细分类别,处理非结构化数据的实际效果远远超过关键字和正则表达式产品 机器学习自动生成规则库,准确率和可靠性比人工总结正则表达式高得多 产品简单易理解,上手快 更适合结构化数据匹配 需要经验丰富的顾问进行人工归纳关键字和正则表达式,大量试错,后续维护困难,改进空间小 复杂正则表达式的匹配性能非常糟糕 入门级产品 误报漏报率极高,实际无法使用 没有任何改进空间 支持特征数 5 或与关系 20 布尔运算 300 语义相似度 完全自主知识产权 覆盖全数据生命周期的解决方案 创建 存储 使用 共享 归档 销毁 数据生命周期 智慧数据安全平台架构 关键数据发现 可视化集中管理 (安全策略、分布、风险、和事件) (自然语言处理、内容聚类/分类、机器学习) 基于先进内容识别引擎 (ACCE) 阻断 加密 归档 销毁 脱敏 标识 合规 审计 可视化集中管理平台: 洞察关键数据分布 市场上首个产品! 可视化展现关键数据的分布、风险和安全事件 覆盖企业中所有关键数据出现位置 终端、数据库、网络存储、邮件、互联网流量、业务系统、数据仓库、数据集市、大数据系统等 可根据敏感数据管控需求任意组合,分期实施,逐步覆盖 树形分级部署管理服务器,集中管理,权限按角色分配,适合国内大型企业管理制度 完备的扩展接口,可集成定制化 智慧监控敏感数
文档评论(0)