- 2
- 0
- 约2.24万字
- 约 34页
- 2026-05-30 发布于江西
- 举报
2025年大数据分析与行业应用手册
第1章数据治理与基础架构
1.1全域数据资产盘点与分类分级
建立“数据资产地图”作为盘点的第一步,需通过全链路采集工具(如ELK日志聚合、数据库快照、API接口监听)对生产环境、测试环境及离线历史库进行无感扫描,包含字段名、类型、来源、口径、更新频率及业务归属的元数据清单,确保资产底数清、情况明。接着,依据《数据安全法》及行业规范,将盘点结果划分为“核心敏感”、“重要一般”和“一般公开”三个层级,核心敏感数据(如身份证号、银行卡号、客户隐私画像)必须标注密级标签并触发最高级别访问控制,确保数据在采集、存储、计算的全生命周期中不越权流转。
在资产分类阶段,需明确定义“数据要素”的边界,区分“原始数据”(RawData)与“加工数据”(ProcessedData),原始数据仅用于建模训练,加工数据已脱敏且包含业务逻辑,严禁在未授权场景下直接复用原始数据,防止数据泄露风险。针对分类结果,实施差异化的存储策略:核心敏感数据自动迁移至独立的安全数据湖(DataLakehouse)或加密云盘,采用AES-256加密存储及动态密钥管理,普通数据可存储在标准对象存储中,但需设置默认拒绝策略,仅在业务系统显式调用时方可访问。建立“数据血缘”追踪机制,为每一份数据资产绘制从源头到消费端的完整图谱,记录字段转换逻辑、口径变更历史及
原创力文档

文档评论(0)