- 1
- 0
- 约3.98千字
- 约 9页
- 2026-07-03 发布于湖北
- 举报
k-匿名算法概述
1.1数据发布中的匿名方法
常见的数据发布的预处理匿名方法有:数据泛化、数据抑制、数据交换、去标识、插入噪音等,如图12,其中数据泛化和数据抑制技术应用的较为广泛。
图SEQ图\*ARABIC2常见的匿名方法
数据泛化:数据泛化是大量收集和概括与来自数据库的任务相关的数据,将敏感属性的值从较低层次的概念转化为较高层次的概念的分析过程。例如,把较低层次的概念(例如:学生的年龄)用较高层次的概念(例如:小学生、初中生、高中生和大学生)替换。如下表所示,表7即为表6泛化处理后得到的表。泛化的主要目的是降低数据的准确性,来提高处理后数据与原始数据的相似性,以满足数据匿名化的要求。泛化的优点是不引入错误数据,并且可以保留原始数据的一些重要统计特征。
表SEQ表\*ARABIC1登记信息表
姓名
性别
年龄
住址
王海
男
30
山西省太原市迎泽区南内环街
刘值和
女
28
山西省太原市小店区亲贤北街
梅慧
女
26
山西省太原市小店区体育路
赵忠权
男
21
山西省太原市尖草坪区大同路
刘鑫
男
45
山西省太原市迎泽区建设路
周私雪
女
41
山西省太原市小店区坞城路
表SEQ表\*ARABIC2泛化后的数据表
序号
性别
年龄
住址
病史
1
*
[28-32]
山西省太原市迎泽区南内环街
急性肠胃炎
2
*
[28-32]
您可能关注的文档
- 《A区固定资产投资统计工作现状分析案例》8800字.docx
- 《G黄金首饰企业营销策略现状及问题的调研分析案例》8600字.docx
- 《HS银行不良资产现状分析案例》7100字.docx
- 《Hyperledger Fabric的框架概述》1700字.docx
- 《H电子员工绩效考核制度现状、问题及对策》8700字.docx
- 《H寨小学学生数学学习兴趣调查及培养策略(附问卷)》21000字.doc
- 《IPO审计与审计失败的相关概念与理论基础综述》3200字.docx
- 《L10FePt单层膜反常霍尔效应研究》1900字.docx
- 《LNG储罐内模型的建立分析》1900字.docx
- 《MATLAB潮流计算及短路电流计算过程案例分析》2100字.docx
- 《MIMO阵列设计案例分析》3900字.docx
- 《M医药企业销售人员绩效管理现状及问题分析案例》17000字.docx
- 《NFC桑葚汁的生产工艺设计计算案例》3000字.docx
- 《NFC桑葚汁的生产设备选型分析案例》3500字.docx
- 《PLC控制的喷涂系统的硬件和软件设计案例》5100字.docx
- 《PLC控制的喷涂系统的总体设计方案案例》1800字.docx
- 《STL文件的格式概述》1400字.docx
原创力文档

文档评论(0)