《k-匿名算法概述》3100字.docxVIP

  • 1
  • 0
  • 约3.98千字
  • 约 9页
  • 2026-07-03 发布于湖北
  • 举报

k-匿名算法概述

1.1数据发布中的匿名方法

常见的数据发布的预处理匿名方法有:数据泛化、数据抑制、数据交换、去标识、插入噪音等,如图12,其中数据泛化和数据抑制技术应用的较为广泛。

图SEQ图\*ARABIC2常见的匿名方法

数据泛化:数据泛化是大量收集和概括与来自数据库的任务相关的数据,将敏感属性的值从较低层次的概念转化为较高层次的概念的分析过程。例如,把较低层次的概念(例如:学生的年龄)用较高层次的概念(例如:小学生、初中生、高中生和大学生)替换。如下表所示,表7即为表6泛化处理后得到的表。泛化的主要目的是降低数据的准确性,来提高处理后数据与原始数据的相似性,以满足数据匿名化的要求。泛化的优点是不引入错误数据,并且可以保留原始数据的一些重要统计特征。

表SEQ表\*ARABIC1登记信息表

姓名

性别

年龄

住址

王海

30

山西省太原市迎泽区南内环街

刘值和

28

山西省太原市小店区亲贤北街

梅慧

26

山西省太原市小店区体育路

赵忠权

21

山西省太原市尖草坪区大同路

刘鑫

45

山西省太原市迎泽区建设路

周私雪

41

山西省太原市小店区坞城路

表SEQ表\*ARABIC2泛化后的数据表

序号

性别

年龄

住址

病史

1

*

[28-32]

山西省太原市迎泽区南内环街

急性肠胃炎

2

*

[28-32]

文档评论(0)

1亿VIP精品文档

相关文档