计算中的隐私课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
10.2.7 政府和隐私(续) (5) 培训:保证有权访问数据的人能够知道要保护什么和怎么保护。 (6) 质量保证:综合考虑哪些数据该被收集、数据怎样被存储、它的生命周期以及决定哪些是有用数据的相关因素。 (7) 严格使用:审查数据的所有使用,以决定这些使用是否与这些数据被收集的目的和处理方式相符。 (8) 数据留位:尽可能地让数据同原始所有者在一起。 (9) 策略:确立明确的策略来保护数据隐私。 精品 10.2.8 身份窃取 身份窃取就是盗用别人的身份。 例如,使用一张新的信用卡,而卡冒用别人的名字就是身份窃取。很少有独特的技术可以遏制身份盗窃。也很少有公司和机构被建立,用以专门去解决身份鉴别的问题。 精品 10.3 认证和隐私 认证:我们有一个身份,还有一些认证的数据,我们咨询待认证的数据与给定的身份是否相匹配。鉴别:只有认证数据,并询问哪个身份与认证者一致。对于第一种,可以说样本与数据库里的模版匹配程度达到一定百分比,基于这个百分比来决定匹配或者不匹配。对于第二种问题,我们甚至不知道这个主体是否在数据库里。于是,即使我们找到一些可能在很多方面的匹配,也不知道在数据库里的模版之外是否还有更好的匹配。 精品 10.3.1 认证意味着什么 认证可以涉及3个不同的事物:我们认证个体、身份或者属性。个体是一个唯一的人。身份是一个字符串或者相似的描述符,但是并不需要与一个特定的人相关,也不需要每个人只能有一个名字。当我们证实一个人具有某属性时,就鉴别了其属性。属性是一种特性。例如,一些地方要求人需要年满21岁才能喝酒精饮料;一个俱乐部的门卫检查一个人是否已经满足年龄要求,然后在这个人的手上印上标记来表示他已经年满21岁。 当我们把这些不同的鉴别混淆起来后,隐私问题就浮现出来了。当一个数据值有两个或者更多的用途时,拥有它的人能把它用做其他目的。此外,将一个身份与一个人关联起来需慎重对待。 精品 10.3.1 认证意味着什么(续) 个人认证 现在还非常缺乏识别一个人的有效方法。 身份认证 一个人一天可能发现有10到20个不同的方式用于鉴别自己的身份。从隐私的立场上,也许有或者没有方法连接这些不同的身份。有时,我们不想将一个行为与我们的身份相关联。例如,一个匿名的消息或是告密者的电话可以匿名揭发非法或不正当的活动。但随着数据的积累,使得联系成为可能。理论上,这些数据与无数其他数据没有什么区别,但一些人只要研究一下那个消息的时间就能将这些行为关联起来。因此,为了保护隐私,我们将阻止关联这些记录的尝试。 精品 10.3.1认证意味着什么(续) 匿名的记录 隐私的一部分是联系,例如,某人叫Erin,某人患有糖尿病。这两个事实都不敏感。但如果将Erin和患有糖尿病联系起来就变得敏感了。医疗研究者希望通过研究人口来决定疾病发生率、普遍因素、趋势和模式。为了保护隐私,研究者经常处理匿名记录,这些数据的身份信息被删除了。删除足够的信息去阻止身份的暴露是很困难的,并且还会限制研究。实践表明,实现数据的有效匿名是非常困难的。例如,在身份确认上,研究表明使用5位邮政编码、性别和出生日期的组合就能鉴别出87%的美国人。 精品 10.3.2 结论 认证和鉴别产生这种混淆的原因,部分是由于人们没有真正地区别它们的内涵。认证依赖某些东西去证实一个属性。这些诸如鉴别号码、生日或者姓名通常又被用作数据库关键字,而这对隐私产生负面影响。我们已经讨论了不愿意被识别的情况。在一定场合,可以用匿名和假名。但是,利用计算机在一定程度上能够实现数据收集和关联,这使得匿名和假名的愿望破灭。 精品 10.4 数据挖掘 10.4.1 政府数据挖掘 许多的政府数据收集和分析都是私底下进行的。一些步骤没有公开,其他的是有意地加以掩饰。因此,人们往往对缺乏监督的政府有种恐惧心理。而数据挖掘的不完整性或不完美性更加增加了人们的忧虑。 精品 10.4.2 隐私保持的数据挖掘 一种原始且低效的方法是,从将要被挖掘的数据库中去除所有识别信息。然而有时,这些识别信息正是数据挖掘的目标所在。更重要的是,即使从数据库中把明显的识别信息删除,还是存在识别的可能。 关联的隐私 关联包括普通领域数据库的连接。致力于保持关联的隐私就是试图控制这个联系。数据扰乱的一种形式就是交换数据域去阻止数据连接。交换所有数据值将妨碍有用的分析,但有限的交换能取得隐私和准确性之间的平衡。在一个已经很弱的关联进行交换之后,它就有可能由于太微弱而不明显。开始时的强关联也许仍然明显,但是强度已经减弱。值-交换是一种在数据挖掘过程中,有助于获得某种程度的隐私和准确性的技术。 精品 10.4.2 隐私保持

文档评论(0)

liuxiaoyu98 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档