数据挖掘和隐私.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘和隐私

对个人隐私的威胁的产生主要来自于当数据一旦被破译,掌握数据这方或者其他可以接近数 据集的人或团体,能够辨别特定的个体,便存在利益被侵犯的可能性。 据传,从2010 年起,MySpace 通过网络数据交易公司InfoChimps 将用户的网站信息公开出 售给第三方,包括学术研究者、市场调研机构甚至营销人员。他们出售的信息包括用户账户 的任何活动内容和信息,涵盖博客日志、用户所在地信息、照片、评论和状态更新等。MySpace 在互联网领域的日薄西山有多方面的原因,但是他们对用户隐私的不重视也可能是其中的一 个原因。 而有的时候,信息泄露并不是互联网公司有意为之的。比如2011 年Facebook 的网站就曾经 出现过一个安全漏洞,使得用户可以通过一个链接看到其他任何在线用户的相册。 在西方国家,隐私问题是为大家所极为看重的。请看KDNuggets 在2012 年7 月做的调查。 结果表明,50.2%的网民不愿意以任何价格出售他们的Facebook 信息,而愿意出让的人中, 37%要以一年500 美元或者市场价格出让。 表11-1 关于Facebook 上个人隐私调查表 Would you be willing to sell your Facebook data to advertisers ? No, at any price (114) 50.2% Yes, for $10 or less/year (3) 1.3% Yes, for $50/year (5) 2.2% Yes, for $100/year (17) 7.6% Yes, for $200/year (5) 2.2% Yes, for $500/year (33) 15% Yes, for Market rate (49) 22% 《时代》杂志的主编Joel Stein 在 2011 年 3 月的一篇文章是这样说到数据挖掘和个人隐私 的:“Google 认为我是一个喜欢政治,明星绯闻,动漫电影并讨厌看书的人;Yahoo 认为我 是一个喜欢冰球,菜谱,服装和化妆品的中年男人。” ExeLate,RapLeaf 和Intellidyn,三家 买卖数据的公司也各自通过JOEL 的互联网信息对Joel 做出各自的描述。而这些关于Joel 的 描述,且不论正确与否,一个商家只需要2.5 美分就可以从这些数据公司中获得。Joel 认为 这些数据的存在超出了他的底线,应当彻底在互联网上禁止通过数据挖掘来获取个人信息。 《信息管理》杂志的主编Jim Ericson 在他的博客上对于Google 通过Cookie 收集用户行为的 方式表示很无奈:“我们一方面感谢互联网把我们连在一起,但是我们也成为了这条食物链 中的一个环节”。 社交服务网站 (SNS )的发展验证了六度分隔理论 (Six Degrees of Separation )的假设,也就 是说人际关系脉络方面您可以通过不超出六位中间人与世界上任意一个人认识。把朋友的朋 友是朋友的原则应用到互联网世界上,线上社交网络从而得到蓬勃发展。当然,这样的情况 带来的后果是个人隐私的唾手可得和不可控。 个人隐私被互联网泄露的后果在2012 年3 月美国一家法院的判案中得以极端体现。一位名 为Clementi 的美国大学一年级新生被室友 Ravi 通过网络搜索确认为同性恋,Clementi 因忍 受不了性倾向歧视,以及他的视频被Ravi 在网上泄露,最终选择了跳桥自杀,Ravi 也因此被 判入狱30 天。Clementi 登录同性恋论坛的频率和网站留言等在网络上记录的痕迹被Ravi 搜 到,成为酿成悲剧的导火索,而Ravi 做这些搜索的目的只是为了了解一下他的新室友。 这是个体有目的地通过互联网挖掘他人隐私数据(俗称“人肉”)带来的严重后果,而此类 个人的事件也屡见不鲜。那么互联网公司的数据挖掘行为呢? 在章节 10.3.2 中我们提到的“Target 对于怀孕妇女的营销”案在互联网上也传得沸沸扬扬。 一方面大家都惊叹于 Target 能够如此精确地对用户信息进行数据挖掘,另一方面也对用户 的隐私表示担忧。这些怀孕的妇女可能并不想大家知道她们怀孕的事情,而其实这

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档