- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
推荐系统安全问题研究综述
何发镁1, 冯勇1,许榕生2,王旭仁3
(1.中科院成都计算所, 成都610041;
2.中科院高能所计算中心, 北京, 100039;
3.首都师范大学信息工程学院,北京,100037)
摘要t在最近几年来,为有效地解决人们面临的信息过量问题,推荐系统出现了。作为一个
有效的方法,它通过从以前用户的交互动作提取信息以形成个性化的产品建议。然而,推荐
系统也存在严重的安全问题I恶意用户能够影响或破坏提供给其他用户的推荐建议。由于协
同推荐系统必须开放给用户,要设计一个不被攻击的系统是很困难的.很多研究安全协同推
荐系统的研究者已经开始研究如何识别和抵抗攻击。
关键字t协同过滤,推荐系统,攻击模式,攻击检测
1. 前盲
互联网的出现使人们能够很方便地得到各式各样的信息,但也带给人们巨大的困扰,当人们
希望找到自己感兴趣的项目时,他们发现自己面临的选择太多了,以至于没有足够的时间评估所
有可能的选择。这就是现在经常提到的信息过载的问题。为了有效地解决信息过载的问题,研究
者提出了推荐系统的概念,它通过。基于协同过滤的工具在过载信息系统中过滤信息起着越来越
重要的作用。他们不仅帮助用户发现相关项目,而且有益于增加公司销售产品。目前使用的推荐
系统有很多。在基于协同过滤的推荐系统,用户通过分级特定的项目构建描述文件,基于它们的
分级和其他用户的分级,为其他得到个性化建议。
协同过滤是用于推荐系统的常用方法。它根据相似的兴趣和偏好推荐给用户项目。一般地,
协同过滤方法可以分为基于内存算法和基于模型算法两类。基于内存算法又分为基于用户或基于
项目,它首先确定最相似的k个用户或项目,然后结合它们的分级一起计算预期。与基于内存的
算法相比,基于模型的算法从分级描述文件,学习一个预言性模型,同时使用该模型产生预期。
不幸的是,由于好的分级能够带来好的销售业绩,这些系统易于被生产者或恶意用户操纵。
最近的研究显示,在当前CF应用中使用的流行算法相当容易被通过影响描述文件来操纵。特别
地,它可以通过伪造用户描述文件来达到目的:分级一系列的目标项,然后分级其他项,在这种
方式下,它们和正常用户的很多描述文件相似。在欺骗攻击中,攻击者通过引入结果偏倚的分级
描述文件影响一个推荐系统。由于推荐系统被广泛地用于电子商务,对项目的生产者来说,有天
生的动机去使用这些欺骗攻击,以便他们的项目能够更频繁地被推荐给用户。因而,在设计和实
施推荐系统的时候,推荐系统的经营者必须考虑到这些攻击。
针对推荐系统的攻击影响预期的质量,导致用户对推荐系统的满意度下降。这样的威胁花费
用户的时间和金钱,对推荐系统管理员提出了严重的挑战,他不得不着手发现欺骗攻击。推荐系
统的这个弱点是相当严重的,因为所有的个性化信息系统都将面临着这样的威胁。
文章的剩余部分组织如下:第二部分,我们介绍了用在协同推荐系统中的流行协同过滤(CF)
算法;第三部分,我们详细地描述了攻击协同推荐系统的各种攻击模型;第四部分,我们概述了
检测和响应攻击的方法:最后讨论了目前的研究进展和进一步工作。
2.协同推荐系统中的常用算法
在文献中提出提出很多不同的推荐算法,推荐系统设计最成功和知名的方法是基于协同过
滤。在协同过滤中,每个用户协同其他用户通过提供他对一组产品的观点建立产品的质量评价。
先前的研究表明,基于项目的协同过滤算法比基于用户的协同过滤算法更健壮,但是,基于项目
的算法在面对一些攻击时,仍然容易受到攻击。下面我们详细介绍用在协同推荐系统的标准CF
算法。
基于用户的协同过滤算法
标准的基于用户的协同过滤算法基于用户之间的类似。kNN算法通过选择与目标用户最类似的k
个用户来起作用,通过结合这些用户的偏好,用公式表示一个预期。kNN算法被广泛地应用,
其产生的结果相当精确。目标用户H和一个邻居,的相似性能够通过泊松相关性系数利用下面定义
的公司计算得到:
∑(,=I厂i)宰(,:r.广i)
sl,仡.y2
在这里,,是能够被分级的所有项目的集合,‘.I和,:,.,是目标用户u和邻居V对一些项目啪分级,
J=l和‘是用户u、V对所用项目分级的平均·
一旦计算出相似性,将可以选出最相似的用户.一旦确定了最相似
文档评论(0)