结合强化学习模型时序决策特征的推荐系统投毒攻击方法及装置.pdfVIP

下载本文档

17
0
约1.78万字
约 12页
2024-04-20 发布于四川
举报

结合强化学习模型时序决策特征的推荐系统投毒攻击方法及装置.pdf

本发明公开了一种结合强化学习模型时序决策特征的推荐系统投毒攻击方法及装置。本发明首先基于正常的用户记录和推荐系统使用的强化学习算法训练出一个影子模型和一个排序模型；接着，以最新的影子模型作为未优化的投毒模型，从最大化攻击效果和避免被防御者检测两方面出发设计损失函数，在未优化的投毒模型上进行优化，得到已优化的投毒模型；之后，基于未优化和已优化的投毒模型对于相同输入的变化情况确定填充项目，再基于高斯分布采样对填充项目进行评分，对目标项目给予最高评分，再使用排序模型对目标项目和填充项目的时序进行排列；

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN117911045A

(43)申请公布日2024.04.19

(21)申请号202311796977.4G06Q50/06(2024.01)

(22)申请日2023.12.

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

结合强化学习模型时序决策特征的推荐系统投毒攻击方法及装置.pdfVIP

结合强化学习模型时序决策特征的推荐系统投毒攻击方法及装置.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档