- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NNeeuurraallCCoollllaabboorraattiivveeFFiilltteerriinngg ((神神经经协协同同过过滤滤))
⽬⽬录录
1.背景 :论 提出的背景
2.矩阵分解 :解释了矩阵分解以及其缺点,引出NCF框架
3.NCF框架 :解释了NCF框架是什么,提出了3个NCF的应⽤,GMF、MLP和NeuMF
4.实验测试 :包含实验数据和评估⽅法NDCG的说明,同时根据3个问题解答NCF的作⽤
11、、 背背景景
论 讨论的主要是隐性反馈协同过滤解决⽅案,先来明确两个概念 :显性反馈和隐性反馈 :
显性反馈⾏为包括⽤户明确表⽰对物品喜好的⾏为
隐性反馈⾏为指的是那些不能明确反应⽤户喜好
举例来说 :
很多应⽤场景,并没有显性反馈的存在。因为⼤部分⽤户是沉默的⽤户,并不会明确给系统反馈 “我对这个物品的偏好值是多少”。因此,推荐系
统可以根据⼤量的隐性反馈来推断⽤户的偏好值。
根据已得到的隐性反馈数据,我们将⽤户-条 ⽬交互矩阵Y定义为 :
但是,Yui为 1仅代表⼆者有交互记录,并不代表⽤户u真的喜欢项 ⽬i,同理,u和i没有交互记录也不能代表u不喜欢i。这对隐性反馈的学习提出了
挑战,因为它提供了关于⽤户偏好的噪声信号。虽然观察到的条 ⽬⾄少反映了⽤户对项 ⽬的兴趣,但是未查看的条 ⽬可能只是丢失数据,并且这其
中存在 ⾃然稀疏的负反馈。
在隐性反馈上的推荐问题可以表达为估算矩阵 Y 中未观察到的条 ⽬的分数问题 (这个分数被⽤来评估项 ⽬的排名)。形式上它可以被抽象为学习
函数 :
--
为了处理缺失数据,有两种常见的做法 :要么将所有未观察到的条 ⽬视作负反馈,要么从没有观察到条 ⽬中抽样作为负反馈实例。
22、、矩矩阵阵分分解解及及其其缺缺陷陷
传统的求解⽅法是矩阵分解(MF,Matrix Factorization),为每个user和item找到⼀个隐向量,问题变为 :
这⾥的 K表⽰隐式空间 (latent space)的维度。正如我们所看到的,MF模型是⽤户和项 ⽬的潜在因素的双向互动,它假设潜在空间的每⼀维都
是相互独⽴的并且⽤相同的权重将它们线性结合。因此,MF可视为隐向量 (latent factor)的线性模型。
论 中给出了⼀个例⼦来说明这种算法的局限性 :
1(a)是user-item交互矩阵,1(b)是⽤户的隐式空间,论 中强调了两点来理解这张图⽚ :
1)MF将user和item分布到同样的隐式空间中,那么两个⽤户之间的相似性也可以⽤⼆者在隐式空间中的向量夹⾓来确定。
2)使⽤Jaccard系数来作为真实的⽤户相似性。
通过MF计算的相似性与Jaccard系数计算的相似性也可以⽤来评判MF的性能。我们先来看看Jaccard系数
上⾯的⽰例显⽰了MF因为使⽤⼀个简单的和固定的内积,来估计在低维潜在空间中⽤户-项 ⽬的复杂交互,从⽽所可能造成的限制。解决该问题的
⽅法之⼀是使⽤⼤量的潜在因⼦ K (就是隐式空间向量的维度)。然⽽这可能对模型的泛化能⼒产⽣不利的影响 (e.g. 数据的过拟合问题),特别
是在稀疏的集合上。论 通过使⽤DNNs从数据中学习交互函数,突破了这个限制。
33、、NNCCFF
论 先提出了⼀种通⽤框架 :
针对这个通⽤框架,论 提出了三种不同的实现,三种实现可以⽤⼀张图来说明:
image
GMF:
上图中仅使⽤GMF layer,就得到了第⼀种实现⽅式GMF,GMF被称为⼴义矩阵分解,输出层的计算公式为 :
MLP:
上图中仅使⽤右侧的MLP Layers,就得到了第⼆种学习⽅式,通过多层神经⽹络来学习user和item的隐向量。这样,输出层的计算公式为 :
NeuMF:
结合GMF和MLP,得到的就是第三种实现⽅式,上图是该⽅式的完整实现,输出层的计算公式为 :
44、、模模型型实实验验
论 的实验⽤于回答以下研究问题 :
RQ1 我们提出的NCF⽅法是否胜过 state-of-the-art 的隐性协同过滤⽅法?
RQ2 我们提出的优化框架 (消极样本抽样的log loss)怎样为推荐任务服务?
RQ3 更深的隐藏单元是不是有助于对⽤户项 ⽬交互数据的学习?
接下来,⾸先介绍实验设置,其次是回答上述三个问题。
44 .. 11 实实验验设设置置
您可能关注的文档
- 拆除工程施工方案(完整版).doc
- 江苏省法律法规师德师风建设知识竞赛部分-题目和答案.doc
- 汉密尔顿抑郁量表.doc
- 包装设计·筷子设计报告书.doc
- 2023年日历完整版.pdf
- 大学生演讲与口才培训.ppt
- 液压实训报告.doc
- 淮海工学院实习报告_2.doc
- 小学六年级篮球教学计划.doc
- 机械设计基础课后答案(杨可桢).doc
- 《GB/T 22838.3-2025卷烟和滤棒物理性能的测定 第3部分:圆周 非接触光学法》.pdf
- 中国国家标准 GB/T 7410.1-2025搪瓷制品和瓷釉 术语 第1部分:术语和定义.pdf
- 《GB/T 7410.1-2025搪瓷制品和瓷釉 术语 第1部分:术语和定义》.pdf
- GB/T 7410.1-2025搪瓷制品和瓷釉 术语 第1部分:术语和定义.pdf
- 《GB/T 32151.54-2025温室气体排放核算与报告要求 第54部分:工业硫酸企业》.pdf
- GB/T 32151.54-2025温室气体排放核算与报告要求 第54部分:工业硫酸企业.pdf
- 中国国家标准 GB/T 32151.54-2025温室气体排放核算与报告要求 第54部分:工业硫酸企业.pdf
- 中国国家标准 GB/T 29152-2025垃圾焚烧尾气处理设备.pdf
- 《T/CHTS 10170-2024半开级配超薄磨耗层技术指南》.pdf
- T/CHTS 10170-2024半开级配超薄磨耗层技术指南.pdf
原创力文档


文档评论(0)