- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
正交低秩嵌入稳定化
KevinZielnicki
Ko-JenHsiao
kzielnicki@
khsiao@
Netflix
LosGatos,California,USA
摘要新训练和重新部署周期紧密结合,在每次重新训练时
假设嵌入空间结构的有效性被否定的情况下引入复杂
嵌入空间在模型重新训练周期中的不稳定给使用推荐
的错误风险[4]。通常,使用来自基础模型的用户和项
本系统中用户或项目嵌入作为输入特征的下游应用程序
目嵌入的下游模型可以与其一同重新训练以避免兼容
译带来了重大挑战。本文介绍了一种新颖的正交低秩转性问题。然而,考虑一个场景,其中下游应用程序每
中换方法,旨在稳定用户/项目嵌入空间,并确保在重新天抽取1000万用户,生成用户特征,并使用基础模型
训练会话期间保持一致的嵌入维度。我们的方法利用
1产生用户嵌入。应用模型每日进行重新训练,利用过
v高效低秩奇异值分解和正交Procrustes变换的组合将
4去三个月产生的日特征和嵌入作为其训练数据,这大
7嵌入映射到标准化空间。该转换计算效率高、无损且
5轻量级,在减少操作负担的同时保留点积和推理质量。约相当于9亿个用户嵌入。如果基础模型每天从头开
7始重新训练,那么每天再生或回填所有这些9亿个嵌
0与现有的修改训练目标或嵌入结构的方法不同,我们
.入变得不可行、缓慢或昂贵,特别是当基础模型的复
8的方法保持了主要模型应用的完整性,并可以无缝集
0杂性或用户交互数据量很高时[8]。
5成其他稳定技术。
2为了解决这个问题,人们可能会考虑通过额外的
:
v正则化来强制执行重新训练运行之间的嵌入相似性[11]。
i
x1介绍然而,这种方法会降低训练效率,并且仍然无法确保
r
a不同重新训练会话之间嵌入维度的完全兼容性。另一
许多推荐模型依赖于内部嵌入来将用户和项目建模为
种方法是将基础模型的重新训练频率减少到例如每月
最终推理输出[5,9]的中间步骤。这些嵌入以固定维度
一次,以最小化频繁回填的需求。然而,这种做法随着
的向量表示形式封装了模型对用户和项目的理解[1]。
时间的推移可能会因为用户行为的变化而退化嵌入质
使嵌入表示对于推荐模型有用的相同特性,也可以让
量[
您可能关注的文档
- 我这里遗漏了什么?: 评估大型语言模型在屏蔽句子预测方面的性能.pdf
- 展示你的动作:通过将多视角扩散模型适应外部编辑来创建你的 3D 内容.pdf
- TAR-TVG:通过时间戳锚点约束的 推理增强视频时序定位中的视觉语言模型.pdf
- DiffVC-OSD:一步扩散感知神经视频压缩框架.pdf
- 使用时频回归和运动-顶叶网络整合改进 EEG 连续抓取力解码.pdf
- Ethics2vec: 自动代理与人类偏好的对齐.pdf
- GraphCoT-VLA:一种用于处理模糊指令的机器人操作的三维空间感知推理视觉语言动作模型.pdf
- LaRender:通过潜在渲染在图像生成中实现无训练遮挡控制.pdf
- 利用基于图的空域异常检测与纠正增强静态环境中的自我中心对象检测.pdf
- SOFA:用于模拟和优化房颤消融的深度学习框架.pdf
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)