- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
需求探索:从算法控制到用户赋权
EdoardoBianchi
FacultyofEngineering,FreeUniversityofBozen-Bolzano,Bozen-Bolzano,39100,Italy
Abstract
推荐系统经常受到过度专业化的影响,这严重限制了用户接触多样化内容的机会,并创建过滤泡沫,减少了偶然发现的可能
性。为了解决这一根本性限制,本文介绍了一个具有用户控制探索功能的自适应聚类框架,该框架有效地平衡了电影推荐中
的个性化和多样性。我们的方法利用句子转换器嵌入通过带有动态阈值的在线算法将项目分组到语义连贯的集群中,从而创
建内容空间的结构化表示。在此聚类基础上,我们提出了一种新颖的探索机制,使用户能够通过战略性地从参与较少的集群
中采样来控制推荐多样性,从而在保持相关性的同时扩展他们的内容视野。在MovieLens数据集上的实验表明了该系统的有
效性,显示探索显著降低了列表内的相似度从0.34到0.26,同时将意外程度增加到了0.73。此外,我们基于大型语言模型的
A/B测试方法,与300个模拟用户进行测试后发现,长期用户的72.7%更喜欢探索性推荐而非纯粹利用性的推荐,这为系统在
不牺牲用户体验的情况下促进有意义内容发现的能力提供了强有力的证据。
Keywords
推荐系统,自适应聚类,基于LLM的评估
本1.介绍
译推荐系统已成为数字内容平台的重要组成部分,帮助用户在庞大的电影、音乐、书籍和其他媒体目
中录中进行导航。然而,传统的推荐方法在平衡个性化与多样性方面面临持续的挑战,常常导致过度
专业化,限制了用户接触新内容的机会,并创造了“过滤泡沫”,这强化了现有的偏好,而不是扩展
1用户的视野。
v协同过滤方法虽然能够有效利用集体用户行为,但高度依赖历史交互数据,因此对于新用户无
4
8效且容易出现流行偏差。基于内容的方法往往过分强调相似度指标,导致推荐结果重复而缺乏有意
8义的多样性。这两种方法都难以解决探索与开发之间的权衡问题:如何在熟悉的相关内容和可能扩
1展用户兴趣的新发现之间取得平衡。
2.过度专业化问题在动态内容环境中尤为突出,这些环境中新项目不断添加且用户偏好持续演
7变。传统推荐系统通过精确度指标(如精度和召回率)优化即时用户满意度,这本质上倾向于匹配
0过去行为的推荐。虽然这种优化策略提高了短期参与度,但也可能导致推荐单调并降低长期用户满
5
2意度。
:本文通过一个结合语义聚类与用户控制探索的自适应推荐框架来解决这些基本限制。我们的方
v
i法利用句子转换器嵌入和在线聚类算法对内容进行组织,该算法能够适应内容分布的变化并保持语
x义连贯性。关键创新点在于一种允许用户动态控制其推荐中的多样性-相关性权衡的探索机制,从而
r
a实现个性化的发现体验。
为了评估系统的效果超越传统的准确性指标,我们采用了一种新颖的大型语言模型(LLM)为
基础的用户模拟方法,该方法能够实现推荐策略的大规模A/B测试。这一方法论解决了现有评价框
架的一个关键局限性,即主要衡量推荐与过去交互匹配的程度,却未能捕捉到内容发现和偏好扩展
的价值。
本工作提出了以下关键贡献:
•自适应在线聚类算法,使用语义嵌入并通过动态相似度阈值对项目进行分组;
•一种由用户控制的探索机制,通过采样未充分探索的聚类来增强多样性,同时保持个性化;
•一个可扩展的基于大语言模型的用户模拟框架,用于超越准确度指标的A/B测试推荐策略;
•实验验证显示,在保持用户满意度的同时提高了多样性和意外性,尤其是在长期用户中。
您可能关注的文档
- 高效的亚像素运动补偿在学习视频编解码器中的应用.pdf
- 从皮肤组织学图像中利用深度学习预测患者自报种族.pdf
- 基于 LLM 的内容分类方法用于通过 README 文件对 GitHub 仓库进行分类.pdf
- 关于 G.654.E 合规长距离光纤链路中 SCL 频段传输的可行性.pdf
- 2 层 k-平面图的路径宽度.pdf
- 乡村特色种植用地数据库规范编制说明.pdf
- 农产品碳足迹核算规范水蜜桃编制说明.docx
- 乡村特色种植用地数据库规范编制说明.docx
- 2025年及未来5年花岗岩翻新护理剂项目市场数据调查、监测研究报告.docx
- 2025年及未来5年粘合胶项目市场数据调查、监测研究报告.docx
- 一元一次不等式在方案设计中应用与优化分析.pdf
- GB 29922特殊医学用途配方食品新旧标准对比.docx
- 《PDH装置催化剂再生系统离心通风机》编制说明.docx
- GB 29922特殊医学用途配方食品新旧标准对比.pdf
- 农产品碳足迹核算规范水蜜桃编制说明.pdf
- 2025年及未来5年杂物盒项目市场数据调查、监测研究报告.docx
- 2025年及未来5年大包回转台托臂液压缸项目市场数据调查、监测研究报告.docx
- 2025年及未来5年单面六层书架项目市场数据调查、监测研究报告.docx
- 2025年及未来5年闪亮擦铜水项目市场数据调查、监测研究报告.docx
- 2025年及未来5年雷贝拉唑项目市场数据调查、监测研究报告.docx
文档评论(0)