2021年MathorCup大数据竞优秀论文5.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

队伍编号MCB2102542

赛道(B)

信息流智能推荐算法中序列收益评估模型的构建与研究

摘要

目前互联网信息蓬勃发展,用户面临信息过载,而推荐算法不仅满足用户个性化内

容消费需求,而且提升了用户获取有用信息的效率。本文通过建立推荐序列总点击量和

总时长收益评估模型,为推荐序列提供预测服务,从而达到更好地进行信息序列的推送

和进行信息流整体收益评估。

针对问题一:基于训练集数据,建立评估推荐序列总点击和总时长收益数学模型,

并进行优化网格矩阵计算,得出不同排列组合的收益值并计算时间收益系数。同时统计

分析不同时段的点击量,计算不同时段对收益值的影响。

针对问题二:基于问题一模型,建立各用户的优先网格矩阵并获取相关数据,建立

隐语义预测模型,获得隐分类用户矩阵和隐分类物品矩阵,得到未浏览得点击量和浏览

时长,考虑时间、排序等因素,预测请求ID对应推荐序列的点击量和时长之和,并填

入附件result.csv中,预测精准度达到93%左右。

针对问题三:根据题目设计如下剪枝策略。统计分析每个请求ID的训练内容获得

序列的最优长度;基于问题一的模型,建立每个ID的优先网格矩阵,曲线拟合获得不

同内容排序带来的收益;通过每条内容的收益值设计每种分类内容的选择概率,再通过

轮盘赌的方式选择推荐序列。经过检验证明最优序列精准度达到90%左右。

综上所述,本文依据各题所给的条件较全面地分析并解决了信息流智能推荐算法中序列收益

评估建模问题。经过分析验证,本文建立的模型合理有效,简便易行,便于推广到日后其他序列收

益评估的建模中去,有一定的现实意义。

关键词:推荐算法推荐序列优化网格矩阵隐语义预测模型曲线拟合剪枝策略轮盘

目录

1.问题重述1

1.1.问题背景1

1.2.问题提出1

1.3.问题求解流程图1

2.问题分析2

2.1.问题一的分析2

2.2.问题二的分析2

2.3.问题三的分析3

3.符号说明3

4.基本假设3

5.数据处理4

6.问题一:推荐序列总点击和总时长收益评估模型4

6.1.问题一的建模流程4

6.2.模型的建立及求解5

7.问题二:预测推荐序列的总点击量和总时长8

7.1.考虑序列顺序的隐语义模型概述8

7.1.1基于用户的协同过滤算法9

7.2.1基于物品的协同过滤算法10

7.3.1隐语义模型11

7.2.考虑序列顺序的隐语义预测模型13

7.3.误差分析和结果写入13

8.问题三:剪枝策略下精确评估最优序列收益14

8.1.问题三的建模流程14

8.2.模型的建立及求解15

8.3.剪枝策略复杂度分析15

8.4.剪枝策略的精准度检验16

9.总结和展望17

参考文献18

附录19

1.问题重述

1.1.问题背景

21世纪是我们所生活的年代,是世界经济发展的时代,是科学力量加强的时代,也是一个信息

化的时代,因此生活在这样的一个时代中,用户在使用互联网应用时时常面临着信息过载的问题。

推荐算法的出现,满足了用户个性化的内容消费需求,提升了用户获取有用信息的效率,在互联网

APP里已被广泛应用。

1.2.问题提出

信息流作为推荐算法的主要应用场景,是用户触及互联网信息的主要入口,已经完全融入了人

们的日常生活中,成为了人们了解世界的主要方式。传统推荐算法的核心思想是挖掘被推荐内容与

用户兴趣的匹配关系,以及内容本身的优质程度,选择与用户最相关或者最优秀的内容推荐给用户。

但是,经过专家学者研究发现,除了内容本身因素以外,内容之间的排列组合关系,也会影响

用户的浏览体验,进而影响推荐收益的大小。例如,相似内容的高度集中,往往会带来较差的结果

反馈,即使它们都高度

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档