- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电影推荐算法
MOVIE RECOMMENDER ALGORITHM
唐 傲 S
刘正晨 S
需求分析
公司:向观众
推荐电影,提
高点击率
用户:快速寻
找自己喜欢的
电影层出 电影
不穷
信息爆炸
挖掘任务
预测任务
根据用户对于电影的评分数据,来帮助用户发现可能喜欢的电影
预测建模
学习
使用预测算法对训练数据进行学习,学习用户之间,电影之间,用户
与电影之间的可能关系。
预测
根据学习出的可能关系,估计用户对未知电影的可能评价
输出
将具有较高预测分的电影推荐给用户
数据准备
数据来源:百度电影推荐大赛官方提供数据
数据定义:
用户ID 电影ID 评分
训练集:1262741组数据,包含9722个用户,7889部电影
测试集:314679组数据
UserID MovieID Rating
2541654 125462 4.0
2541654 135645 4.0
3564515 125462 5.0
3564515 215468 3.0
1989996 377762 2.0
挖掘算法(1)--SLOPEONE
例:预测User-3对Movie-2的打分
Movie-1 Movie-2
User-1 5 3
User-2 4 3
User-3 4 ?
找到对Movie-1和Movie-2都打过分的用户, 算出rating差的平均值
推测出对Movie-1打过分的User-3对Movie-2的可能rating
result = 4 – ((5 - 3) + (4- 3)) / 2 = 2.5
特点:简单,易于实现,执行效率高,准确性相对很高
挖掘算法(2)—KNN(ITEM BASED)
(r r )(r r )
v,m m v,n n
vP
mn
s
mn
(r
原创力文档


文档评论(0)