指南奇异值分解协同过滤
奇异值分解协同过滤指南-----Chih-Chao Ma
计算机科学,国立台湾大学,台北,台湾系
摘要
作为电子商务市场爆炸性的增长,它是重要的,以提供用于各种消费者定制的建议。协同过滤是模型和分析的偏好的客户,并给出适当的建议的一项重要技术。奇异值分解(SVD)是用于协同作业共同过
此外误差测量,形成和分布的函数矩阵的可能也影响了算法的评估。例如,如果分数在A的随机从所有现有的成绩采样在数据库中,一个谁的用户提供了更多的分数,在数据库中往往有更多的分数在A。
测试数据生成的一个很好的例子是Netflix的奖[贝内特和兰宁, 2007] ,这是一个盛大的竞赛协同过滤的人们如何喜欢或不喜欢的电影。用于Netflix的奖该数据库包含了超过100
百万分数480 , 189用户和17 , 770电影。 Netflix的测试数据奖,看不见的竞争者,从每个的最新分数选取用户。更确切地说,他们选择所作的最新比分固定数量的每一个用户,而不管分数由用户给出的总数。然后,这些最新分数的集合被随机分为三组,命名为探头,测验和测试集。探针组的地面真值的分数被给予竞争对手以及在数据库中的其他较旧的分数。竞争对手然后要求预测测验和测试集的分数。通常,竞争者使用训练数据的一部分来测试他们的算法在脱机模式。验证数据集从整个训练数据划分是必要的。
产生这些集,以便验证和测试数据有一个西米 - 拉尔分布。由于测试数
原创力文档

文档评论(0)