基于特征向量的个性化推荐算法研究-计算机软件与理论专业论文.docxVIP

  • 10
  • 0
  • 约5.33万字
  • 约 56页
  • 2019-03-30 发布于上海
  • 举报

基于特征向量的个性化推荐算法研究-计算机软件与理论专业论文.docx

重庆大学硕士学位论文中文摘要 重庆大学硕士学位论文 中文摘要 I I 摘 要 电子商务个性化推荐系统随着 Web2.0 技术的迅猛发展得到了广泛的关注和普 及,为用户在日益增长的海量信息中发现自己所需要的信息提供了一种有效方法。 电子商务网站使用电子商务推荐系统为用户提供个性化服务,模拟销售人员帮助 用户进行购买。 电子商务个性化推荐系统通过建立用户与信息之间的二元关系,利用相似性 从海量信息库中挖掘目标用户可能感兴趣的对象,其本质是信息过滤,在理论和 实践中都得到了很大发展,已有多种推荐算法提出并得到应用,包括基于人口统 计学的推荐、基于内容的推荐、协同过滤推荐以及由不同的推荐方法组合而成的 混合推荐,其中协同过滤是最成功和得到最广泛应用的推荐方法。随着电子商务 规模的不断扩大,协同过滤方法遇到了一些挑战:数据稀疏性、可扩展性、冷开 始问题等。本文对协同过滤推荐算法进行了深入的研究,提出了一种基于特征向 量的协同过滤推荐算法,论文的主要研究工作及成果如下: ①观察用户评分规律,研究已有评分一致性方法的优势和不足,提出了一种 改进的评分一致性方法,能够有效解决用户打分尺度不一致的问题。 ②传统相似度度量方法直接在整个评分矩阵上度量对象之间的相似度,其精 确度受到矩阵稀疏性的很大影响,也没有考虑产品特征,因而推荐质量不够理想, 实时性也较差,本文提出的基于特征向量的推荐算法使用统计分析技术扫描评分 矩阵和产品特征得到用户和产品的配置文件,配置文件保存特征向量,并在此基 础上计算相似度,降低了计算复杂度,改善了数据的稀疏性,提高了推荐质量。 ③对传统推荐流程进行了分析,找出不足并对其进行改进。优化了部分步骤, 减少了不必要的计算,进一步提高了推荐的实时性。算法分为初始化、离线更新、 在线三个阶段执行,初始化阶段创建用户和产品的配置文件并计算相互之间的相 似度;离线更新阶段使用不同的更新频率来更新用户与最近邻用户和全部其它用 户的相似度;在线阶段使用改进的推荐算法,不必扫描所有的产品即可向用户产 生推荐,在用户新产生对产品的评分时,增量更新配置文件。 ④实现了上述算法,利用 Movielens 数据集,首先分析和比较了 Cosine、 Pearson、Off-Cosine 相似度计算方法的推荐准确度,然后针对本文提出的改进算法 和传统算法进行了多个对比实验,实验表明:算法在推荐准确度和实时性上达到 了较好效果。 关键字:推荐系统,协同过滤方法,数据挖掘,相似性 重庆大学硕士学位论文英文摘要 重庆大学硕士学位论文 英文摘要 II II ABSTRACT With the rapid development of Web 2.0 application, the e-commerce personalized recommendation system has attracted wide attention and has been used widely. It is also the effective way for customers to the needed information from the increasing tremendous information. By the use of e-commerce personalized recommendation system, e-commerce websites offer personalized service and simulate the behavior of shopkeeper to help customer finish the process of buying. The e-commerce personalized recommendation system analyses the correlation between users and information, make use of the similarity to find the users’ interesting in mining of the plenty of information sets. The essence of recommendation system is filtering. There have been several kinds of recommendation algorithm proposed and adopted, which include population statistic data based, content-based, collaborative filtering, and hybrid method

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档