- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个性化推荐技术中的协同过滤算法研究
摘 要
随着网络与信息技术的飞速发展,互联网为用户提供越来越多的信息和服
务,用户在得到便利的同时也不得不面临大量的垃圾信息和无意义数据,即所谓
的信息超载问题。面对海量的网络资源,个性化推荐系统能够及时跟踪用户的需
求变化来自动调整信息服务的方式和内容,是一种极具潜力的解决信息超载的服
务技术。
协同过滤技术是目前推荐系统中最成功和应用最广泛的技术,在理论研究和
实践中都取得了快速的发展,它根据用户的历史选择信息和相似性关系,收集与
用户兴趣爱好相同的其他用户的评价信息来产生推荐。然而,传统的协同过滤算
法面临数据稀疏、用户相似性难以度量、实时性和可扩展性差等方面的挑战,影
响了推荐系统的质量。本文针对这些问题,对协同过滤算法进行了相应的改进,
主要工作如下:
1)针对传统相似性度量方法在用户数据稀疏和小邻居集下度量不准确问题,
提出了一种基于信息熵的相似性度量方法。该算法首先计算用户问评分的差异,
而后通过该差异的加权信息熵来衡量用户评分的相似程度;同时在计算用户相似
度时还考虑用户间共同关注圈的大小,用户关注圈交集越大,相似性权重越大。
实验结果表明,在数据稀疏程度不变的情况下,该相似性度量方法缓解了传统方
案在稀疏数据和小邻居集下的相似度度量不准确问题,提高了推荐的精度。
2)针对传统的协同过滤技术在产生推荐时只考虑用户.项目评分信息而易受
数据稀疏影响的问题,引入项目属性信息,提出了一种基于评分相似性和项目属
性相似性的混合协同过滤算法。首先,通过项目属性信息设计了一种基于项目属
性偏好的用户相似性度量方法,该方法符合用户间的真实关系,同时也能够有效
地缓解用户评分稀疏的问题。而后在衡量用户相似性时,综合考虑用户评分的相
似性和用户对项目属性偏好的相似性,并通过一个权值W来控制两者的重要程
度;实验结果表明,在不同稀疏程度的数据上,该算法获得了比传统相似性计算
方法更好的推荐精度,且数据越稀疏性能提升越明显。
3)针对基于内存的协同过滤算法在线计算量较大且可扩展性较低的缺点,
提出了一种基于SVD矩阵填充技术的K-means聚类协同过滤算法。传统的基于
聚类的协同过滤算法由于数据的高维稀疏往往预测精度非常低,因此,本算法首
先利用SVD降维策略提高数据密度,得到一个没有缺失值的评分矩阵,而后利
用K-means聚类在填充完整的数据上对用户进行聚类,从而对完成对测试集上
未知评分进行预测。该算法利用用户与项目之间的潜在关系克服了稀疏性问题,
同时保留了聚类方法实时性好、可扩展性强的优点。实验结果表明,相对于传统
获得了更好的预测性能,同时具有良好的可扩展性。
4)针对单个模型做协同过滤推荐时精度较低的问题,提出了一种改进的自
适应AdaBoot.RT集成学习算法,首先利用梯度下降法最小化用户评分的误差函
数来构造基类弱回归算法,而后利用一种改进的AdaBoost.RT集成学习方法进行
建模。在改进的AdaBoost.RT算法中,用一种带统计特性的偏差系数口来代替原
算法中的相对误差参数≯,口能够根据预测误差的情况进行自适应调整,从而使
样本权重的调整更加符合预测结果。实验结果表明,该集成学习算法能够显著地
提高单个模型的推荐精度。
关键字:个性化推荐,协同过滤,相似性度量,奇异值分解,聚类,集成学习
Ⅱ
ve I I i
ResearchonCoI l aborati Fi teri ngA thm
gor
i I
ofPersonal i zedRecommendatonTechno
ogy
Abstract
networkand
Withthe of
您可能关注的文档
- 高阶非线性椭圆方程特征值问题多重解.pdf
- 高空抛物致害救济途径及研究.pdf
- 高强度硼钢板热冲压成形过程数值模拟及研究.pdf
- 高水头充分扩散掺气射流下消力塘数值模拟.pdf
- 高速PCB信号反射串扰仿真分析.pdf
- 高速公路路基拓宽不均匀沉降数值分析.pdf
- 高速公路水泥混凝土路面加铺沥青层综合技术及研究.pdf
- 高速公路隧道智能控制技术及研究.pdf
- 高速铁路高架线路环境振动影响分析.pdf
- 高速铁路声屏障气动载荷数值模拟及研究.pdf
- 根癌农杆菌介导菜心(Brassica+campestris+L.+Subsp.+Chinensis+Makino+var.+parachinensis+Tsenet+Lee)遗传转化优化及研究.pdf
- 耕层调控和有机物料还田对土壤—小麦系统水、氮时空分布影响及研究.pdf
- 耕地易地补充价值补偿测算及研究.pdf
- 工作记忆广度和中央执行功能对大学生创造力影响.pdf
- 公共部门人力资源管理激励机制及研究.pdf
- 公共行政学范式厘清界定.pdf
- 公共领导者战略领导力及研究.pdf
- 公共图书馆开展政府信息公开服务策略及研究.pdf
- 公共政策制定中公民参问题及研究.pdf
- 公开课中教师表演质性及研究.pdf
最近下载
- 利用DEFORM-3D模拟镦粗锻造.doc VIP
- 08 威科夫进阶课程.pdf VIP
- CB 673-2020 出入舱口盖规范.pdf
- GA_T 1788.1-2021 公安视频图像信息系统安全技术要求 第1部分:通用要求.doc VIP
- 大体积混凝土监理实施细则.docx VIP
- (正式版)D-L∕T 343-2010 额定电压66kV~220kV交联聚乙烯绝缘电力电缆GIS终端安装规程.docx VIP
- 危险化学品安全管理与安全技术培训.ppt VIP
- GPS33E巨人通力调试说明书.pdf VIP
- 重大接待保障措施(环卫作业).doc VIP
- 危险物品安全航空运输技术细则(20201016014015).pdf VIP
文档评论(0)