基于相关性分析的信息搜索方法研究与应用.pdfVIP

  • 4
  • 0
  • 约10.84万字
  • 约 64页
  • 2020-09-09 发布于江苏
  • 举报

基于相关性分析的信息搜索方法研究与应用.pdf

重庆大学硕士学位论文 中文摘要 摘 要 信息搜索方法的作用是在信息系统里快速准确地查找到用户需要和关心的信 息数据,提升搜索的效率和质量。近年来互联网(Internet)技术的高速发展带动着信 息系统的数据处理能力跃迁,加快了系统更新迭代的步伐。如春雨医生、去哪儿 网、天猫等各大类型的信息系统为了争夺用户的数量和访问流量,向用户提供了 海量的数据信息,丰富了用户的选择,也造成了“信息过载”现象,干扰了用户 筛选信息的过程,影响了系统的体验感受。面对“信息过载”问题,帮助用户排 除无关信息的干扰,快速准确地定位到感兴趣的结果,信息搜索方法的研究与应 用具有重要的价值和意义。本文主要从以下三个方面探讨信息搜索方法的研究应 用: 首先是用户的兴趣偏好模型的构建。本文采用LM-BP 神经网络算法训练用户 偏好模型,根据用户和项目的特征建立特征属性矩阵,并对矩阵进行降维处理, 再利用LM-BP 算法进行训练,构建用户—项目评分矩阵,对没有评分的项目进行 预测。完成用户偏好模型的建立。经过实验,能够准确地反映用户的兴趣偏好。 其次是搜索推荐算法的选取和实现。传统的协同过滤算法的存在稀疏性、“冷 启动”以及可扩展性三个方面的问题。①面对稀疏性问题的不足,本文采用非目 标用户类型区分理论判断用户的推荐能力。描述了基于领域最近邻理论的未评分 值填补方法以实现稀疏性问题的缓解。②面对“冷启动”问题则通过 web 日志收 集网络访问序列,并阐释了通过计算网络访问序列的相似性,以搜寻新用户的最 近邻集合的方法。③面对可扩展性问题,阐述了一种适应用户兴趣变化的协同过 滤增量更新机制,该机制具有较好的性能。④最后本文利用基于灰色关联聚类的 协同过滤算法,通过计算用户之间的相似度,通过加权平均得出新用户的偏好模 型。 最后本文通过实际搭建搜索平台的方式进行搜索方法的效果验证。 本课题面向信息系统展开叙述,选取电商系统这一典型的信息系统作为讨论 和验证的大背景,主要依托满集网电商平台提供的实验数据支撑和实验条件支持, 利用其提供的数据样本进行训练和测试。经过测试,可以在用户搜索时展示个性 化的搜索列表,信息搜索方法达到了预期的效果。 关键词:信息系统;搜索方法;用户偏好模型;协同过滤;LM-BP 算法 I 重庆大学硕士学位论文 英文摘要 Abstract The function of information search method is to find the information data that users need and care about quickly and accurately in the information system and improve the efficiency and quality of search. In recent years, the rapid development of Internet technology drives the leap of data processing capability of information system and accelerates the pace of system update and iteration. For example, chunyu doctor, qunar, Tmall and other major information systems provide users with massive data information in order to compete for the number and access flow of users, which e

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档