基于主题模型的餐馆推荐算法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于主题模型的餐馆推荐算法 摘 要:现如今推荐系统可见之于人们的生活中的方方面面。无论是阅读、购物、电影还是音乐,都能看到个性化推荐的影子。而随着互联网+的提出和发展,互联网+餐饮服务也渐渐成为一个热门的服务领域。将推荐系统应用于餐馆推荐也因此成为推荐系统的一个热门的应用方向。餐馆推荐,简单来说就是要根据用户的历史到访记录,分析和预测用户可能喜欢的餐馆,并向用户做推荐,以此来帮助用户在各色各样的餐馆中找到自己喜欢的餐馆。 经典的推荐算法,比如说协同过滤算法,完全可以用于进行餐馆推荐,而且也应该能取得不错的效果。但是本文并没有采用经典的推荐算法,而是提出了一种基于主题模型的专门用于餐馆推荐的算法。该算法综合考虑了用户的评论和位置信息,能够根据用户的历史评论记录和到访记录对用户进行餐馆推荐。由于主题模型能够将餐馆数据映射到低维的主题空间,因而能够挖掘餐馆之间的隐含联系,同时在一定程度上也能够缓解数据稀疏的问题。此外,主题的词分布还能为推荐提供良好的解释。最后,经过设计实验将模型应用于Yelp数据集做推荐,证实了本文中所设计的推荐算法的有效性。 除此之外,为了方便展示,本文还设计实现了一个推荐展示系统。该系统实现了一个完整的前后台数据交互的过程,能够在前端页面上为相应的用户展示其推荐结果信息。该系统使用Servlet作为后台程序,采用经典的Ajax技术实现前端页面与服务器的数据交互,并调用了百度地图API用于将餐馆的位置数据在地图上可视化。 关键词:推荐系统;主题模型;LDA;餐馆推荐 前 言 从Web 1.0到Web 2.0,甚至是到以后的Web 3.0,互联网行业的正以人们意想不到的速度蓬勃发展着。这期间,整个IT互联网行业已经发生了天翻地覆的变化,而它也同时给人们的生活带来了日新月异的改变。然而,凡事皆有利弊。由于互联网的飞速发展,在人们享受其所带来的便利的同时,也需要应付其带来一些不良的副产物。信息过载就是这些副产物的其中之一。 信息过载简单来说就是人们或系统需要处理的信息已经超出了其所能承受的范围。如今,信息量正呈几何级数增长,而这些信息中真正有价值的却不多,甚至还有可能充斥着大量的虚假、冗余信息。而这大大增加了挖掘有价值信息的成本。 推荐系统就是一种可以用来应对信息过载问题的工具和策略。推荐系统只关注用户感兴趣的数据,因而可以过滤掉大量无关的数据,这正好迎合了人们从海量数据中获取有价值的信息的需求。特别是随着人工智能的发展,在推荐算法领域新加入的机器学习算法使得推荐系统越来越人性化,推荐质量也变得越来越高。 第1章 绪 论 1.1 研究背景及意义 当今时代科技飞速发展,特别是随着计算机和IT互联网行业的发展,信息量正呈爆炸式的增长。一方面人们享受着信息技术发展所带来的便利,另一方面又在被信息爆炸所困扰着。如何从海量信息中挖掘有价值的信息,以及如何剔除大量的垃圾信息成了亟待解决的事情。此外,人们在做决策时往往需要数据来做支撑,大量鱼龙混杂的虚假信息严重干扰了支撑数据的可靠性。人们发现在信息越多的情况下做决策反而越难了。正如哲言所云,少即是多。人们需要的是精简的、可靠的、完整的数据,而不是庞杂的、错误的、缺失的数据。针对上述问题,推荐系统(Recommender System)应运而生。 现有的推荐技术已经有很多,其在现实生活中的应用也是随处可见。但无论哪一种推荐技术,其要解决的根本问题无非就是分类问题,即将用户眼前的信息分为用户感兴趣的和用户不感兴趣的信息两类。分类的方法虽然多种多样,但最重要的是分类的标准和类别。传统的分类过程需要人为地给出分类的标准和分类的类别。而人工分类的过程既昂贵又容易出错。时常会出现分类界限不清晰,分类标准模棱两可等问题。主题模型(Topic Model)就是一种用于挖掘文本中潜在主题的模型。可以用于解决上述问题。 将推荐系统应用于餐馆推荐已经不是什么新鲜事了,像国内的美团、大众点评网站都在其网站上设有相应的推荐板块。传统的搜索引擎可以帮助用户查找特定需求下的餐馆信息,但推荐系统可以更进一步地挖掘用户的潜在需求。很多情况下用户无法表达自己的明确需求,这时候就是推荐引擎派上用场的时候了。 在考虑选择哪一种推荐算法的时候,首先想到的就是应用最广泛的协同过滤算法。但是协同过滤算法虽然简单高效,但是它却不能有效利用用户的评论信息。考虑到这一点,本次实验利用LDA(Latent Dirichlet Allocation)主题模型对用户评论数据进行建模,找出用户的潜在主题分类,然后再据此对用户进行餐馆推荐。经评估,该系统在保证较好的推荐准确度的同时,也在一定程度上解决了数据稀疏等问题。 1.

文档评论(0)

潇湘画里 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档