大众点评POI与评论推荐-毕业论文 .pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

文档均为word文档,下载后可直接编辑使用亦可打印

摘要

随着互联网和移动通信迅猛发展,电子商务强势崛起,越来越多的人倾向于网上

消费。如何从海量的互联网数据中筛选出用户感兴趣的信息成为了全球互联网用户潜

在的问题,推荐系统(RecommendationSystem)技术通过搜索大量动态生成的信息来为

用户提供个性化的内容和服务来解决这个问题。

推荐系统作为一种信息过滤方式,试图预测用户的偏好兴趣和对物品的评价。近

年来,频繁活跃的互联网用户在消费信息的同时也产出了海量的原创内容。本文的主

要研究工作是深度挖掘用户原创的评论内容,分析出用户和物品的特征,进而进行评

分预测。

评论(Comment)指人对于事物做出的客观叙述,反映了人的主观感受。基于用户

的文本评论数据,本文的主要研究工作如下:

首先,从互联网上采集包含有用户、物品和用户文本评论的数据。该数据集来源

于大众点评网。然后对评论文本进行分词,用词向量对其进行数学表达,形成主题词

的分布表。

最后,基于用户文本用评论主题词进行评分预测,通过线性回归模型和改进的协

同过滤算法预测评分,最终的实验结果表明,预测的评分客观准确,同时组合的预测

算法效果更优。

关键词:推荐系统;用户评论;线性回归;评分预测

Abstract

riseofe-commerce,moreandmorepeopletendtospendonline.Howtofilterthe

throughlargevolumeofdynamicallygeneratedinformationtoprovideuserswith

personalizedcontentandservices.

predicttheuserspreferenceforinterestandtheevaluationoftheitem.Inrecentyears,

whileconsuminginformation.Themainresearchworkofthispaperistodeeplymineuser-

scorepredictions.

mainresearchworkofthispaperisasfollows:

mathematicallyexpressedbythewordvector.Thenthetextofthecommentissegmented

word.

topredictthescores.Thefinalexperimentalresultsshowthatthepredictedscoresare

Keywords:RecommendationSystem;Users’Comment;LinearRegression;Rating

Forecast

前言

进入互联网时代后,技术发展日新月异,人类获取信息的数量也急剧增长,从匮

乏到当前的过载,信息的获取信息的方式也逐渐多样化。互联网是当代信息的重要载

体,日常活动呈现数字化趋势,形形色色的数据充斥在互联网的网页上,不管是信息

的生产者还是消费者,都面临信息处理的难题。对消费者来说,不借助工具在海量的

数据中发掘出自己需要的信息于个人来说几乎不可能,对生产信息的企业和商家来说,

如何把产出的信息加工分类,把用户感兴趣的信息推送到用户面前也是巨大的挑战。

推荐系统则可以解决上述的难题,它不仅可以帮助用户过滤不感兴趣的无关信息,而

且能发掘出用户潜在的可能喜欢的信息。因此,推荐系统在数据挖掘领域具有重要的

研究价值。

推荐系统可以针对某个用户对某项物品进行模拟的评分预测。本文主要研究的就

是基于用户的文本评论进行深度分析,挖掘用户和物品特征,模拟出用户对物品的评

价。本文的主要工作和创新点如下所示:

(1)利用网络爬虫获取大众点评的餐饮服务数据,包含用户、物品和文本评论

数据。

(2)对中文文本评论进行分词处理。

(3)对分词后的文本利用word2vec工具构建成矩阵表达,通过相似度排序得

到主题词的分布表。

(4)基于评论的主题分布

文档评论(0)

zhaopu888 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档