- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从大众点评POI与评论推荐看推荐系统毕业设计如何写?什么是推荐系统?推荐系统算法,推荐系统存在的问题
摘 要:随着互联网和移动通信迅猛发展,电子商务强势崛起,越来越多的人倾向于网上消费。如何从海量的互联网数据中筛选出用户感兴趣的信息成为了全球互联网用户潜在的问题,推荐系统(Recommendation System)技术通过搜索大量动态生成的信息来为用户提供个性化的内容和服务来解决这个问题。 推荐系统作为一种信息过滤方式,试图预测用户的偏好兴趣和对物品的评价。近年来,频繁活跃的互联网用户在消费信息的同时也产出了海量的原创内容。本文的主要研究工作是深度挖掘用户原创的评论内容,分析出用户和物品的特征,进而进行评分预测。 评论(Comment)指人对于事物做出的客观叙述,反映了人的主观感受。基于用户的文本评论数据,本文的主要研究工作如下: 首先,从互联网上采集包含有用户、物品和用户文本评论的数据。该数据集来源于大众点评网。然后对评论文本进行分词,用词向量对其进行数学表达,形成主题词的分布表。 最后,基于用户文本用评论主题词进行评分预测,通过线性回归模型和改进的协同过滤算法预测评分,最终的实验结果表明,预测的评分客观准确,同时组合的预测算法效果更优。 关键词:推荐系统;用户评论;线性回归;评分预测 前 言 进入互联网时代后,技术发展日新月异,人类获取信息的数量也急剧增长,从匮乏到当前的过载,信息的获取信息的方式也逐渐多样化。互联网是当代信息的重要载体,日常活动呈现数字化趋势,形形色色的数据充斥在互联网的网页上,不管是信息的生产者还是消费者,都面临信息处理的难题。对消费者来说,不借助工具在海量的数据中发掘出自己需要的信息于个人来说几乎不可能,对生产信息的企业和商家来说,如何把产出的信息加工分类,把用户感兴趣的信息推送到用户面前也是巨大的挑战。推荐系统则可以解决上述的难题,它不仅可以帮助用户过滤不感兴趣的无关信息,而且能发掘出用户潜在的可能喜欢的信息。因此,推荐系统在数据挖掘领域具有重要的研究价值。 推荐系统可以针对某个用户对某项物品进行模拟的评分预测。本文主要研究的就是基于用户的文本评论进行深度分析,挖掘用户和物品特征,模拟出用户对物品的评价。本文的主要工作和创新点如下所示: (1) 利用网络爬虫获取大众点评的餐饮服务数据,包含用户、物品和文本评论数据。 (2) 对中文文本评论进行分词处理。 (3) 对分词后的文本利用word2vec工具构建成矩阵表达,通过相似度排序得到主题词的分布表。 (4) 基于评论的主题分布进行分析,利用线性回归模型训练参数。用训练后的模型模拟用户对物品的评分预测。 (5) 结合协同过滤算法提升(4)的评分预测的准确度。实验结果充分证明评分预测的准确度较高。 第1章 绪论 1.1 研究背景 近十多年来,互联网和Web技术迅猛发展,互联网信息呈现爆炸式增长,人类面临信息过载的挑战。一方面,为了从海量的数据中获取对用户而言有价值的信息,另一方面,为了把信息推广展示给对其有兴趣的用户,推荐系统应运而生。推荐系统致力于通过分析用户的行为向用户推荐一些物品。 随着电子商务的蓬勃发展,为了为精准获取用户购物反馈,许多电商都提供了针对消费过的商品进行评分和评论的功能。例如,用户在Yelp和Dianping上为他们购买的产品或他们收到的服务提供评论和数字评级。这些评论意见包含关于用户的意见和偏好的丰富信息,这对推荐系统可能是有价值的。但是,在传统方法中,推荐方法考虑的往往是数字评分,而评论意见却被忽略。因此,面向推荐系统的文本评论的深度挖掘的研究对于提升推荐个性化具有重要价值。 1.2 研究意义 在Web2.0时代,用户不仅是信息的消费者,更多的时候扮演的是生产者的角色,大量的用户在互联网上生产原创内容(User Generated Content, UGC)。增长迅速且形式越来越丰富的UGC数据为更加多维度和细粒度的分析刻画用户特征提供了可能。近年来,机器学习和文本的情感分析技术不断进步,对于用户产生的文本评论数据进行深度的分析成为了提高推荐系统准确性的重要研究方向。 不同于简单的数字评分,用户的文本评论中往往隐藏了用户想要表达的真实想法和情感,深入分析评论能发掘出用户的行为偏好和决策过程,基于此进行个性化推荐,不仅能够减轻用户筛选信息的负担,主动推送给用户能帮助用户更加便捷发现自己真正想要的物品,甚至能够发掘出潜在的意外惊喜。推荐给用户想要的商品,对商家来说,无疑会增加用户购买的概率,可能会显著增加销量。一些推荐系统可以将推荐理由展示给用户,可以大大增加用户对
原创力文档


文档评论(0)