- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
文档均为word文档,下载后可直接编辑使用亦可打印
摘要
随着互联网和移动通信迅猛发展,电子商务强势崛起,越来越多的人倾向于网上
消费。如何从海量的互联网数据中筛选出用户感兴趣的信息成为了全球互联网用户潜
在的问题,推荐系统(RecommendationSystem)技术通过搜索大量动态生成的信息来为
用户提供个性化的内容和服务来解决这个问题。
推荐系统作为一种信息过滤方式,试图预测用户的偏好兴趣和对物品的评价。近
年来,频繁活跃的互联网用户在消费信息的同时也产出了海量的原创内容。本文的主
要研究工作是深度挖掘用户原创的评论内容,分析出用户和物品的特征,进而进行评
分预测。
评论(Comment)指人对于事物做出的客观叙述,反映了人的主观感受。基于用户
的文本评论数据,本文的主要研究工作如下:
首先,从互联网上采集包含有用户、物品和用户文本评论的数据。该数据集来源
于大众点评网。然后对评论文本进行分词,用词向量对其进行数学表达,形成主题词
的分布表。
最后,基于用户文本用评论主题词进行评分预测,通过线性回归模型和改进的协
同过滤算法预测评分,最终的实验结果表明,预测的评分客观准确,同时组合的预测
算法效果更优。
关键词:推荐系统;用户评论;线性回归;评分预测
Abstract
riseofe-commerce,moreandmorepeopletendtospendonline.Howtofilterthe
throughlargevolumeofdynamicallygeneratedinformationtoprovideuserswith
personalizedcontentandservices.
predicttheuserspreferenceforinterestandtheevaluationoftheitem.Inrecentyears,
whileconsuminginformation.Themainresearchworkofthispaperistodeeplymineuser-
scorepredictions.
mainresearchworkofthispaperisasfollows:
mathematicallyexpressedbythewordvector.Thenthetextofthecommentissegmented
word.
topredictthescores.Thefinalexperimentalresultsshowthatthepredictedscoresare
Keywords:RecommendationSystem;Users’Comment;LinearRegression;Rating
Forecast
前言
进入互联网时代后,技术发展日新月异,人类获取信息的数量也急剧增长,从匮
乏到当前的过载,信息的获取信息的方式也逐渐多样化。互联网是当代信息的重要载
体,日常活动呈现数字化趋势,形形色色的数据充斥在互联网的网页上,不管是信息
的生产者还是消费者,都面临信息处理的难题。对消费者来说,不借助工具在海量的
数据中发掘出自己需要的信息于个人来说几乎不可能,对生产信息的企业和商家来说,
如何把产出的信息加工分类,把用户感兴趣的信息推送到用户面前也是巨大的挑战。
推荐系统则可以解决上述的难题,它不仅可以帮助用户过滤不感兴趣的无关信息,而
且能发掘出用户潜在的可能喜欢的信息。因此,推荐系统在数据挖掘领域具有重要的
研究价值。
推荐系统可以针对某个用户对某项物品进行模拟的评分预测。本文主要研究的就
是基于用户的文本评论进行深度分析,挖掘用户和物品特征,模拟出用户对物品的评
价。本文的主要工作和创新点如下所示:
(1)利用网络爬虫获取大众点评的餐饮服务数据,包含用户、物品和文本评论
数据。
(2)对中文文本评论进行分词处理。
(3)对分词后的文本利用word2vec工具构建成矩阵表达,通过相似度排序得
到主题词的分布表。
(4)基于评论的主题分布
您可能关注的文档
- 大数据应用调研具体案例 .pdf
- 大数据应用开发的一般流程、各环节的工作任务和关键技术 .pdf
- 大数据在现代物流中的应用 .pdf
- 大数据在市场营销中的应用 .pdf
- 大数据分析在物流领域中的应用 .pdf
- 大数据云方案 .pdf
- 大宗商品贸易行业发展趋势及风险分析 .pdf
- 大宗商品现货投资 .pdf
- 大宗商品交易平台方案 .pdf
- 基于顾客满意的智能快递柜尺寸配比优化及收益分配研究 .pdf
- 实验室危废随意倾倒查处规范.ppt
- 实验室危废废液处理设施规范.ppt
- 实验室危废处置应急管理规范.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第20课时 中国的地理差异.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第21课时 北方地区.ppt
- 危险废物处置人员防护培训办法.ppt
- 危险废物处置隐患排查技术指南.ppt
- 2026部编版小学数学二年级下册期末综合学业能力测试试卷(3套含答案解析).docx
- 危险废物处置违法案例分析汇编.ppt
- 2026部编版小学数学一年级下册期末综合学业能力测试试卷3套精选(含答案解析).docx
最近下载
- 米油调料副食品配送投标方案技术标.docx
- 工艺部门三年工作规划.pptx
- QC成果-提高外墙保温装饰一体板一次施工合格率.docx VIP
- 中国心房颤动管理指南(2025版)解读ppt课件.pptx VIP
- 风电安全文明施工策划.docx
- 管理英语1-国家开放大学电大机考网考题目答案 .pdf VIP
- TS16949:2016中文版(标准-高清).pdf VIP
- 炎德·英才大联考长沙市一中2026届高三月考(五)地理试卷(含答案详解).pdf
- QC成果提高外墙保温装饰一体板一次施工合格率.docx VIP
- 高中英语(新人教版)选择性必修三同步习题:UNIT 1 Part 3(同步习题)【含答案及解析】.pdf VIP
原创力文档


文档评论(0)