协同过滤算法的应用于景点推荐的研究.docVIP

协同过滤算法的应用于景点推荐的研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
协同过滤算法的应用于景点推荐的研究

协同过滤算法的应用于景点推荐的研究   摘要:旅游电子商务与网络社交媒体发展导致旅游信息爆炸式增?L,用户面临信息过载问题。为使用户快速获取并甄别信息,将传统协同过滤推荐算法应用于景点推荐,游客对景点评分构成评分矩阵,计算景点之间相似度,根据相似景点评分预测游客对目标景点评分。实验结果显示,景点预测评分平均绝对误差为0.696,Itembased景点推荐算法能根据游客偏好推荐景点。   关键词关键词:协同过滤;个性化推荐;景点推荐;Itembased   DOIDOI:10.11907/rjdk.171818   中图分类号:TP319   文献标识码:A文章编号文章编号2017)011018603   0引言   随着国民经济发展,旅游业成为朝阳产业,各类旅游电商平台与旅游社交媒体应运而生,如携程、艺龙、去哪儿、旅人网、蚂蜂窝、穷游网等,这些旅游电子商务平台与社交媒体为游客提供机票与酒店预定服务、景点信息、旅游攻略与游记分享平台。网络查询已成为游客获取资讯的主要方式,游客规划旅游路线时,通常会在旅游电子商务平台与社交媒体上查阅景点信息、游客评分及点评。   游客能够快速在旅游电商平台与社交媒体获取景点信息,同时遭遇“信息过载”问题[1]。游客在网络上获得海量信息,相应需要花费额外时间查阅并甄别信息。这不仅增加了游客时间成本,还提高了线路规划难度。推荐系统作为解决信息过载、满足用户个性化需求的有效工具,已在淘宝、亚马逊等电商平台成功应用[2]。基于用户需求提供景点推荐的国内旅游电商平台与社交媒体为数不多[34]。推荐算法有多种,其中基于协同过滤的推荐算法在个性化系统中应用最广[5],如高明虎等[6]改进传统协同过滤算法解决冷启动问题,并应用于酒店推荐;娄小风[7]提出基于酒店多维度属性打分的协同过滤推荐算法提高了推荐准确度;王益[8]将协同推荐算法应用于旅游路线推荐。本文研究协同过滤算法在景点推荐中的应用,为游客提供个性化数据服务。   1协同过滤推荐算法概述   协同过滤推荐算法诞生最早,基本思路是如果用户过去物品偏好一致,将来偏好仍将一致[7]。算法通过挖掘用户历史行为数据发现用户偏好,以此为依据计算得到相似用户或物品并进行推荐。协同过滤推荐算法有2个重要分支:一个是基于用户的协同过滤算法,另一个是基于物品的协同过滤算法。Itembased算法得出的结果具有较好说服力,因此,本文将该算法应用于景点推荐[9]。   基于用户的协同过滤算法思路是根据用户物品偏好找到相似用户,然后将相似用户喜欢物品推荐给目标用户。基于物品的协同过滤算法思路类似基于用户协同过滤算法,通过计算不同物品相似关系,找到相似物品推荐给当前用户。   数字化描述用户物品偏好是协同过滤算法数据基础,用户物品偏好量化方法一般有2种形式:一种是量化成离散整数值,不同值代表偏好程度;一种是量化成布尔值0或1,代表喜欢或厌恶二值偏好。电子商务网站通常为用户提供对物品评分、投票及评论功能,评分值与票数代表了用户物品偏好程度。用自然语言处理方法处理用户评论,可得到用户情感取向,量化成布尔值0或1。用户对物品购买与否,也可量化成布尔值0或1。除电子商务网站外,社交媒体用户也用多种行为表达偏好,如自媒体订阅数、信息转发数、好友关注数,需要根据具体应用量化用户偏好。   3.2数据来源   实验数据源于“携程旅行网”,携程网向会员提供酒店、机票预订、旅游资讯、景点评分、攻略分享等线上旅行服务,网站会员超过1亿8千万。选择携程网作为数据源,可获取足够景点评分数据。   携程网旅游目的地攻略栏目中,游客分别从“景色”、“趣味性”、“性价比”3个指标对景点评分,分值区间为5(最高)至1(最低)。用网络爬虫采集海南省景点点评数据,原始数据按“景点名”+“用户名”+“景色评分”+“趣味性评分”+“性价比评分”项目保存。由于数据量非常大,只选择点评数10条以上景点进行编号处理,得到评分数据133 864条,含343个景点、32 587名游客。   3.3结果及分析   原始数据含“景色”、“趣味性”、“性价比”3个评分指标,测试选取“景色”评分作为数据项。为测试算法可行性,将数据分为2组,10万条数据为训练数据,余下33 864条为测试数据,相似景点个数K取10。实验结果为平均绝对误差MAE=0.696,表明Itembased景点推荐算法是可行的。   4结语   互联网“信息过载”现象日益突出,用户需花费大量时间查阅、筛选信息。本文将Itembased协同过滤算法应用于景点推荐,使游客能快速找到满足个性化需求的景点与旅游资讯。旅游社交媒体上,游客从多个指标对景点进行评分,并附加文字评论。开发推荐系统时,需要综合考虑各指标下评分

您可能关注的文档

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档