多维度可扩展推荐引擎框架的设计与应用-软件工程专业论文.docxVIP

多维度可扩展推荐引擎框架的设计与应用-软件工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维度可扩展推荐引擎框架的设计与应用-软件工程专业论文

Classified Index: TP311.5 U.D.C.: 004.8 Dissertation for the Master’s Degree in Engineering DESIGN AND APPLICATION ON THE SCALABLE MULTI-DIMENSIONAL RECOMMENDATION ENGINE FRAMEWORK Candidate: Liu Jing Supervisor: Professor Ma Peijun Associate Supervisor: Engineer Zhao Chenting Academic Degree Applied for: Master of Engineering Speciality: Software Engineering Affiliation: School of Software Date of Defence: June, 2013 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工程硕士学位论文 哈尔滨工业大学工程硕士学位论文 - - I - 摘 要 随着 Web 2.0、信息技术的发展与网络媒介例如平板电脑以及智能手机的普 及,人们已经从一个信息匮乏的时代迈向了信息呈爆炸式增长的时代,每天都会 有铺天盖地的信息涌现在网络、手机上。显然,我们已经进入了大数据时代。与 信息匮乏的时代相比,虽然选择多了,但是如何从信息的海洋中迅速定位有价值 和感兴趣的信息,对于信息消费者是一个不小的挑战;同时对于信息生产者,如 何把信息推送给合适的消费者,扩大信息辐射面,也是一件不简单的事情。为了 解决信息过载给信息生产者和信息消费者带来的困扰,个性化推荐系统应运而生。 推荐系统通过分析用户的历史行为数据建立起用户对信息偏好模型,从而将 用户与信息联系起来。推荐系统能够主动将信息推送给对其感兴趣的用户,这样 用户也能从推荐系统中得到感兴趣的信息,从而使信息消费者能够从信息的海洋 中迅速获取感兴趣的信息。 本课题的主要研究内容是实现一个支持多维度、灵活可扩展的推荐引擎框 架。根据推荐引擎的原理,推荐引擎包括推荐算法、相似度计算、推荐过滤三个 核心组件。本文的推荐算法选择在工业界和学术界广泛使用的协同过滤推荐算法; 相似度计算主要包括杰卡德相似度、余弦相似度、欧几里德距离相似度、皮尔逊 相似度四种算法,以适用于不同的应用场景;推荐过滤主要实现了用户行为过滤、 物品平均分过滤、地理位置过滤三种过滤方式以提高推荐系统在不同场景下的准 确性。本课题的多维度主要体现在简单的用户,物品,评分数据模型基础之上, 引入了时间序列与地理位置两个上下文维度,时间序列主要通过时间衰减函数来 平衡时间对相似度计算与兴趣度计算的影响;而地理位置主要通过计算物品之间 的距离来实现推荐结果过滤。 推荐引擎框架的实现基于简单易用的 Hadoop Map Reduce 分布式编程框架, 底层文件存储为 Hadoop 分布式文件系统。 本框架现已应用于航班预定系统,根据用户的历史预定酒店信息给其推荐感 兴趣的酒店。为了适应该系统的需求,增加了推荐结果解析,并将结果保存在数 据库中,以更友好的形式与航班预定系统集成。 关键词:分布式框架;推荐引擎;协同过滤;相似度计算;时间序列 - - II - Abstract With the development of Web 2.0 , information technology and the ubiquitous network media like tablet PCs and smart phones, people have been from a lack information era towards the era of information explosion, in which there are overwhelming message sprang up on the network and phone every day. Obviously, we have entered the era of big data. Compared with the era lack of information, although there are more choices, it is a great challenge for the information consumers to locate the valuable and interesting information quickly from the informat

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档