- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维度可扩展推荐引擎框架的设计与应用-软件工程专业论文
Classified Index: TP311.5 U.D.C.: 004.8
Dissertation for the Master’s Degree in Engineering
DESIGN AND APPLICATION ON THE SCALABLE MULTI-DIMENSIONAL RECOMMENDATION ENGINE FRAMEWORK
Candidate:
Liu Jing
Supervisor:
Professor Ma Peijun
Associate Supervisor:
Engineer Zhao Chenting
Academic Degree Applied for:
Master of Engineering
Speciality:
Software Engineering
Affiliation:
School of Software
Date of Defence:
June, 2013
Degree-Conferring-Institution:
Harbin Institute of Technology
哈尔滨工业大学工程硕士学位论文
哈尔滨工业大学工程硕士学位论文
-
- I -
摘 要
随着 Web 2.0、信息技术的发展与网络媒介例如平板电脑以及智能手机的普 及,人们已经从一个信息匮乏的时代迈向了信息呈爆炸式增长的时代,每天都会 有铺天盖地的信息涌现在网络、手机上。显然,我们已经进入了大数据时代。与 信息匮乏的时代相比,虽然选择多了,但是如何从信息的海洋中迅速定位有价值 和感兴趣的信息,对于信息消费者是一个不小的挑战;同时对于信息生产者,如 何把信息推送给合适的消费者,扩大信息辐射面,也是一件不简单的事情。为了 解决信息过载给信息生产者和信息消费者带来的困扰,个性化推荐系统应运而生。
推荐系统通过分析用户的历史行为数据建立起用户对信息偏好模型,从而将 用户与信息联系起来。推荐系统能够主动将信息推送给对其感兴趣的用户,这样 用户也能从推荐系统中得到感兴趣的信息,从而使信息消费者能够从信息的海洋 中迅速获取感兴趣的信息。
本课题的主要研究内容是实现一个支持多维度、灵活可扩展的推荐引擎框 架。根据推荐引擎的原理,推荐引擎包括推荐算法、相似度计算、推荐过滤三个 核心组件。本文的推荐算法选择在工业界和学术界广泛使用的协同过滤推荐算法; 相似度计算主要包括杰卡德相似度、余弦相似度、欧几里德距离相似度、皮尔逊 相似度四种算法,以适用于不同的应用场景;推荐过滤主要实现了用户行为过滤、 物品平均分过滤、地理位置过滤三种过滤方式以提高推荐系统在不同场景下的准 确性。本课题的多维度主要体现在简单的用户,物品,评分数据模型基础之上, 引入了时间序列与地理位置两个上下文维度,时间序列主要通过时间衰减函数来 平衡时间对相似度计算与兴趣度计算的影响;而地理位置主要通过计算物品之间 的距离来实现推荐结果过滤。
推荐引擎框架的实现基于简单易用的 Hadoop Map Reduce 分布式编程框架, 底层文件存储为 Hadoop 分布式文件系统。
本框架现已应用于航班预定系统,根据用户的历史预定酒店信息给其推荐感 兴趣的酒店。为了适应该系统的需求,增加了推荐结果解析,并将结果保存在数 据库中,以更友好的形式与航班预定系统集成。
关键词:分布式框架;推荐引擎;协同过滤;相似度计算;时间序列
-
- II -
Abstract
With the development of Web 2.0 , information technology and the ubiquitous network media like tablet PCs and smart phones, people have been from a lack information era towards the era of information explosion, in which there are overwhelming message sprang up on the network and phone every day. Obviously, we have entered the era of big data. Compared with the era lack of information, although there are more choices, it is a great challenge for the information consumers to locate the valuable and interesting information quickly from the informat
您可能关注的文档
- 多机器人协作技术的研究-机械制造及其自动化专业论文.docx
- 多机器人探索环境下的分布式地图融合研究-软件工程专业论文.docx
- 多机器人烟羽跟踪算法实验研究-检测技术与自动化装置专业论文.docx
- 多机器人系统中围捕策略的分析-控制理论与控制工程专业论文.docx
- 多机器人系统通信模块的设计与实现-软件工程专业论文.docx
- 多机器人群体系统的协调控制研究-控制理论与控制工程专业论文.docx
- 多机器人群集运动控制与避障分析-控制理论与控制工程专业论文.docx
- 多机器人路径规划与协同避碰研究-测试计量技术与仪器专业论文.docx
- 多机器人追捕问题的分析-计算机应用技术专业论文.docx
- 多机场进离场流量动态随机分配研究-交通运输规划与管理专业论文.docx
- 8 黄山奇石(第二课时)课件(共22张PPT).pptx
- 22《纸船和风筝》教学课件(共31张PPT).pptx
- 17 松鼠 课件(共23张PPT).pptx
- 23《海底世界》课件(共28张PPT).pptx
- 21《大自然的声音》课件(共18张PPT).pptx
- 第12课《词四首——江城子 密州出猎》课件 2025—2026学年统编版语文九年级下册.pptx
- 第2课《济南的冬天》课件(共42张PPT) 2024—2025学年统编版语文七年级上册.pptx
- 17 跳水 第二课时 课件(共18张PPT).pptx
- 第六单元课外古诗词诵读《过松源晨炊漆公、约客》课件 统编版语文七年级下册.pptx
- 统编版六年级语文上册 22《文言文二则》课件(共27张PPT).pptx
最近下载
- QlikView专业版培训教程精品.pdf VIP
- 部编版2025秋六年级上册语文1.27《我的伯父鲁迅先生》 课件.pptx VIP
- 生物专业英语第三版蒋悟生编__课文翻译试卷.doc VIP
- NB∕T 20485-2018RK 核电厂应急柴油发电机组设计和试验要求.pdf
- 读《地球的红飘带》有感.pptx VIP
- 建筑与市政地基基础通用规范试卷含答案.docx
- 班级管理(第3版)张作岭课后习题答案.docx VIP
- 2026年中国互联网体育服务市场深度评估与发展机遇预测报告.docx
- 党课讲稿、深刻把握“信念是本,作风是形”的时代内涵与实践要求.docx VIP
- 学堂在线 日语与日本文化 期末考试答案.docx VIP
原创力文档


文档评论(0)