- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于ElasticSearch系统架构
一种基于ElasticSearch的推荐系统架构
摘要:该文在研究了推荐系统和搜索技术以后,提出了一种利用搜索引擎来进行数据召回的方式,首先采用关键词抽取算法对用户的历史记录进行概率分析,抽取出个性化的关键词并给到ElasticSearch搜索引擎进行候选集的召回,然后提出一种特征融合的方法对样本集进行了整合,最后利用机器学习算法对样本进行了训练并预测输出。与协同过滤和纯粹的基于内容的推荐系统进行对比,利用基于ElasticSearch的推荐系统架构将推荐系统的点击率提高到了17.5%。
关键词: 推荐系统; ElasticSearch; 机器学习; SVM; GBDT
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)36-0230-03
Abstract: Based on the research of the recommendation system and search technology, this paper puts forward a method of data to recall the use of search engines, the first probability analysis using keyword extraction algorithm to extract the user record, and personalized keywords to the ElasticSearch search engine recall candidate set, the sample sets for the integration method a fusion feature is then proposed, finally using machine learning algorithm to training samples and predictive output. Compared with collaborative filtering and pure content-based recommendation system, the recommendation rate of recommendation system is increased to 17.5% by using ElasticSearch based recommendation system architecture.
Key words: recommendation system; ElasticSearch; machine learning; SVM; GBDT
1 概述
21世纪以来,信息技术的不断发展和互联网规模的不断扩大,使得数据量有了指数级的增长,不同的用户在接受来自世界各地海量的数据,如何有效地将数据转化为信息,成为一个亟待解决的问题[1]。从用户的角度来看,用户更加想接收到对自己有用的信息,或者自己感兴趣的信息,而不是海量信息的集合;从信息提供者的角度来看,想提供一种对于不同用户展示不同信息的平台,而这个展示的信息是跟用户紧密联系的。在这种情况下,推荐系统应运而生[2]。推荐系统的产生主要完成以下的工作内容:将用户和信息紧密结合,对于不同的用户进行个性化的定制,通过分析特定用户的偏好,帮助用户从海量数据中筛选出用户偏好的信息,然后将这些个性化的信息呈现给用户。
推?]系统最核心的部分为推荐算法,本文首先研究了当前最流行的推荐算法,主要包括基于内容的推荐算法,基于协同过滤的推荐算法。其中还包括在模型建立过程中用到的数据降维方法,特征提取方法等。这些算法在不同的场景应用中都会有各自的优缺点,因此会有不同的适用范围。在用户使用有一定基础的情况下,基于物品的协同过滤算法在目前来说是一种比较稳定的通用推荐算法,它预测准确度较高,而且算法的解释性较高。
搜索技术是一项比较成熟的技术,它将因特网上的信息进行整合,对用户开放查询。搜索引擎主要工作原理分为三部分:从网络中搜集数据;将数据进行整理;接受用户的查询。搜索引擎有着快速返回搜索结果的优势,因此可以将搜索技术应用于实时推荐系统中。这样对于推荐系统的实时性和准确性都会有一定的提高。
本文对基于搜索技术的推荐系统关键技术进行研究,对于数据到推荐结果之间进行了搜索和推荐两步筛选,并对实时推荐系统提供了一种通用架构。在推荐算法的选用中,提供了一种将推荐问题转化为二分类问题的特征合并方法,与普通的基于协同过滤的算法相比较,解决了“冷启动”的问题,同时在算法内部隐含用户和物品聚类的数学依据,对于数据量大而用户量少的推荐场景提高了推荐准度,也解决了“冷启动
您可能关注的文档
最近下载
- 高中语文高考复习语言文字运用新题练习(共六大题,附参考答案和解析).pdf VIP
- 汽车式起重机吊装安全专项施工方案.pdf VIP
- 5eDnD_凡戴尔的失落矿坑_模组_中译(二校).pdf VIP
- 高考诗歌的比较鉴赏公开课省名师优质课赛课获奖课件市赛课一等奖课件.pptx VIP
- 甘肃省公路工程试验检测收费指导价格(最新).xls VIP
- 发生带状疱疹后神经痛的影响因素的logistic模型分析.pdf VIP
- 2023年建筑防火通用规范考试试题.pdf VIP
- 混凝土结构工程测试题(附参考答案).docx VIP
- 2025党校入党积极分子发展对象考试题库(含答案).docx VIP
- 1.党校入党积极分子发展对象培训考试题库含答案(完整版).pdf VIP
文档评论(0)