深度学习在互联网企业的运用.docxVIP

  • 11
  • 0
  • 约9.57千字
  • 约 28页
  • 2021-08-11 发布于广东
  • 举报
深度学习在互联网企业的运用 美团点评作为国内最大的生活月艮务平台,业务种类涉及食、住、行、玩、乐等领域,致力于让大家吃 得更好,活得更好,有数亿用户以及丰富的用户行为。随着业务的飞速发展,美团点评的用户和商户 数在快速增长。在这样的背景下,通过对推荐算法的优化,可以更好的给用户提供感兴趣的内容,帮 用户更快速方便的找到所求。我们目标是根据用户的兴趣及行为,向用户推荐感兴趣的内容,打造一 个高精准性、高丰富度且让用户感到欣喜的推荐系统。为了达到这个目的,我们在不停的尝试将新的 算法、新的技术进引入到现有的框架中。 自2012年ImageNet大赛技惊四座后,深度学习已经成为近年来机器学习和人工智能领域 中关注度最高的技术。在深度学习岀现之前”人们借助SIFT、HOG等算法提取具有良好区 分性的特征,再结合SVM等机器学习算法进行图像识别。然而SIFT这类算法提取的特征是 有局限性的,导致当时比赛的最好结果的错误率也在26%以上。卷积神经网络(CNN)的首 次亮相就将错误率一下由26%降低到15% ,同年微软团队发布的论文中显示,通过深度学习 可以将ImageNet 2012资料集的错误率降到4.94%。 随后的几年,深度学习在多个应用领域者B取得了令人瞩目的进展,如语音识别、图像识别、 自然语言处理等。鉴于深度学习的潜力,各大互联网公司也纷纷投入资源开展科研与运用。 因为人们意识到,在大数据时代,更加复杂且强大的深度模型,能深刻揭示海量数据里所承 载的复杂而丰富的信息,并对未来或未知事件做更精准的预测。 美团点评作为一直致力于站在科技前沿的互联网公司,也在深度学习方面进行了一些探索, 其中在自然语言处理领域,我们将深度学习技术应用于文本分析、语义匹配、搜索引擎的排 序模型等;在计算机视觉领域,我们将其应用于文字识别、图像分类、图像质量排序等。本 文就是笔者所在团队,在借鉴了 Google在2016年提出的Wide Deep Learning的思想 上,基于自身业务的一些特点,在大众点评推荐系统上做出的一些思考和取得的实践经验。 点评推荐系统介绍 与大部分的推荐系统不同,美团点评的场景由于自身业务的多样性,使得我们很难准确捕获 用户的兴趣点或用户的实时意图。而且我们推荐的场景也会随着用户兴趣、地点、环境、时 间等变化而变化。点评推荐系统主要面临以下几点挑战: 业务形态多样性:除了推荐商户外,我们还根据不同的场景,进行实时判断,从而推出不同形态的业务,如团单、 酒店、景点、霸王餐等。 用户消费场景多样性:用户可以选择在家消费:外卖,到店消费:团单、闪惠,或者差旅消费:预定酒店等。 针对上述问题,我们定制了一套完善的推荐系统框架,包括基于机器学习的多选品召回与排 序策略’以及从海量大数据的离线计算到高并发在线服务的推荐引擎。推荐系统的策略主要 分为召回和排序两个过程z召回主要负责生成推荐的候选集,排序负责彳各多个算法策略的结 果进行个性化排序。 层:我们通过用户行为、场景等进行实时判断,通过多个召回策略召回不同候选集。再 对召回的候选集进行融合。候选集融合和过滤层有两个功能,—是提高推荐策略的覆盖度和 精度;另外还要承担一定的过滤职责,从产品、运营的角度制定一些人工规则,过滤掉不符 合条件的Item。下面是一些我们常用到的召回策略: ? User-Based协同过滤:找岀与当前User X最相似的N个User,并根据N个User对某Item的打分估计X对 该Item的打分。在相似度算法方面,我们采用了 Jaccard Similarity : sim^x, y)= sim^x, y)= rx A ry rx U ry rXy ry分别表示用户对Item集合的打分。 ? Model-Based协同过滤:用一组隐含因子来联系用户和商品。其中每个用户、每个商品都用一个向量来表示, 用户〃对商品/?的评价通过计算这两个向量的内积得到。算法的关键在于根据已知的用户对商品的行为数据来估计 用户和商品的隐因子向量。 Item-Based协同过滤:我们先用word2vec对每个Item取其隐含空间的向量,然后用Cosine Similarity计算 用户〃用过的每一个Item与未用过Item/之间的相似性。最后对Top N的结果进行召回。 Query-Based :是根据Query中包含的实时信息(如地理位置信息、WiFi到店、关键词搜索、导航搜索等)对 用户的意图进行抽象,从而触发的策略。 Location-Based :移动设备的位置是经常发生变化的,不同的地理位置反映了不同的用户场景,可以在具体的业 务中充分利用。在推荐的候选集召回中,我们也会根据用户的实时地理位置、工作地、居住地等地理位置触发相应 的策略。 排序层:每类召回策略都会召回一

文档评论(0)

1亿VIP精品文档

相关文档