- 14
- 0
- 约1.1万字
- 约 12页
- 2017-07-08 发布于湖北
- 举报
初识推荐机制、推荐引擎
随着互联网的发展 估计大多数的产品都会遇到推荐机制的策划 , 为互联网产品人员也需要研究一
下推荐机制的核心算法 ,这篇文章是我看到的言简意赅讲了一些基础的推荐机制的文章 ,转过来分
享给大家
信息发现
如今已经进入了一个数据爆炸的时代 ,随着 Web 2.0 的发展 , Web 已经变成数据分享的平台 ,
那么 ,如何让人们在海量的数据中想要找到他们需要的信息将变得越来越难。
在这样的情形下 ,搜索引擎 (Google ,Bing ,百度等等 )成为大家快速找到目标信息的最好途径。
在用户对自己需求相对明确的时候 ,用搜索引擎很方便的通过关键字搜索很快的找到自己需要的
信息。但搜索引擎并不能完全满足用户对信息发现的需求 ,那是因为在很多情况下 ,用户其实并不
明确自己的需要 ,或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人
口味和喜好的结果 ,因此出现了推荐系统 ,与搜索引擎对应 ,大家也习惯称它为推荐引擎。
随着推荐引擎的出现 ,用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人
们使用习惯的信息发现。
如今 ,随着推荐技术的不断发展 ,推荐引擎已经在电子商务 (E-co mmerce ,例如 A mazo n ,当当网
) 和一些基于 social 的社会化站点 ( 包括音乐 ,电影和图书分享 ,例如豆瓣 ,Mt ime 等 ) 都取得很大
的成功。这也进一步的说明了 ,Web2.0 环境下 ,在面对海量的数据 ,用户需要这种更加智能的 ,更
加了解他们需求 ,口味和喜好的信息发现机制。
推荐引擎
前面介绍了推荐引擎对于现在的 Web2.0 站点的重要意义 ,这一章我们将讲讲推荐引擎到底是怎么
工 的。推荐引擎利用特殊的信息过滤技术 ,将不同的物品或内容推荐给可能对它们感兴趣的用户
。
推荐引擎的分类
图 1 给出了推荐引擎的工 原理图 ,这里先将推荐引擎看 黑盒 ,它接受的输入是推荐的数据源 ,
一般情况下 ,推荐引擎所需要的数据源包括 :
要推荐物品或内容的元数据 ,例如关键字 ,基因描述等 ;
系统用户的基本信息 ,例如性别 ,年龄等
用户对物品或者信息的偏好 ,根据应用本身的不同 ,可能包括用户对物品的评分 ,用户查看物品
的记录 ,用户的购买记录等。其实这些用户的偏好信息可以分为两类 :
显式的用户反馈 :这类是用户在网站上自然浏览或者使用网站以外 ,显式的提供反馈信息 ,例如
用户对物品的评分 ,或者对物品的评论。
隐式的用户反馈 :这类是用户在使用网站是产生的数据 ,隐式的反应了用户对物品的喜好 ,例如
用户购买了某物品 ,用户查看了某物品的信息等等。
显式的用户反馈能准确的反应用户对物品的真实喜好 ,但需要用户付出额外的代价 ,而隐式的用户
行为 ,通过一些分析和处理 ,也能反映用户的喜好 ,只是数据不是很精确 ,有些行为的分析存在较
大的噪音。但只要选择正确的行为特征 ,隐式的用户反馈也能得到很好的效果 ,只是行为特征的选
择可能在不同的应用中有很大的不同 ,例如在电子商务的网站上 ,购买行为其实就是一个能很好表
现用户喜好的隐式反馈。
推荐引擎根据不同的推荐机制可能用到数据源中的一部分 ,然后根据这些数据 ,分析出一定的规则
或者直接对用户对其他物品的喜好进行预测计算。这样推荐引擎可以在用户进入的时候给他推荐他
可能感兴趣的物品。
推荐引擎
推荐引擎的分类可以根据很多指标 ,下面我们一一介绍一下 :
1. 推荐引擎是不是为不同的用户推荐不同的数据根据这个指标 ,推荐引擎可以分为基于大众行为的
推荐引擎和个性化推荐引擎
根据大众行为的推荐引擎 ,对每个用户都给出同样的推荐 ,这些推荐可以是静态的由系统管理员
人工设定的 ,或者基于系统所有用户的反馈统计计算出的当下比较流行的物品。
个性化推荐引擎 ,对不同的用户 ,根据他们的口味和喜好给出更加精确的推荐 ,这时 ,系统需要
了解需推荐内容和用户的特质 ,或者基于社会化网络 ,通过找到与当前用户相同喜好的用户 ,实现
推荐。
这是一个最基本的推荐引擎分类 ,其实大部分人们讨论的推荐引擎都是将个性化的推荐引擎 ,因为
从根本上说 ,只有个性化的推荐引擎才是更加智能的信息发现过程。
2. 根据推荐引擎的数据源其实这里讲的是如何发现数据的相关性 ,因为大部分推荐引擎的工 原理
还是基于物品或者用户的相似集进行推荐。那么参考图 1 给出的推荐系统原理图 ,根据不同的数据
源发现数据相关性的方法可以分为以下几种 :
根据系统用户的基本信息发现用户的相关程度 ,这
您可能关注的文档
- 有趣生物时钟.ppt
- 外墙吊板施工方案(副本).docx
- 第一章 保险股份有限公司保险代理协议模板.doc
- 第二章 201203班福师《计算机应用基础》在线作业一满分.doc
- 互联网革命和其未来.doc
- 吉大16春学期《计算机接口技术》在线作业二课件.doc
- 第七章 操作系统课程设计内存管理.doc
- 数据库邮件使用介绍.doc
- 南开大学16秋学期《办公自动化基础》在线作业要领.doc
- 《可视化计算》第1节RAPTOR程序设计基础(A).ppt
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
原创力文档

文档评论(0)