基于协同过滤的个性化应用推荐方案.docVIP

下载本文档

4
0
约3.56千字
约 7页
2018-08-17 发布于湖北
举报
版权申诉

基于协同过滤的个性化应用推荐方案.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于协同过滤的个性化应用推荐方案　　【摘要】本文借鉴互联网协同过滤算法，根据电信运营商实际状况，合理选取输入指标，探索“基于用户”和“基于物品”算法和用途的差异，将算法应用到手机应用个性化推荐中，应用效果提升明显，较好地符合互联网时代客户需求特征。　　【关键词】大数据协同过滤算法智能推荐互联网应用　　一、引言　　4G时代，用户流量规模及价值提升至关重要，河南移动公司一直致力于以客户需求为中心，以运营为导向的流量经营研究。积极践行传统电信服务转型中“数字内容和应用”的发展模式理念，通过应用个性化应用推荐的探索，逐步完善“数字内容及应用精益运营体系”的建设目标。　　传统的手机应用推荐没有深入识别真正有需求的客户，盲目下发营销推荐短信，客户转化率不足1%，造成资源的浪费且降低了客户满意度。本课题将重点解决根据用户消费行为快速、准确找到手机应用潜在目标用户的问题，通过引入互联网协同过滤算法，预先计算相似度，从而迅速对推荐要求做出响应，满足真正有需求的客户，避免客户骚扰，提升客户转化率，驱动流量增长。　　二、实施思路　　2.1 实施方法　　手机应用个性化推荐的核心技术是根据用户的兴趣特点和购买行为，向用户推荐用户感兴趣的物品或信息。基于协同过滤的推荐机制是利用集体智慧的典型方法，根据所有用户对物品或者信息的偏好，发现用户的相关性，或是发现物品或者信息本身的相关性，然后再基于这些关联性进行推荐。　　2.2 模型选型　　协同过滤（ Collaborative Filtering，简称 CF），一般是在海量的用户对物品或者信息偏好中，发掘出小部分和目标用户品味比较相似的用户成为邻居用户群，基于邻居历史偏好信息组织成一个排序的目录，为指定用户进行推荐。　　核心问题是：如何找到与目标用户相似品味的用户集合？如何找到具有相似属性的物品或信息？　　为了解决第一个问题“找到相似品味的用户”，采用基于用户的协同过滤推荐机制，在用户的历史偏好的数据上计算用户的相似度，基于相似用户的历史偏好信息，为当前用户进行推荐。　　针对第二个问题“找到具有相似属性的物品或信息”，采用基于物品的协同过滤推荐机制，使用所有用户对物品或者信息的偏好，发现物品和物品之间的相似度，然后根据用户的历史偏好信息，将类似的物品推荐给用户。　　三、实施方案　　协同过滤的核心步骤，主要包括如下三个步：1）收集用户偏好信息；2）找到相似的用户或物品；3）计算推荐。　　算法实现流程如图1。　　3.1 收集用户偏好　　用户偏好度定义：根据不同行为反映用户喜好的程度将它们进行加权，得到用户对于物品的总体喜好，按照系统现有数据，选取“日均使用频次”作为偏好评估指标。　　应用个性化推荐中，用户对某种应用的偏好度评价指标取“日均使用频次”。日均使用1次得1分，2次得2分，3次得3分，4次得4分，5次及以上得5分，生成评价结果清单。　　3.2找到相似的用户或物品　　1）相似度计算方法：　　计算基础：向量（Vector）　　计算结果：主要是计算两个向量的距离，距离越近相似度越大。　　应用思路：基于用户-物品偏好的二维矩阵。　　将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度；将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度。　　2）如何根据相似度找到“用户 ”或“ 物品”的邻居：　　（1）固定数量的邻居：不论邻居的“远近”，只取最近的 K 个，作为其邻居。　　（2）基于相似度门槛的邻居：以当前点为中心，距离为 K 的区域中的所有点都作为当前点的邻居，此方法得到的邻居个数不确定，但相似度不会出现较大的误差。　　3.3 计算推荐　　1）基于用户的协同过滤（User CF）　　计算思路：　　（1）建立向量：按照每个用户对所有物品的偏好得到一个向量；（2）计算用户相似度：通过向量间的计算得到用户之间的相似度；（3）找到相似邻居：通过计算方法，找到当前用户X的 K 邻居群体；（4）推荐清单：根据邻居的相似度权重及对物品的偏好，预测当前用户X无偏好记录或未购买的物品，计算得到一个排序的物品列表向当前用户X推荐。　　具体示例：对于用户 A，根据用户的历史偏好，这里只计算得到一个邻居 - 用户 C，然后将用户 C 喜欢的物品 D 推荐给用户 A。　　2）基于物品的协同过滤（Item CF）　　计算思路：　　（1）建立向量：将所有用户对某个物品的偏好作为元素建立该物品的向量（2）得到物品相似度：通过向量间的计算得到物品之间的相似度（3）找到相似物品：通过计算方法，找到某个物品的相似物品（4）推荐清单：根据每个用户历史的偏好，预测当前用户尚未表