可拓展的移动互联网内容偏好分析体系.ppt

可拓展的移动互联网内容偏好分析体系.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
可拓展的移动互联网内容偏好分析体系

* CMGD-GZ LIUYAQI CMGD-GZ LIUYAQI 中国移动科技创新成果推广材料 完成单位: 成果名称:可拓展的移动互联网内容偏好分析体系 成果研究类别:超前研究 省内评审结果: 成果专业类别:业务支撑 * 目录 项目的主要创新点 4. 实现方案 3. 现有技术 2. 项目背景 1. 社会和经济效益 5. 互联网内容的发展概述 个性化需求引领着移动互联网内容的发展 传统电信行为无法支撑互联网内容偏好的分析 移动互联网正在往内容形式发展,代表如阅读平台方面的苹果Ipad,传播平台方面的微博,前者改变了人们单一纸质的阅读方式,而手机阅读也随之应运而生;而后者则提供了一个随时随地分享身边新鲜事的途径,使共同兴趣爱好的网友能更容易分享信息。但在各种形式信息传播与阅读的背后,起着主导作用的必然是人们对内容的个性化需求。因此,分析用户的互联网内容偏好显得至关重要。 传统的电信行为以语音为主,即使是部分体现内容形式的数据业务,如短信、飞信、手机报纸等,都需要深入到信息主体进行文本关键字识别处理,才能分析出用户的具体内容偏好,这种方案对于广东近亿级的客户量基本上是不可行的。而本报告则创新地结合用户手机阅读、手机上网等分类内容的浏览行为信息构建一个可拓展的分析体系,全面识别和剖析用户的互联网内容偏好。 * 目录 项目的主要创新点 4. 实现方案 3. 现有技术 2. 项目背景 1. 社会和经济效益 5. 现有技术存在的问题与不足 内容分类识别技术要求较高且所需资源要求较高,不利于进行推广 现有技术建立在互联网平台架构上的内容偏好分析体系,需要设置爬虫服务器集群,分析服务器集群,搜索服务器集群,以定位内容的分类和客户的浏览行为。这种技术能够精准识别客户的具体偏好,但是成本较高,且文本识别技术复杂,因此无论从硬件或软件方面,都难以推广。 现有的体系只重点关注客户某一内容业务的内容偏好(主要是网页),但客户对于不同内容业务,如手机上网或手机阅读,客户对不同的内容分类存在着一定的关联强度,强关联的偏好可用来实现不同客户的不同内容业务的渗透推荐,解决新业务的用户拓展难题。 没有挖掘不同内容业务偏好的相关强度,未能实现内容业务的互相渗透 * 目录 项目的主要创新点 4. 实现方案 3. 现有技术 2. 项目背景 1. 社会和经济效益 5. 方案实现思路 手机阅读 手机上网 手机报纸 待拓展业务… 穿越 言情 健康 军事 都市 历史 娱乐 财经 网游 对内容进行分类剖析 积累客户互联网内容阅读数据 1 2 对内容分类进行偏好评分 3 用户 偏好1 偏好2 偏好3 A 言情 都市 娱乐 手机阅读 手机上网 手机报纸 … 对内容偏好进行关联协同过滤 4 穿越 都市 言情 历史 军事 政治 政治 网游 用户 推荐1 推荐2 推荐3 A 空姐那些事 美女公寓 新浪娱乐 提升存量客户 推荐同类业务 挖掘潜在客户 推荐跨类业务 根据关联偏好进行内容推荐 5 都市 对于每一个新增的、需要拓展的内容业务(如手机阅读),收集客户的阅读信息,如PV、章节、次数、天数、流量、消费等。 根据内容的性质,对客户浏览的内容进行分类,用于偏好评分。如手机阅读,则直接利用客户阅读图书分类的信息,如言情、玄幻等。 利用客户对各分类的阅读行为,综合评价客户对各内容分类的偏好程度。如手机阅读,借助熵值法,求出PV、章节等权重系数,对言情、玄幻等内容分类偏好进行综合打分。 客户对不同内容分类(同类或不同类业务)的偏好具有一定的关联强度。本方案根据客户的偏好综合评分,量化不同业务和内容的关联强度。 挖掘出关联强度较高的内容分类,可用来实现关联交叉销售。同类业务则提升存量客户的活跃度,对不同业务,特别是新业务,则实现潜在客户的拓展。 内容偏好分析体系架构 WAP网关日志数据 WEB网关日志数据 数据挖掘仓库数据 手机阅读基地数据 基础数据层 手机上网 手机阅读 业务拓展层 手机报纸 …. …. 言情 玄幻 内容分类层 星座 …. 体育 娱乐 频度 粘度 偏好评分层 额度 …. 言情 星座 偏好关联层 …. 玄幻 体育 都市 娱乐 客户 内容推荐层 …. 推荐1 手阅-该死的缘 推荐2 搜狐-娱乐新闻 推荐3 新浪-星座频道 营销活动层 …. WAP-PUSH 短信彩信-内容推送 形成闭环 逐层分析 移动梦网 业务拓展层工作原理 用户 内容偏好标签1 内容偏好标签2 内容偏好标签3 A 上网-星座 上网-娱乐 上网-影视 B 上网-言情 上网-都市 上网-娱乐 C 手阅-言情 手阅-青春 手阅-都市 D 手阅-言情 手阅-都市 手阅-青春 E … …. … 内容分类1 内容分类2 关联强度 关联用户数 上网-星座 手阅-言情 0.8 10000 上网-娱乐 手阅-言情 0.5 8

文档评论(0)

pangzilva + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档