- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
业务偏好计算 * (1)高资费人群:该类人群特征是绝大部分数值均大于平均值,即消费水平高于平均水平,特别是总费用是各类人群中最高的。 (2)标准用户群:该类人群特征是绝大部分数值与平均值持平或低于平均值。值得一提的是,虽然GPRS套餐费较高,但使用时能严格控制流量,使流量不超过标准套餐的额度,不产生额外的GPRS通信费。 (3)低资费人群:该类人群特征是通话时长、短信量、上网流量均低于平均水平,特别是总费用是各类人群中最低的。 (4)上网发烧友:该类人群特征是上网的流量和费用超高,同时通话等传统业务量少。 (5)上网一族:该类人群特征是上网流量经常超出GPRS套餐额度,导致GPRS通信费超高。与上网发烧友相比,通话等传统业务使用显得更活跃。 (6)理性上网群:该类人群特征是订阅GPRS套餐较为理性,套餐费高于平均值,属于喜爱上网的上群。同时,GPRS套餐外产生的额外费用几乎没有。 (7)商务人士:该类人群特征是套餐月租费、漫游通话费、无线上网流量在各类人群中最高,符合商务人士出差、经常无线上网的特点。 (8)通话达人:该类人群特征是语音业务套餐费显著高于其他各个用户群。另外,有了语音业务套餐,本地通话仍很频繁。 * 基于文本的内容过滤推荐模型 功能 根据用户访问过的项集的文本主题特征,向其推荐可能感兴趣的新内容 适用范围 业务产品、互联网内容资讯、广告等内容推荐,要求能够获得项集的文本特征描述 模型输入 有历史访问行为的目标用户u、该用户访问过的内容项(页面、文章、书籍)集合Iu及集合中元素的关键词描述、该用户未访问过的内容项集合RIu以及集合中元素的关键词描述 模型输出 目标用户u可能喜欢的内容项Top-N列表 出于效率考虑,用户数据分析平台以每个用户访问过的项集的文本特征分别建立该用户的Profile并按日更新,然后通过比对Profile和推荐候选项集的文本特征来实现内容过滤推荐。相比于传统算法,主要进行了如下改进: a.分层多粒度的标签体系。用户偏好特征按照大类-子类-关键词的方式进行组织,能够适应不同的营销场景需求。例如,进行手机阅读推荐时主要使用“阅读”类的标签,进行游戏推荐时主要使用“游戏”类的标签; b.潜在语义分析。解决不同语境下的多义词问题。 * 基于文本的内容过滤推荐模型 用户A 用户B 用户阅读的文章 雅虎重组自救,胜算几何? 正文…… 家用热销2012款新车行情调查 正文…… … … Profile数据 [IT/互联网:德克尔_0.227451] [汽车:经济型_0.160784] [IT/互联网:杨致远_0.454902] [汽车:省油_23.470320] [IT/互联网:总裁_0.5681205] [汽车:热销_0.176471] … … 推荐的文章 雅虎欲撤换杨致远 新一轮裁员不可避 雅虎董事会欲撤换杨致远 新一轮裁员 雅虎股票跌回2月初微软提出收购前价 新宝来现金优惠6000元 店内现车供应 低油耗对抗高油价 5款小排量增压车行情 六款配自动空调时尚小车推荐 示例 * 基于文本的内容过滤推荐模型 对于在某一特定文件里的词语 来说,它的重要性可表示为: 是该词在文件 中的出现次数,而分母则是在文件 中所有字词的出现次数之和。 逆向文件频率IDF则计算一个词语普遍重要性。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再对数得到。 则一个词语的权重为: 根据用户访问过的文件,用向量wc=(wc1,wc2,...,wck)来表示用户的偏好,其中每个分量wci表示关键词ki对用户c的重要性。而一个文件可以表示为:ws=(w1j,w2j,...,wkj)。则用户对该文件感兴趣的程度是: 介绍框架 * 用户群体 个体属性 (职业/性别/收入等) 社会属性 (家庭/团队等) 个体偏好 (阅读/视频/音乐等) 群体相似性 (协同/关联等) 用户个体属性判别模型 用户社交属性判别模型 用户的业务偏好分析应用模型 基于群体相似性的智能推荐模型 目录 * * 基于协同过滤的推荐模型 功能 根据用户之间在历史访问记录上的关联性,预测用户对于未访问项的偏好程度,并进行推荐 适用范围 业务产品、互联网内容资讯、广告等内容推荐,不需要内容的文本特征,只要有用户的历史访问、下载、评分等数据即可 模型输入 目标用户u、系统中所有用户访问过的内容项(页面、文章、书籍)集合I及对每个用户对集合中元素的访问权重(可以是访问频次、评分值或根据不同的用户行为类型指定一个相应权值) 模型输出 目标用户u可能喜欢的Top-N项列表 用户数据分析平台中提供了多种类型的协同过滤算法,主要包括: a.以用户为中心的算法。为目标用户构建与其偏好类似的近邻集合,向其推荐近邻里用户的喜好的项集; b.以I
原创力文档


文档评论(0)