大数据后的用户画像.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据后的用户画像 主讲人:周涛 CATALOG 目录 01 02 03 What Why How 1 What 用户画像 01 What - Alan Cooper (交互设计之父)最早提出了persona 的概 念:“Personas are a concrete representation of target users.” - Persona 是真实用户的虚拟代表,是建立在一系列真实数据 (Marketing data,Usability data)而抽象出的一个标签化的用户模 型。 - 构建用户画像的核心工作即是给用户打“标签”,而标签是通 过对用户信息分析挖掘而来的高度精炼的特征标识。 2 Why 画像浅析 02 Why 算法 用户 行为 数据 标签 真实 有效 - 用户的属性和行为的可逆性越强, 个 群 数据的特征越明显,标签和用户属 体 体 性匹配的准确率越高。 匹配? 大数据 3 How 性别模型 03 How 性别模型:基于安装包列表推测用户的性别 安装列 行为 标签 表 1. 数据分析 - 行为 安装列表:验证数据的真实性 先验知识 - 安装列表 标签:验证数据的有效性 后验先验 03 How 2. 特征选取 2.1 one-hot特征:0-1向量 • 若有APP集合中有5个,分别为0, 1, 2, 3, 4 • 用户A安装了0,1,2,其one-hot特征为[1, 1, 1, 0, 0] • 用户B安装了0,4,5,其one-hot特征为[1, 0, 0, 1, 1] + 编码简洁,基准特征 - 维度过高 03 How 2. 特征选取 2.2 类别特征:app映射成类别 • 每个APP映射成类别集合中的一个或多个类型 + 加入先验知识,高度归纳package属性;降低维度 - 严重依赖先验知识,类别的选取较依赖标签 03 How 2. 特征选取 2.3 几率特征 * ( =| = ) = ( =| = ) + 后验;降低维度 - support低的package计算较为敏感 03 How 3. 模型构建 3.1 Logistic Regression * + 模型简单,计算量小,可解释性强

文档评论(0)

喜宝 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档