大数据中的用户画像 光环大数据培训机构.pdfVIP

大数据中的用户画像 光环大数据培训机构.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
光环大数据--大数据培训人工智能培训 大数据中的用户画像 光环大数据培训机构 用户画像的含义用户画像(persona)的概念最早由交互设计之父 Alan Cooper 提出:“Personas are a concrete representation of target users.” 是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。随着 互联网的发展,现在我们说的用户画像又包含了新的内涵 ——通常用户画像是 根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出 的一个标签化的用户模型。构建用户画像的核心工作,主要是 利用存储在服务 器上的海量日志和数据库里的大量数据进行分析和挖掘 ,给用户贴“标签”,而 “标签”是能表示用户某一维度特征的标识。具体的标签形式可以参考下图某网 站给其中一个用户打的标签。 用户画像的作用 提取用户画像,需要处理海量的日志,花费大量时间和人力。尽管是如 此高成本的事情,大部分公司还是希望能给自己的用户做一份足够精准的用户画 像。 那么用户画像有什么作用,能帮助我们达到哪些目标呢? 大体上可以总结为以下几个方面: 1. 精准营销 :精准直邮、短信、App 消息推送、个性化广告等。 2. 用户研究 :指导产品优化,甚至做到产品功能的私人定制等。 3. 个性服务 :个性化推荐、个性化搜索等。 光环大数据 光环大数据--大数据培训人工智能培训 4. 业务决策 :排名统计、地域分析、行业趋势、竞品分析等。 用户画像的内容 用户画像包含的内容并不完全固定,根据行业和产品的不同所关注的特 征也有不同。对于大部分互联网公司,用户画像都会包含人口属性和行为特征。 人口属性主要指用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、 生育情况、工作所在的行业和职业等。行为特征主要包含活跃度、忠诚度等指标。 除了以上较通用的特征,不同类型的网站提取的用户画像各有侧重点。 ·以内容为主的媒体或阅读类网站,还有搜索引擎或通用导航类网站, 往往会 提取用户对浏览内容的兴趣特征 ,比如体育类、娱乐类、美食类、理财 类、旅游类、房产类、汽车类等等。 ·社交网站的用户画像,也会提取用户的 社交网络 ,从中可以发现 关系紧密的用户群和在社群中起到意见领袖作用的明星节点。 ·电商购物网站的用户画像,一般会提取用户的 网购兴趣和消费能力 等指标。网购兴趣主要指用户在网购时的类目偏好,比如服饰类、箱包类、居家 类、母婴类、洗护类、饮食类等。 ·消费能力指用户的 购买力 ,如果做得足够细致,可以把用户的实 际消费水平和在每个类目的心理消费水平区分开,分别建立特征纬度。 另外还可以加上用户的 环境属性 ,比如当前时间、访问地点LBS 特征、 当地天气、节假日情况等。 光环大数据 光环大数据--大数据培训人工智能培训 当然,对于特定的网站或App,肯定又有特殊关注的用户纬度,就需要 把这些维度做到更加细化,从而能给用户提供更精准的个性化服务和内容。 用户画像的生产 用户特征的提取即用户画像的生产过程,大致可以分为以下几步: 1. 用户建模 ,指确定提取的用户特征维度,和需要使用到的数据源。 2. 数据收集 ,通过数据收集工具,如Flume 或自己写的脚本程序,把 需要使用的数据统一存放到hadoop 集群。 3. 数据清理 ,数据清理的过程通常位于Hadoop 集群,也有可能与数 据收集同时进行,这一步的主要工作,是把收集到各种来源、杂乱无章的数据进 行字段提取,得到关注的目标特征。 4. 模型训练 ,有些特征

文档评论(0)

00625 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档