- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
光环大数据--大数据培训人工智能培训
大数据中的用户画像 光环大数据培训机构
用户画像的含义用户画像(persona)的概念最早由交互设计之父 Alan
Cooper 提出:“Personas are a concrete representation of target users.”
是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。随着
互联网的发展,现在我们说的用户画像又包含了新的内涵 ——通常用户画像是
根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出
的一个标签化的用户模型。构建用户画像的核心工作,主要是 利用存储在服务
器上的海量日志和数据库里的大量数据进行分析和挖掘 ,给用户贴“标签”,而
“标签”是能表示用户某一维度特征的标识。具体的标签形式可以参考下图某网
站给其中一个用户打的标签。
用户画像的作用
提取用户画像,需要处理海量的日志,花费大量时间和人力。尽管是如
此高成本的事情,大部分公司还是希望能给自己的用户做一份足够精准的用户画
像。
那么用户画像有什么作用,能帮助我们达到哪些目标呢?
大体上可以总结为以下几个方面:
1. 精准营销 :精准直邮、短信、App 消息推送、个性化广告等。
2. 用户研究 :指导产品优化,甚至做到产品功能的私人定制等。
3. 个性服务 :个性化推荐、个性化搜索等。
光环大数据
光环大数据--大数据培训人工智能培训
4. 业务决策 :排名统计、地域分析、行业趋势、竞品分析等。
用户画像的内容
用户画像包含的内容并不完全固定,根据行业和产品的不同所关注的特
征也有不同。对于大部分互联网公司,用户画像都会包含人口属性和行为特征。
人口属性主要指用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、
生育情况、工作所在的行业和职业等。行为特征主要包含活跃度、忠诚度等指标。
除了以上较通用的特征,不同类型的网站提取的用户画像各有侧重点。
·以内容为主的媒体或阅读类网站,还有搜索引擎或通用导航类网站,
往往会 提取用户对浏览内容的兴趣特征 ,比如体育类、娱乐类、美食类、理财
类、旅游类、房产类、汽车类等等。
·社交网站的用户画像,也会提取用户的 社交网络 ,从中可以发现
关系紧密的用户群和在社群中起到意见领袖作用的明星节点。
·电商购物网站的用户画像,一般会提取用户的 网购兴趣和消费能力
等指标。网购兴趣主要指用户在网购时的类目偏好,比如服饰类、箱包类、居家
类、母婴类、洗护类、饮食类等。
·消费能力指用户的 购买力 ,如果做得足够细致,可以把用户的实
际消费水平和在每个类目的心理消费水平区分开,分别建立特征纬度。
另外还可以加上用户的 环境属性 ,比如当前时间、访问地点LBS 特征、
当地天气、节假日情况等。
光环大数据
光环大数据--大数据培训人工智能培训
当然,对于特定的网站或App,肯定又有特殊关注的用户纬度,就需要
把这些维度做到更加细化,从而能给用户提供更精准的个性化服务和内容。
用户画像的生产
用户特征的提取即用户画像的生产过程,大致可以分为以下几步:
1. 用户建模 ,指确定提取的用户特征维度,和需要使用到的数据源。
2. 数据收集 ,通过数据收集工具,如Flume 或自己写的脚本程序,把
需要使用的数据统一存放到hadoop 集群。
3. 数据清理 ,数据清理的过程通常位于Hadoop 集群,也有可能与数
据收集同时进行,这一步的主要工作,是把收集到各种来源、杂乱无章的数据进
行字段提取,得到关注的目标特征。
4. 模型训练 ,有些特征
您可能关注的文档
最近下载
- 人教版数学五年级上册教学计划及进度表.doc VIP
- 昆山通海中学小升初考试试卷.docx VIP
- 交警基本法律知识.pptx VIP
- 2025下半年湖南省国际工程咨询集团有限公司社会招聘34人笔试模拟试题及答案解析.docx VIP
- 2025年海南三亚市天涯区教育系统招聘幼儿园编制教师16人(第1号)笔试历年典型考题(历年真题考点)解题思路附带答案详解(5套).docx
- 旅游美学——第三章-审美心理.pptx VIP
- 《永冻土地区场道工程技术》课程教学大纲模板课程教学大纲.doc VIP
- 考研英语单词表汇总(5500).doc VIP
- 2025下半年湖南省国际工程咨询集团有限公司社会招聘34人笔试备考题库及答案解析.docx VIP
- 人教版(2024)七年级美术上册第二单元第2课《科技之光》精品课件.pptx VIP
文档评论(0)