- 23
- 0
- 约3.68千字
- 约 14页
- 2021-07-01 发布于北京
- 举报
用户画像手册
| 方 法 | 案 例 | 实 践
从用户标签指标体系设计-数据分析-数据开发-
ETL-打通服务层-画像产品化-数据赋能-业务提升, 打通全流程,提供端到端的解决方案
目录
画像简介(表结构设计/标签类型/数据架构)
数据指标体系
标签存储
标签开发
开发调优
ETL 调度
画像产品化
用户画像应用
画像简介
表结构设计
表结构设计的重点是要考虑存储哪些信息、如何存储(数据分区)、如何应用(如何抽取标签)这三方面问题。
不同业务背景有不同的设计方式,这里提供两种设计思路:① 每日全量数据的表结构;
② 每日增量数据的表结构。
Hive 需要对输入进行全盘扫描来满足查询条件,通过使用分区可以优化查询。对于用户标签这种日加工的数据,随着时间推移,分区数量的变动也是均匀的。
每日全量数据,即该表的日期分区中记录着截止到当天为止的全量用户数据。例如: select count(*) from userprofile where data=,这条语句查询的是userprofile 这个表截止到日为止全量用户数据。日全量数据的优势是方便查询,缺点是不便于探查更细粒度的用户行为。
每日增量数据,即该表的日期分区中记录着当日的用户行为数据,例如同样是 select count(*) from userprofile where data=,这条语句查询的是userprofile 这个表日记录的当日用户行为数据。日增量数据可视为 ODS 层的用户行为画像,在应用时还需要基于该增量数据做进一步的建模加工。
下面介绍日全量数据表结构设计
CREATE TABLE dw.userprofile_tag_userid ( tagid STRING COMMENT tagid, userid STRING COMMENT userid, tagweight STRING COMMENT tagweight, reserve STRING COMMENT 预留
CREATE TABLE dw.userprofile_tag_userid ( tagid STRING COMMENT tagid,
userid STRING COMMENT userid, tagweight STRING COMMENT tagweight, reserve STRING COMMENT 预留 )
PARTITIONED BY (data_date STRING COMMENT 数据日期 ,tagtype STRING COMMENT 标签主题分类)
这里 tagid 表示标签名称,userid 表示用户 id,tagweight 表示标签权重,reserve 表示
一个预留字段。分区方式为(日期+标签主题)分区,设置两个分区字段更便于开发和查询数据。该表结构下的标签权重仅考虑统计类型标签的权重,如:历史购买金额标签对应的权重为金额数量,用户近 30 日访问天数为对应的天数,该权重值的计算未考虑较为复杂的用户行为次数、行为类型、行为距今时间等复杂情况。
标签类型
从对用户打标签的方式来看,一般分为三种类型:1、统计类的标签;2、规则类的标签、
3、机器学习挖掘类的标签。下面我们介绍这三种类型标签的区别:
统计类的标签:这类标签是最为基础也最为常见的标签类型,例如对于某个用户来说,他的性别、年龄、城市、星座、近 7 日活跃时长、近 7 日活跃天数、近 7 日活跃次数等字段可以从用户注册数据、用户访问、消费类数据中统计得出。该类标签构成了用户画像的基础;
规则类的标签:该类标签基于用户行为及确定的规则产生。例如对平台上“消费活跃”用户这一口径的定义为近 30 天交易次数=2。在实际开发画像的过程中,由于运营人员对业务更为熟悉、而数据人员对数据的结构、分布、特征更为熟悉,因此
规则类标签的规则确定由运营人员和数据人员共同协商确定;
机器学习挖掘类的标签:该类标签通过机器学习挖掘产生,应用在对用户的某些属性或某些行为进行预测判断。例如根据一个用户的行为习惯判断该用户是男性还是女性,根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。
在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,开发中占有较大比例。机器学习挖掘类标签多用于预测场景,在开发所占比例较小。
数据架构
数据指标体系
用户属性维度
常见用户属性指标包括:用户的年龄、性别安装时间、注册状态、城市、省份、活跃登陆地、历史购买状态、历史购买金额等。用户属性维度的标签建成后可以为客服电话服务、运营人员了解用户基本情况提供帮助
标签名称
标签主题
一级归类
标签
您可能关注的文档
- 【用户积分运营】一篇文章学会如何建立会员积分体系(二):从0到1建立积分体系_市场营销策划_私域流量.docx
- 【私域流量】商业贸易行业:海外巡礼之Shopify,私域流量变现的“卖铲人”_市场营销策划_私域流量.docx
- 【用户积分运营】如何通过积分运营来达到用户运营的效果?_市场营销策划_私域流量运营攻略_用户积分系统.docx
- 【私域流量】互联网医院迎来拐点,信息化需求进一步提升_市场营销策划_私域流量运营攻略_私域流量行业报.docx
- 【用户积分运营】5种不同视角下的“积分激励体系”_市场营销策划_私域流量运营攻略_用户积分系统运营_.docx
- 【用户积分运营】交互设计思路:积分模块改版总结_市场营销策划_私域流量运营攻略_用户积分系统运营_d.docx
- 【用户积分运营】拼多多:为何不做会员成长体系和积分体系?_市场营销策划_私域流量运营攻略_用户积分系.docx
- 【运营】5-爆红IP打造的三大法宝_市场营销策划_私域流量运营攻略_私域流量运营_ppt可编辑版.pptx
- 【用户积分运营】3个机制,落实产品内PBL游戏化策略_市场营销策划_私域流量运营攻略_用户积分系统运.docx
- 【双微策划】2020年微信视频号企业运营指南_市场营销策划_双微专题策划案_ppt可编辑版.pptx
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
原创力文档

文档评论(0)