- 18
- 0
- 约3.5千字
- 约 61页
- 2020-12-11 发布于浙江
- 举报
数据检查——用户选择 用户年龄取值范围:9岁—41岁 用户年龄占比分布 年龄 占比 年龄 占比 年龄 占比 年龄 占比 6 0.07% 16 0.89% 26 6.20% 36 0.77% 7 0.06% 17 1.53% 27 5.18% 37 0.73% 8 0.05% 18 2.56% 28 4.90% 38 0.62% 9 0.06% 19 4.45% 29 3.36% 39 0.56% 10 0.12% 20 7.37% 30 2.89% 40 0.68% 11 0.10% 21 9.19% 31 2.16% 41 0.41% 12 0.10% 22 9.59% 32 1.78% 42 0.36% 13 0.21% 23 10.69% 33 1.33% 43 0.21% 14 0.34% 24 9.52% 34 0.99% 44 0.17% 15 0.55% 25 7.26% 35 0.93% 45 0.16% 16岁—34岁 占比合计: 91.83% 用户画像数据挖掘实例演示 对应分析 聚类分析 用户画像方法 ——“对应分析”实例演示 对应分析数据格式整理 特征 只看过 只关注XX 关注实物未购买 购买并付款 男性 48 36 28 10 女性 52 64 72 90 学生 67 65 63 22 非学生 33 35 37 78 工作 25 26 28 61 其他职业 8 9 9 17 14岁以下 15 14 18 - 15-18岁 45 41 38 2 19-22岁 27 26 23 23 23-25岁 8 11 11 23 26-30岁 3 5 6 13 31岁以上 2 4 4 5 有网购AA经验 27 33 35 100 无网购AA经验 73 67 65 - 无网购 73 67 65 - 网购50元以下 6 5 5 9 50-100元 10 13 14 24 100-200元 7 10 11 24 200元以上 4 5 5 5 喜欢XX会买实物 25 29 37 31 不会喜欢XX会买实物 36 31 21 15 说不清喜欢XX会买实物 39 40 41 18 加权个案 对应分析过程 对应分析——定义行范围(用户类别) 对应分析——定义列范围(用户特征) 对应分析结果图 减少用户特征 用户画像方法 ——“聚类分析”实例演示 人群划分 内部资料, 请勿外传 内部资料, 请勿外传 内部资料, 请勿外传 统计学基础 集中量:求和、平均数、中位数、众数、 差异量:全距、标准差、方差、最小值、最大值、标准误 分布:正态分布、峰度系数、偏度系数、正偏态、负偏态、高狭峰、低阔峰、离散变量、连续变量 目 录 用户画像概述 用户画像概述 一、群体用户定量描述统计 群体定量分类统计——各类用户性别构成 群体定量分类统计——各类XX用户年龄构成 群体定量分类统计——各类XX用户年龄构成 年 龄 0-10岁 11-15岁 16-18岁 19-22岁 23-25岁 26-30岁 31-40岁 40岁 CC频道 4% 4% 5% 20% 22% 24% 16% 6% XX频道 6% 4% 5% 19% 19% 23% 17% 8% AA成交 1% 1% 5% 30% 27% 22% 10% 3% XX成交 1% 1% 6% 32% 25% 21% 10% 3% XX活跃用户 5% 7% 11% 28% 16% 16% 12% 5% XX登录用户 3% 7% 11% 31% 19% 16% 9% 4% AA 2% 8% 15% 32% 17% 15% 8% 3% XX 4% 11% 15% 31% 15% 12% 9% 3% BB 2% 9% 17% 35% 17% 12% 6% 2% XX商城用户 4% 16% 16% 27% 13% 11% 9% 4% AA 2% 14% 20% 33% 14% 9% 5% 2% AA 5% 11% 17% 40% 15% 8% 3% 2
原创力文档

文档评论(0)