网站大量收购独家精品文档,联系QQ:2885784924

[数据挖掘]用户画像.pdfVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

[数数据据挖挖掘掘]⽤⽤户户画画像像

1.⽤⽤户户画画像像是是什什么么

⽤户画像(UserProfile),作为⼤数据的根基,它完美地抽象出⼀个⽤户的信息貌,为进⼀步精准、快速地分析⽤户⾏为习惯、消费习惯

等重要信息,提供了⾜够的数据基础,奠定了⼤数据时代的基⽯。

男,31岁,已婚,收⼊1万以上,爱美⾷,团购达⼈,喜欢红酒配⾹烟。这样⼀串描述即为⽤户画像的典型案例。如果⽤⼀句话来描述,

即:⽤户信息标签化。

⽤户画像,即⽤户信息标签化,就是企业通过收集与分析消费者社会属性、⽣活习惯、消费⾏为等主要信息的数据之后,完美地抽象出⼀个

⽤户的商业貌作是企业应⽤⼤数据技术的基本⽅式。⽤户画像为企业提供了⾜够的信息基础,能够帮助企业快速找到精准⽤户群体以及⽤

户需求等更为⼴泛的反馈信息。

⽤户画像有很多的的标签组成,每个标签都规定了观察、认识、描述⽤户的⾓度。标签根据企业业务的发展情况,或多或少,对外⽽⾔都是

⼀个整体,这个整体称之为⽤户画像。

2.为为什什么么需需要要⽤⽤户户画画像像

⽤户画像的核⼼⼯作是为⽤户打标签,打标签的重要⽬的之⼀是为了让⼈能够理解并且⽅便计算机处理,如,可以做分类统计:喜欢红酒的

⽤户有多少?喜欢红酒的⼈群中,男、⼥⽐例是多少?

也可以做数据挖掘⼯作:利⽤关联规则计算,喜欢红酒的⼈通常喜欢什么运动品牌?利⽤聚类算法分析,喜欢红酒的⼈年龄段分布情况?

⼤数据处理,离不开计算机的运算,标签提供了⼀种便捷的⽅式,使得计算机能够程序化处理与⼈相关的信息,甚⾄通过算法、模型能

够“理解”⼈。当计算机具备这样的能⼒后,⽆论是搜索引擎、推荐引擎、⼴告投放等各种应⽤领域,都将能进⼀步提升精准度,提⾼信息获

取的效率。

⽤户画像本质就是从业务⾓度出发对⽤户进⾏分析,了解⽤户需求,寻找⽬标客户。另外⼀个⽅⾯就是,⾦融企业利⽤统计的信息,开发出

适合⽬标客户的产品。

提到⽤户画像,很多⼚商都会提到360度⽤户画像,其实经常360度客户画像是⼀个⼴告宣传⽤语,根本不存数据可以⾯描述客户,透彻

了解客户。⼈是⾮常复杂的动物,信息纬度⾮常复杂,仅仅依靠外部信息来刻画客户内⼼需要根本不可能。

⽤户画像⼀词具有很重的场景因素,不同企业对于⽤户画像有着不同对理解和需求。举个例⼦,⾦融⾏业和汽车⾏业对于⽤户画像需求的信

息完不⼀样,信息纬度也不同,对画像结果要求也不同。每个⾏业都有⼀套适合⾃⼰⾏业的⽤户画像⽅法,但是其核⼼都是为客户服务,

为业务场景服务。

3.⽤⽤户户画画像像怎怎么么设设计计

⼀个标签通常是⼈为规定的⾼度精炼的特征标识。

如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,⼈能很⽅便地理解每个标签含义。这也使得⽤户画像模型

具备实际意义。能够较好的满⾜业务需求。

如,判断⽤户偏好。短⽂本,每个标签通常只表⽰⼀种含义,标签本⾝⽆需再做过多⽂本分析等预处理⼯作,这为利⽤机器提取标准化信息

提供了便利。

⼈制定标签规则,并能够通过标签快速读出其中的信息,机器⽅便做标签提取、聚合分析。所以,⽤户画像,即:⽤户标签,向我们展⽰了

⼀种朴素、简洁的⽅法⽤于描述⽤户信息。

3.1数数据据源源分分析析

构建⽤户画像是为了还原⽤户信息,因此数据来源于:所有⽤户相关的数据。

对于⽤户相关数据的分类,引⼊⼀种重要的分类思想:封闭性的分类⽅式。如,世界上分为两种⼈,⼀种是学英语的⼈,⼀种是不学英语的

⼈;客户分三类,⾼价值客户,中价值客户,低价值客户;产品⽣命周期分为,投⼊期、成长期、成熟期、衰退期…所有的⼦分类将构成了

类⽬空间的部集合。

这样的分类⽅式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担⼼架构上对每⼀层分类没有考虑完整,造成维度遗漏留下扩展性

隐患。另外,不同的分类⽅式根据应⽤场景,业务需求的不同,也许各有道理,按需划分即可。

本⽂将⽤户数据划分为静态信息数据、动态信息数据两⼤类。

3.1.1静静态态信信息息数数据据

⽤户相对稳定的信息,如图所⽰,主要包括⼈⼝属性、商业属性等⽅⾯数据。这类信息,⾃成标签,如果企业有真实信息则⽆需过多建模预

测,更多的是数据清洗⼯作,因此这⽅⾯信息的数据建模不是本篇⽂章重点。

3.2.2动动态态信信息息数数据据

⽤户不断变化的⾏为信息,如果存在上帝,每⼀个⼈的⾏为都在时刻被上帝那双⽆形的眼睛监控着,⼴义上讲,⼀个⽤户打开⽹页,买了⼀

个杯⼦;与该⽤户傍晚溜了趟狗,⽩天取了⼀次钱,打了⼀个哈⽋等等⼀样都是上帝眼中的⽤户⾏为。当⾏为集中到互联⽹,乃⾄电商,⽤

户⾏为就会聚焦很多,如上图所⽰:浏览凡客⾸页、浏

文档评论(0)

131****2653 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档