- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
[数数据据挖挖掘掘]⽤⽤户户画画像像
1.⽤⽤户户画画像像是是什什么么
⽤户画像(UserProfile),作为⼤数据的根基,它完美地抽象出⼀个⽤户的信息貌,为进⼀步精准、快速地分析⽤户⾏为习惯、消费习惯
等重要信息,提供了⾜够的数据基础,奠定了⼤数据时代的基⽯。
男,31岁,已婚,收⼊1万以上,爱美⾷,团购达⼈,喜欢红酒配⾹烟。这样⼀串描述即为⽤户画像的典型案例。如果⽤⼀句话来描述,
即:⽤户信息标签化。
⽤户画像,即⽤户信息标签化,就是企业通过收集与分析消费者社会属性、⽣活习惯、消费⾏为等主要信息的数据之后,完美地抽象出⼀个
⽤户的商业貌作是企业应⽤⼤数据技术的基本⽅式。⽤户画像为企业提供了⾜够的信息基础,能够帮助企业快速找到精准⽤户群体以及⽤
户需求等更为⼴泛的反馈信息。
⽤户画像有很多的的标签组成,每个标签都规定了观察、认识、描述⽤户的⾓度。标签根据企业业务的发展情况,或多或少,对外⽽⾔都是
⼀个整体,这个整体称之为⽤户画像。
2.为为什什么么需需要要⽤⽤户户画画像像
⽤户画像的核⼼⼯作是为⽤户打标签,打标签的重要⽬的之⼀是为了让⼈能够理解并且⽅便计算机处理,如,可以做分类统计:喜欢红酒的
⽤户有多少?喜欢红酒的⼈群中,男、⼥⽐例是多少?
也可以做数据挖掘⼯作:利⽤关联规则计算,喜欢红酒的⼈通常喜欢什么运动品牌?利⽤聚类算法分析,喜欢红酒的⼈年龄段分布情况?
⼤数据处理,离不开计算机的运算,标签提供了⼀种便捷的⽅式,使得计算机能够程序化处理与⼈相关的信息,甚⾄通过算法、模型能
够“理解”⼈。当计算机具备这样的能⼒后,⽆论是搜索引擎、推荐引擎、⼴告投放等各种应⽤领域,都将能进⼀步提升精准度,提⾼信息获
取的效率。
⽤户画像本质就是从业务⾓度出发对⽤户进⾏分析,了解⽤户需求,寻找⽬标客户。另外⼀个⽅⾯就是,⾦融企业利⽤统计的信息,开发出
适合⽬标客户的产品。
提到⽤户画像,很多⼚商都会提到360度⽤户画像,其实经常360度客户画像是⼀个⼴告宣传⽤语,根本不存数据可以⾯描述客户,透彻
了解客户。⼈是⾮常复杂的动物,信息纬度⾮常复杂,仅仅依靠外部信息来刻画客户内⼼需要根本不可能。
⽤户画像⼀词具有很重的场景因素,不同企业对于⽤户画像有着不同对理解和需求。举个例⼦,⾦融⾏业和汽车⾏业对于⽤户画像需求的信
息完不⼀样,信息纬度也不同,对画像结果要求也不同。每个⾏业都有⼀套适合⾃⼰⾏业的⽤户画像⽅法,但是其核⼼都是为客户服务,
为业务场景服务。
3.⽤⽤户户画画像像怎怎么么设设计计
⼀个标签通常是⼈为规定的⾼度精炼的特征标识。
如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,⼈能很⽅便地理解每个标签含义。这也使得⽤户画像模型
具备实际意义。能够较好的满⾜业务需求。
如,判断⽤户偏好。短⽂本,每个标签通常只表⽰⼀种含义,标签本⾝⽆需再做过多⽂本分析等预处理⼯作,这为利⽤机器提取标准化信息
提供了便利。
⼈制定标签规则,并能够通过标签快速读出其中的信息,机器⽅便做标签提取、聚合分析。所以,⽤户画像,即:⽤户标签,向我们展⽰了
⼀种朴素、简洁的⽅法⽤于描述⽤户信息。
3.1数数据据源源分分析析
构建⽤户画像是为了还原⽤户信息,因此数据来源于:所有⽤户相关的数据。
对于⽤户相关数据的分类,引⼊⼀种重要的分类思想:封闭性的分类⽅式。如,世界上分为两种⼈,⼀种是学英语的⼈,⼀种是不学英语的
⼈;客户分三类,⾼价值客户,中价值客户,低价值客户;产品⽣命周期分为,投⼊期、成长期、成熟期、衰退期…所有的⼦分类将构成了
类⽬空间的部集合。
这样的分类⽅式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担⼼架构上对每⼀层分类没有考虑完整,造成维度遗漏留下扩展性
隐患。另外,不同的分类⽅式根据应⽤场景,业务需求的不同,也许各有道理,按需划分即可。
本⽂将⽤户数据划分为静态信息数据、动态信息数据两⼤类。
3.1.1静静态态信信息息数数据据
⽤户相对稳定的信息,如图所⽰,主要包括⼈⼝属性、商业属性等⽅⾯数据。这类信息,⾃成标签,如果企业有真实信息则⽆需过多建模预
测,更多的是数据清洗⼯作,因此这⽅⾯信息的数据建模不是本篇⽂章重点。
3.2.2动动态态信信息息数数据据
⽤户不断变化的⾏为信息,如果存在上帝,每⼀个⼈的⾏为都在时刻被上帝那双⽆形的眼睛监控着,⼴义上讲,⼀个⽤户打开⽹页,买了⼀
个杯⼦;与该⽤户傍晚溜了趟狗,⽩天取了⼀次钱,打了⼀个哈⽋等等⼀样都是上帝眼中的⽤户⾏为。当⾏为集中到互联⽹,乃⾄电商,⽤
户⾏为就会聚焦很多,如上图所⽰:浏览凡客⾸页、浏
您可能关注的文档
- 《大还是小》基于标准的教学设计.doc
- 《小兔子乖乖》教案(15篇).docx
- 《中华人民共和国反有组织犯罪法》主题班会.docx
- 《互联网诊疗管理办法(试行)》.docx
- 《人力资源共享服务职业技能》课程标准.docx
- SAPHO综合征的课件.pptx
- under-review催稿信的模板.docx
- 《夏洛特烦恼》完整版剧本(上).docx
- [精品]考古学概论期末复习提纲.doc
- 《分数除以整数》教学设计.doc
- 党员领导干部在理论学习中心组主题会议上的发言材料汇编(6篇).docx
- 2023年行政执法工作计划汇编(4篇).docx
- 国企领导干部学习董事长在新提任干部讲话精神心得汇编7篇.docx
- 学习《著作选读》第一卷、第二卷心得体会汇编(9篇).docx
- 关于切实做好国庆期间安全生产工作的通知汇编(5篇).docx
- 在2023年招商引资推介会上的推介词汇编(5篇).docx
- 医院年终工作总结汇编(共10篇)官方抖音号:笔尖耕耘.docx
- 2022年度镇和开发区书记抓基层党建工作述职报告汇编(7篇),提纲值得参考!1.docx
- 教育主题经验交流材料汇编(5篇).docx
- 在党内主题教育专题推进会议上的讲话汇编(3篇).docx
最近下载
- 药品生产质量管理规范.pdf VIP
- 2020浙gt49竹节桩图集.pptx VIP
- 日晖株式会社标准(JGC Standard) JGS 210-120-1-16E Data Preparation of Utility Summary.pdf VIP
- 食材配送售后服务方案(详细版).docx
- X射线源焦点尺寸的测试与对比分析.pdf
- 燃气基础知识考试备考题库(200题).docx
- 地理信息系统教程(第二版)全套PPT课件.pptx
- 肺心病【87页】(最新文档).pptx VIP
- 《剪映自媒体创作》课件——第四章 音乐与音效.pptx VIP
- 部编版四年级语文下册第四单元教材解读 教材分析 教学建议.pptx
文档评论(0)